基于代理的模拟:性能问题:Python vs NetLogo & Repast

12
我正在用Python 3复制Sugarscape代理模拟模型的一小部分。 我发现我的代码性能比NetLogo慢约3倍。 这可能是我的代码问题,还是Python本身的固有限制?显然,这只是代码的一部分,但这正是Python花费运行时间三分之二的地方。 我希望如果我写了一些非常低效的东西,它可能会在这个片段中显示出来:
UP = (0, -1)
RIGHT = (1, 0)
DOWN = (0, 1)
LEFT = (-1, 0)
all_directions = [UP, DOWN, RIGHT, LEFT]
# point is just a tuple (x, y)
def look_around(self):
    max_sugar_point = self.point
    max_sugar = self.world.sugar_map[self.point].level
    min_range = 0

    random.shuffle(self.all_directions)
    for r in range(1, self.vision+1):
        for d in self.all_directions:
            p = ((self.point[0] + r * d[0]) % self.world.surface.length,
                (self.point[1] + r * d[1]) % self.world.surface.height)
            if self.world.occupied(p): # checks if p is in a lookup table (dict)
                continue
            if self.world.sugar_map[p].level > max_sugar:
                max_sugar = self.world.sugar_map[p].level
                max_sugar_point = p
    if max_sugar_point is not self.point:
        self.move(max_sugar_point)

以下是大致相当的NetLogo代码(此片段比上面的Python函数多做了一些):

; -- The SugarScape growth and motion procedures. --
to M    ; Motion rule (page 25)
    locals [ps p v d]
    set ps (patches at-points neighborhood) with [count turtles-here = 0]
    if (count ps > 0) [
        set v psugar-of max-one-of ps [psugar]              ; v is max sugar w/in vision
        set ps ps with [psugar = v]                         ; ps is legal sites w/ v sugar
        set d distance min-one-of ps [distance myself]      ; d is min dist from me to ps agents
        set p random-one-of ps with [distance myself = d]   ; p is one of the min dist patches
        if (psugar >= v and includeMyPatch?) [set p patch-here]
        setxy pxcor-of p pycor-of p                         ; jump to p
        set sugar sugar + psugar-of p                       ; consume its sugar
        ask p [setpsugar 0]                                 ; .. setting its sugar to 0
    ]
    set sugar sugar - metabolism    ; eat sugar (metabolism)
    set age age + 1
end

在我的计算机上,Python代码运行1000步需要15.5秒;在同一台笔记本电脑上,Java内嵌于浏览器中的NetLogo模拟可以在不到6秒内完成1000步。

编辑:刚刚检查了使用Java实现的Repast。它也大约与NetLogo相同,为5.4秒。 最近的比较 Java和Python之间没有优势,所以我想这只是我的代码有问题吧?

编辑:我明白MASON应该比Repast还要快,但最终仍然运行Java。

4个回答

11

这可能不会带来显著的加速,但您应该知道在Python中,与访问全局变量或属性相比,本地变量要快得多。因此,您可以尝试将一些在内部循环中使用的值分配给本地变量,就像这样:

def look_around(self):
    max_sugar_point = self.point
    max_sugar = self.world.sugar_map[self.point].level
    min_range = 0

    selfx = self.point[0]
    selfy = self.point[1]
    wlength = self.world.surface.length
    wheight = self.world.surface.height
    occupied = self.world.occupied
    sugar_map = self.world.sugar_map
    all_directions = self.all_directions

    random.shuffle(all_directions)
    for r in range(1, self.vision+1):
        for dx,dy in all_directions:
            p = ((selfx + r * dx) % wlength,
                (selfy + r * dy) % wheight)
            if occupied(p): # checks if p is in a lookup table (dict)
                continue
            if sugar_map[p].level > max_sugar:
                max_sugar = sugar_map[p].level
                max_sugar_point = p
    if max_sugar_point is not self.point:
        self.move(max_sugar_point)

在Python中,函数调用的开销相对较高(与Java相比),因此您可以尝试通过将occupied函数替换为直接的字典查找来进一步优化。

您还应该看看psyco。它是Python的即时编译器,在某些情况下可以显著提高速度。但是,它目前不支持Python 3.x,因此您需要使用旧版本的Python。


1
不错。执行时间从15.5秒降至11.4秒(约26%)。为什么Python不会优化这些东西,至少当我向解释器指定-O选项时??? - max
1
当我删除了occupied函数时,时间进一步降至10.4秒。 - max
1
@ max:感谢您回复并分享了您所体验到的加速效果。 - Curious2learn

4
我猜测NetLogo中实现neighborhood的方式与你所说的双重循环不同。具体而言,我认为他们会预先计算一个邻域向量,如下所示:
n = [ [0,1],[0,-1],[1,0],[-1,0]....]

(如果vision=1,2,...,您需要不同的循环)然后只使用一个循环来覆盖n,而不是像您现在做的那样嵌套循环。这消除了乘法的需要。

我认为这不会使您的速度提高3倍。


我们需要在最高的糖分点之间随机选择一个点。在我的方法中,这是通过在循环之前对方向进行单个“shuffle”来完成的。在NetLogo中,这是通过跟踪所有最佳点然后从列表中随机选择一个来完成的(我尝试了Python的这种方法,但速度稍慢)。在你的方法中,我要么需要再次尝试跟踪多个最佳点,要么对每个邻域向量进行“shuffle”(而不是一个“shuffle”)。我会试一下。 - max
另外,由于我需要检查在环面上的包裹情况,因此我需要预先计算每个点的邻域或继续使用模运算符。前者速度略快几个百分点,后者则慢得多。 - max
一个更快的方法来实现netLogo中环绕世界行为的方式是将你的世界建模在一个numpy数组中,并在x和y方向上的两端增加额外的索引。如果邻居距离为1,则数组索引将从0到宽度+1,从0到高度+1。计算只需要在表示世界的索引子集内完成,然后可以从另一端的世界复制每个维度末尾的额外索引的补丁值。这避免了在世界内部的每个python等效的netLogo补丁的%计算。 - Bennett Brown

3

这是一个老问题,但我建议您使用NumPy来加速操作。在使用字典和列表的地方,逻辑上组织良好(1、2、3或N维网格)的同类数据对象(所有整数、所有浮点数等)将具有较少的开销,并且当表示为Numpy数组时可以更快地访问。

http://numpy.org


3

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接