为什么或者为什么不?
xrange()
通常更好。但是,还有几种情况,您可能更喜欢使用range()
:
在Python 3中,range()
执行了xrange()
过去的任务,而xrange()
不存在。如果您想��写可以在Python 2和Python 3上运行的代码,则无法使用xrange()
。
在某些情况下, range()
实际上可能更快-例如,如果多次迭代相同序列。xrange()
必须每次重构整数对象,但range()
将具有真实的整数对象(但就内存而言,它总是表现得更差)。
xrange()
不能在需要真正的列表的所有情况下使用。例如,它不支持切片或任何列表方法。
[编辑]有几篇文章提到range()
将由2to3工具升级。记录一下,以下是在一些range()
和xrange()
示例用法上运行此工具的输出:
RefactoringTool: Skipping implicit fixer: buffer
RefactoringTool: Skipping implicit fixer: idioms
RefactoringTool: Skipping implicit fixer: ws_comma
--- range_test.py (original)
+++ range_test.py (refactored)
@@ -1,7 +1,7 @@
for x in range(20):
- a=range(20)
+ a=list(range(20))
b=list(range(20))
c=[x for x in range(20)]
d=(x for x in range(20))
- e=xrange(20)
+ e=range(20)
可以看到,当用在for循环、推导式中,或者已经被list()包装时,range不会改变。
range
本身并不是一个迭代器。 - user2357112xr = xrange(1,11)
然后在下一行 for i in xr: print " ".join(format(i*j,"3d") for j in xr)
,就可以了!你可以得到十以内的乘法表。它的工作方式与 r = range(1,11)
和 for i in r: print " ".join(format(i*j,"3d") for j in r)
相同... 在 Python2 中,所有东西都是对象。我想你的意思是,你可以用 range
比 xrange
更好地进行基于索引的推导(如果有意义的话)。我认为 range
很少用到。 - dylnmcrange
可以很方便,但是 xrange
简单地更快且使用的内存更少,因此对于大多数 for 循环应用程序,它似乎是最好的选择。有时候 - 回到提问者的问题 - 很少但确实存在,range
会更好。也许不像我想象的那样少,但我肯定有 95% 的时间都使用 xrange
。 - dylnmc不,它们都各有用处:
在迭代时使用xrange()
,因为它可以节省内存。例如:
for x in xrange(1, one_zillion):
与其说是:
for x in range(1, one_zillion):
另一方面,如果你需要一个数字列表,请使用range()
。
multiples_of_seven = range(7,100,7)
print "Multiples of seven < 100: ", multiples_of_seven
只有在需要实际列表时,您才应该选择使用range()
而不是xrange()
。例如,当您想要修改由range()
返回的列表或者想要对其进行切片时。对于迭代甚至仅仅是普通索引,xrange()
将可以很好地工作(通常更加高效)。对于非常小的列表,range()
略微快于xrange()
,但是根据您的硬件和其他各种细节,这个分界点可能在长度为1或2的结果处达到平衡点;这不是什么值得担心的事情。建议使用xrange()
。
另一个区别是Python 2实现的xrange()
无法支持大于C ints的数字,因此如果您想使用Python内置的大数支持创建范围,则必须使用range()
。
Python 2.7.3 (default, Jul 13 2012, 22:29:01)
[GCC 4.7.1] on linux2
Type "help", "copyright", "credits" or "license" for more information.
>>> range(123456787676676767676676,123456787676676767676679)
[123456787676676767676676L, 123456787676676767676677L, 123456787676676767676678L]
>>> xrange(123456787676676767676676,123456787676676767676679)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
OverflowError: Python int too large to convert to C long
Python 3 没有这个问题:
Python 3.2.3 (default, Jul 14 2012, 01:01:48)
[GCC 4.7.1] on linux2
Type "help", "copyright", "credits" or "license" for more information.
>>> range(123456787676676767676676,123456787676676767676679)
range(123456787676676767676676, 123456787676676767676679)
xrange()
更加高效,因为它不会生成一个对象列表,而是一次只生成一个对象。相比于包含100个整数的列表及其所有开销,以及将它们放在其中的列表,你只有一个整数。更快的生成速度、更好的内存使用和更高效的代码。
除非我需要一个列表进行某些操作,否则我总是更喜欢使用 xrange()
。
range()函数返回一个列表,xrange()函数返回一个xrange对象。
xrange()函数速度稍快,而且内存占用更少。但是这种优势并不是非常大。
列表所使用的额外内存当然不是浪费的,因为列表有更多的功能(切片、重复、插入等)。具体差异可以在文档中找到。没有绝对的规则,使用需要的函数即可。
Python 3.0仍在开发中,但我记得range()函数将与2.X版本的xrange()函数非常相似,list(range())可以用来生成列表。
我想说的是,使用切片和索引功能获取xrange对象真的不难。我编写了一些代码,它运行起来非常好,并且在迭代次数很多时与xrange一样快。
from __future__ import division
def read_xrange(xrange_object):
# returns the xrange object's start, stop, and step
start = xrange_object[0]
if len(xrange_object) > 1:
step = xrange_object[1] - xrange_object[0]
else:
step = 1
stop = xrange_object[-1] + step
return start, stop, step
class Xrange(object):
''' creates an xrange-like object that supports slicing and indexing.
ex: a = Xrange(20)
a.index(10)
will work
Also a[:5]
will return another Xrange object with the specified attributes
Also allows for the conversion from an existing xrange object
'''
def __init__(self, *inputs):
# allow inputs of xrange objects
if len(inputs) == 1:
test, = inputs
if type(test) == xrange:
self.xrange = test
self.start, self.stop, self.step = read_xrange(test)
return
# or create one from start, stop, step
self.start, self.step = 0, None
if len(inputs) == 1:
self.stop, = inputs
elif len(inputs) == 2:
self.start, self.stop = inputs
elif len(inputs) == 3:
self.start, self.stop, self.step = inputs
else:
raise ValueError(inputs)
self.xrange = xrange(self.start, self.stop, self.step)
def __iter__(self):
return iter(self.xrange)
def __getitem__(self, item):
if type(item) is int:
if item < 0:
item += len(self)
return self.xrange[item]
if type(item) is slice:
# get the indexes, and then convert to the number
start, stop, step = item.start, item.stop, item.step
start = start if start != None else 0 # convert start = None to start = 0
if start < 0:
start += start
start = self[start]
if start < 0: raise IndexError(item)
step = (self.step if self.step != None else 1) * (step if step != None else 1)
stop = stop if stop is not None else self.xrange[-1]
if stop < 0:
stop += stop
stop = self[stop]
stop = stop
if stop > self.stop:
raise IndexError
if start < self.start:
raise IndexError
return Xrange(start, stop, step)
def index(self, value):
error = ValueError('object.index({0}): {0} not in object'.format(value))
index = (value - self.start)/self.step
if index % 1 != 0:
raise error
index = int(index)
try:
self.xrange[index]
except (IndexError, TypeError):
raise error
return index
def __len__(self):
return len(self.xrange)
以下是关于Go with range的原因:
1) xrange在较新的Python版本中将会被废弃。这使您轻松获得未来的兼容性。
2) range将具备xrange相关的效率优势。
>>> zip(range(5), xrange(100000000))
[(0, 0), (1, 1), (2, 2), (3, 3), (4, 4)]
在上面的例子中,我不建议使用range替代xrange——尽管只需要前五个数字,但range计算了所有数字,这可能需要很长时间。而xrange不会有这个问题,因为它只计算所需的数字。
是的,我看过@Brian的答案:在Python 3中,range()本身就是一个生成器,而xrange()不存在。
虽然在大多数情况下,xrange
比range
更快,但性能差异非常小。下面的小程序比较了迭代range
和xrange
:
import timeit
# Try various list sizes.
for list_len in [1, 10, 100, 1000, 10000, 100000, 1000000]:
# Time doing a range and an xrange.
rtime = timeit.timeit('a=0;\nfor n in range(%d): a += n'%list_len, number=1000)
xrtime = timeit.timeit('a=0;\nfor n in xrange(%d): a += n'%list_len, number=1000)
# Print the result
print "Loop list of len %d: range=%.4f, xrange=%.4f"%(list_len, rtime, xrtime)
xrange
确实更快,但不足以引起担忧。Loop list of len 1: range=0.0003, xrange=0.0003
Loop list of len 10: range=0.0013, xrange=0.0011
Loop list of len 100: range=0.0068, xrange=0.0034
Loop list of len 1000: range=0.0609, xrange=0.0438
Loop list of len 10000: range=0.5527, xrange=0.5266
Loop list of len 100000: range=10.1666, xrange=7.8481
Loop list of len 1000000: range=168.3425, xrange=155.8719
所以尽管使用xrange
,但除非你的硬件受到限制,否则不必过于担心。
list_len
没有被使用,因此你只能对长度为100的列表运行此代码。 - Markrtime = timeit.timeit('a=0;\nfor n in range(%d): a += n' % list_len, number=1000)
- Mark
range(1000)
是一个list
,而xrange(1000)
是一个像generator
(尽管它确实不是)的对象。同时,xrange
更快。你可以使用timeit
模块,写两个方法:一个只有for i in xrange: pass
,另一个只有range
,然后执行timeit(method1)
和timeit(method2)
,结果会惊人地发现,有时候xrange
会快近一倍(前提是你不需要一个列表)。例如,对于我来说,i in xrange(1000):pass
和i in range(1000):pass
分别用了大约13.316725969314575
秒和21.190124988555908
秒 - 差别还是很大的。 - dylnmcxrange(100)
比range(100)
快了 20%。链接 - Evgeni Sergeev