这是我从文本文件中读取的一行:
[54, 95, 45, -97, -51, 84, 0, 32, -55, 14, 50, 54, 68, -3, 57, 88, -1]
我使用 readline() 将其读入为字符串。现在将其最快地转换回数组的方法是什么?
谢谢!
我不确定这是否是最快的方法,但肯定是最安全/最容易的方法:
import ast
lst = ast.literal_eval(s)
常规的eval
也可以工作:
lst = eval(s)
我的电脑的一些基本时间:
>>> s = '[54, 95, 45, -97, -51, 84, 0, 32, -55, 14, 50, 54, 68, -3, 57, 88, -1]'
>>> def f1():
... eval(s)
...
>>> def f2():
... ast.literal_eval(s)
...
>>> timeit.timeit('f1()', 'from __main__ import f1')
31.415852785110474
>>> timeit.timeit('f2()', 'from __main__ import f2')
46.25958704948425
所以,根据我的计算机,eval
比 ast.literal_eval
快大约50%。然而,eval
非常不安全,除非你完全信任它,否则永远不应该在任何字符串上使用。除非这是一个真正可证明的瓶颈,并且你对输入数据百分之百信任,否则我认为多花一点时间值得,换来晚上能够睡个安稳觉。eval(s)
可能是最快的。 - Tim Peterstimeit
显示 eval
大约快50%。 - mgilson由于我们关心速度,在这种情况下我可能会使用json.loads
:
>>> import ast, json
>>> s = "[54, 95, 45, -97, -51, 84, 0, 32, -55, 14, 50, 54, 68, -3, 57, 88, -1]"
>>> %timeit ast.literal_eval(s)
10000 loops, best of 3: 61.6 µs per loop
>>> %timeit eval(s)
10000 loops, best of 3: 45.7 µs per loop
>>> %timeit json.loads(s)
100000 loops, best of 3: 6.61 µs per loop
>>> json.loads(s)
[54, 95, 45, -97, -51, 84, 0, 32, -55, 14, 50, 54, 68, -3, 57, 88, -1]
请注意,这里之所以可以使用此方法是因为该行足够类似JSON格式。但它不能像ast.literal_eval
那样在所有地方使用,因为并非所有Python字面量语法都是有效的JSON。
>>> s = "[54, 95, 45, -97, -51, 84, 0, 32, -55, 14, 50, 54, 68, -3, 57, 88, -1]"
>>> eval(s)
[54, 95, 45, -97, -51, 84, 0, 32, -55, 14, 50, 54, 68, -3, 57, 88, -1]
eval
。它在我发布的官方Python文档中已经有了,并且在我看来,去那里阅读比在这里重复一条信息更具指导性(而且也更符合“Pythonic”)。 - Giupo我正在使用 Python 3.6
这是我的一个实际字符串分隔结果,使用了空格
stringValue = "123 456 789 012 345 678"
字符串转列表
intValue = list(map(int, stringValue.split(' ')))
结果
花费时间 7.586999345221557e-06
[76, 96, 127, 255, 136, 164]
尝试打印所花费的时间 6.697199933114462e-05
字符串转列表再转numpy
intValue = np.array(list(map(int, stringValue.split(' '))))
结果
花费时间 2.631999996083323e-05
[ 76 96 127 255 136 164]
尝试打印所花费的时间 0.002241893000245909
字符串转换为numpy数组
intValue = np.fromstring(stringValue,dtype=int,sep=' ')