如果我有两个列表
a = [2,5,1,9]
b = [4,9,5,10]
我该如何找到每个元素的平均值,使得结果列表为:
[3,7,3,9.5]
如果我有两个列表
a = [2,5,1,9]
b = [4,9,5,10]
我该如何找到每个元素的平均值,使得结果列表为:
[3,7,3,9.5]
>>> a = [2,5,1,9]
>>> b = [4,9,5,10]
>>> [(g + h) / 2 for g, h in zip(a, b)]
[3.0, 7.0, 3.0, 9.5]
关于你问题的标题,你可以简单地通过以下方式实现:
import numpy as np
multiple_lists = [[2,5,1,9], [4,9,5,10]]
arrays = [np.array(x) for x in multiple_lists]
[np.mean(k) for k in zip(*arrays)]
上面的脚本可以处理多个列表,而不仅仅是两个。如果您想比较两种方法的性能,请尝试:%%time
import random
import statistics
random.seed(33)
multiple_list = []
for seed in random.sample(range(100), 100):
random.seed(seed)
multiple_list.append(random.sample(range(100), 100))
result = [statistics.mean(k) for k in zip(*multiple_list)]
或者:
%%time
import random
import numpy as np
random.seed(33)
multiple_list = []
for seed in random.sample(range(100), 100):
random.seed(seed)
multiple_list.append(np.array(random.sample(range(100), 100)))
result = [np.mean(k) for k in zip(*multiple_list)]
根据我的经验,使用numpy的方法更快。
自Python 3.4以来,有一个statistics模块,提供了一个mean()
函数:
statistics.mean(data)
返回数据的样本算术平均值,即实数序列或迭代器。
你可以像这样使用它:
import statistics
a = [2, 5, 1, 9]
b = [4, 9, 5, 10]
result = [statistics.mean(k) for k in zip(a, b)]
# -> [3.0, 7.0, 3.0, 9.5]
< p >< em > 注意 :此解决方案可用于两个以上的数组,因为 < code > zip() 可以有多个参数。
使用NumPy数组是使用列表和for循环的替代方法。
import numpy as np
# an array can perform element wise calculations unlike lists.
a, b = np.array([2,5,1,9]), np.array([4,9,5,10])
mean = (a + b)/2; print(mean)
>>>[ 3. 7. 3. 9.5]
看起来你正在寻找逐元素的平均值。在 np.mean 中设置 axis=0 就是你需要的。
>>> import numpy as np
>>> a = [2,5,1,9]
>>> b = [4,9,5,10]
>>> a_b = [a,b]
>>> a_b
[[2, 5, 1, 9], [4, 9, 5, 10]]
>>> np.mean(a_b, axis=0)
array([3. , 7. , 3. , 9.5])
import numpy as np
a = [2,5,1,9]
b = [4,9,5,10]
np.mean(np.vstack([a,b]), axis=0).tolist()
[3.0,7.0,3.0,9.5]