为了测试两个(大型)样本之间是否存在统计学差异,我想从一个value_counts序列中计算平均值和标准差:
In [0]: counts.value_counts()
0 783
1 1128
2 744
3 366
4 119
5 38
6 10
7 3
我知道通过像这样做计算平均值并不难
total = 0
for idx, val in counts.value_counts().iteritems():
total = total + idx*val
m = total/sum(sum(counts.value_counts()))
我想知道是否有更简单的方法来完成这个任务。
同时我还想知道如何从counts.value_counts()输出中计算标准差。