在Python中计算平均值、标准差和方差,并从这些计算中创建一个新的数据框。

4

我的数据框

date   Stk A     Stk B  Stk C   Stk D
01.01   0.03    0.0102  0.034   0.083232
02.02   0.05    0.017   0.0578  0.13872
03.03   0.04    0.0136  0.046   0.110976
04.04   0.006   0.00204 0.006   0.0166464

需要的输出

           Stk A      Stk B       Stk C     Stk D
Mean     0.0315      0.01071    0.036       0.0873936
Std.Dev  0.0188      0.0064     0.021       0.052322762
Variance 0.0003      0.0034     0.047       0.002737671
3个回答

9

在Python中使用pandas库

import pandas as pd
stats=pd.DataFrame()
stats["mean"]=data.mean()
stats["Std.Dev"]=data.std()
stats["Var"]=data.var()

然后像这样转置它
stats.T

5
但是什么是“数据”? - Phil Goetz

8

df.describe()可以解决问题。

my_df.describe()

                Age
count  37471.000000  
mean      43.047317      
std       20.676562      
min        1.000000     
25%       28.000000     
50%       43.000000     
75%       59.000000 
max      117.000000

2
你可以这样做:
选项1
pd.DataFrame([df.mean(), df.std(), df.var()], index=['Mean', 'Std. dev', 'Variance'])

或者类似这样的内容:

选项2

df2 = df.describe().loc[['mean', 'std']]
df2.loc['variance'] = df2.loc['std']**2

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接