我正在尝试计算一个大数据集中"Force"列的均值和置信区间(95%),我需要通过使用groupby函数对不同的"Classes"进行分组来获得结果。当我计算均值并将其放入新数据框中时,所有行都会给出NaN值。我不确定我是否正确操作了。有没有更简单的方法可以做到这一点?这是样本数据框:
df=pd.DataFrame({ 'Class': ['A1','A1','A1','A2','A3','A3'],
'Force': [50,150,100,120,140,160] },
columns=['Class', 'Force'])
为了计算置信区间,我首先计算了均值。这是我使用的方法:
F1_Mean = df.groupby(['Class'])['Force'].mean()
这使得所有行的值都变成了NaN
。