我有一个数据框,想要按照店铺和所有店铺计算平均值。我已经写了代码来计算平均值,但是我正在寻找一种更有效的方法。
数据框
Cashier# Store# Sales Refunds
001 001 100 1
002 001 150 2
003 001 200 2
004 002 400 1
005 002 600 4
DF-Desired(期望值)
Cashier# Store# Sales Refunds Sales_StoreAvg Sales_All_Stores_Avg
001 001 100 1 150 290
002 001 150 2 150 290
003 001 200 2 150 290
004 002 400 1 500 290
005 002 600 4 500 290
我的尝试是创建了两个额外的数据框,然后进行了左连接。
df.groupby(['Store#']).sum().reset_index().groupby('Sales').mean()