假设df.bun
(df是Pandas数据帧)是一个多索引(日期和姓名),其中变量是用字符串编写的类别值。
date name values
20170331 A122630 stock-a
A123320 stock-a
A152500 stock-b
A167860 bond
A196030 stock-a
A196220 stock-a
A204420 stock-a
A204450 curncy-US
A204480 raw-material
A219900 stock-a
我该如何将这个表示为同一日期的总计数和其百分比,以便制作下表,每个日期都有相应数据:
date variable counts Percentage
20170331 stock 7 70%
bond 1 10%
raw-material 1 10%
curncy 1 10%
为了解决这个问题,我已经使用了print(df.groupby('bun').count())
,但它缺少...
附) 在获取df.bun之前,我使用了以下代码将嵌套字典导入Pandas数据框。
import numpy as np
import pandas as pd
result = pd.DataFrame()
origDict = np.load("Hannah Lee.npy")
for item in range(len(origDict)):
newdict = {(k1, k2):v2 for k1,v1 in origDict[item].items() for k2,v2 in origDict[item][k1].items()}
df = pd.DataFrame([newdict[i] for i in sorted(newdict)],
index=pd.MultiIndex.from_tuples([i for i in sorted(newdict.keys())]))
print(df.bun)
df
是什么?如果它有一个标签,你能否编辑你的问题添加它,如果没有,你能否编辑你的问题链接到df
应该是什么? - Mike 'Pomax' Kamermans