我正在使用Excel处理一个大型数据集,我想要按每个指数值的前25个数字进行排序。
数据看起来像这样:
最终PAC ID是公司编号并且会变化(在给定数据中不显示)。PAC捐款是我想要按照排序的数字。
例如,C00003590公司将有50项捐款,分别向不同的候选人捐赠“PAC捐款”金额,我想按公司对每个公司进行前25项捐款的排序。
我尝试使用字典进行操作,为每个公司创建一个字典,并将候选人编号作为字符串键添加,并将捐款作为值添加。
到目前为止,我所拥有的代码如下(但这可能完全不正确):
数据看起来像这样:
最终PAC ID是公司编号并且会变化(在给定数据中不显示)。PAC捐款是我想要按照排序的数字。
例如,C00003590公司将有50项捐款,分别向不同的候选人捐赠“PAC捐款”金额,我想按公司对每个公司进行前25项捐款的排序。
我尝试使用字典进行操作,为每个公司创建一个字典,并将候选人编号作为字符串键添加,并将捐款作为值添加。
到目前为止,我所拥有的代码如下(但这可能完全不正确):
import pandas as pd
df1 = pd.read_excel('Test2.xlsx')
dict_company = {}
k1 = str(df1['Final PAC ID'])
k2 = str(df1['Candidate ID'])
for each in range(0,100):
dict_company[k1)[each]] = {}
dict_company[k1)[each]] = k2[each]
if each % 50 == 0:
print(each)
print(dict_company)
for each in range(0,100):
dict_company[k1][k2][each] = round(float(k1[each]))
if each % 50:
print(each)
print(dict_company)