I have a data frame of similar format:
df = pd.DataFrame({
'p1': [0, 0, 1, 1, -2],
'p2': [9, 2, 3, -5, 3],
'p3': [1, 3, 10, 3, 7],
'p4': [4, 4, 7, 1, 10]})
p1 p2 p3 p4
0 0 9 1 4
1 0 2 3 4
2 1 3 10 7
3 1 -5 3 1
4 -2 3 7 10
期望输出:
top1 top2
p2:9 p4:4
p4:4 p3:3
p3:10 p4:7
p2:-5 p3:3
p4:10 p3:7
经过深入的研究,我已经成功地对数组进行了排序并获得了排序后的索引。我也能用列代替这些索引。但是我无法将它们与行值连接起来。
nlargest = 3
order = np.argsort(-df.abs().values, axis=1)[:, :nlargest]
result = pd.DataFrame(df.columns[order],
columns=['top{}'.format(i) for i in range(1, nlargest+1)])
top1 top2 top3
0 p2 p4 p3
1 p4 p3 p2
2 p3 p4 p2
3 p2 p3 p1
4 p4 p3 p2
使用上述方法,我尝试对不同数据框中的行进行排序,并考虑将它们连接起来。但是我找不到正确的方法来实现这一点。我知道这不是最优的方式。
result2 = pd.DataFrame(np.sort(df.values, axis=0), index=df.index, columns=df.columns)
result2 = result2.iloc[:, 0:nlargest]
result2.columns = columns=['top{}'.format(i) for i in range(1, nlargest+1)]
top1 top2 top3
0 -2 -5 1
1 0 2 3
2 0 3 3
3 1 3 7
4 1 9 10
请帮我纠正排序并找到最简洁的方法来达到预期的格式。