我有一个DataFrame,其中包含一个无序项目ID列表及其相应的领导者。我希望将新DataFrame的值与真实情况进行比较,以验证新数据框中的所有项目ID既在基本事实中,又具有相同的领导者。有时,新的DataFrame可能有不同的列名,但它们总是两个并且始终表示相同的含义。
例如,基准真实情况DataFrame (df_gt) :
我希望得到的输出是一个列表,其中包含在新数据框中找到的所有偏差与基准真值的偏差。在这种情况下:
例如,基准真实情况DataFrame (df_gt) :
Project ID Leader
123 Owen Wilson
122 Samuel Jackson
145 Jack Black
134 Natalie Portman
新的 DataFrame 可能为 (df_new):
Project Leader
123 Owen Wilson
122 Henry Cavil
144 Natalie Portman
146 Jack Black
我希望得到的输出是一个列表,其中包含在新数据框中找到的所有偏差与基准真值的偏差。在这种情况下:
errors == [[122, 亨利 · 卡维尔], [144, 娜塔莉·波特曼], [146, 杰克 · 布莱克]]
有没有最简单的方法来适应多个潜在的新数据框,每个数据框都有自己的列命名约定,但具有相同的预期值。