我有两个数据框,分别为
我有一个特定的距离度量方法,希望将这两个数据框合并在一起,使得
例如(为了简单起见,只使用一个属性):使用绝对差异距离
应该产生以下合并表。
我的当前做法很慢,基于将
如何使用pandas执行上述合并?是否有任何方便的方法或函数可以在这里提供帮助?
编辑:仅澄清,在数据框中还有其他未用于距离计算的列,但也必须合并。
A
和B
,它们都有一些列名为attr1
、attr2
、attrN
等。我有一个特定的距离度量方法,希望将这两个数据框合并在一起,使得
A
中的每一行与B
中距离最短的那一行进行合并。注意,在合并时,B
中的行可以重复出现。例如(为了简单起见,只使用一个属性):使用绝对差异距离
|A.attr1 - B.att1|
来合并这两个表格。A | attr1 B | attr1
0 | 10 0 | 15
1 | 20 1 | 27
2 | 30 2 | 80
应该产生以下合并表。
M | attr1_A attr1_B
0 | 10 15
1 | 20 15
2 | 30 27
我的当前做法很慢,基于将
A
的每一行与B
的每一行进行比较,但代码也不清晰,因为我必须保留合并的索引,我完全不满意,但我想不出更好的解决方案。如何使用pandas执行上述合并?是否有任何方便的方法或函数可以在这里提供帮助?
编辑:仅澄清,在数据框中还有其他未用于距离计算的列,但也必须合并。