假设有一个数据框 df:
1 1.1 2 2.1 ... 1600 1600.1
0 45.1024 7.2365 45.8769 7.1937 34.1072 8.4643
1 43.1024 8.9645 32.5798 7.7500 33.1072 9.3564
2 42.1024 6.7498 25.1027 7.3496 26.1072 6.3665
我进行了以下操作:首先选择了
(1 和 1.1)
这一组,并创建了一个数组。然后我用同样的方法处理了下一组(2 和 2.1)
。x = df['1']
y = df['1.1']
P = np.array([x, y])
并且
q = df['2']
w = df['2.1']
Q = np.array([q, w])
最终执行的操作是:
Q_final = list(zip(Q[0], Q[1]))
P_final = list(zip(P[0], P[1]))
现在我想对整个数据集执行此操作。但这将需要很长时间。有什么快速迭代的方法吗?
编辑后:
毕竟,我正在做...
df = similaritymeasures.frechet_dist(P_final, Q_final)
我希望获取一个新的数据集(也许是)包含所有列的组合。