如何使用pandas测量XY点之间的距离

3

我有一段代码,用于测量 XY 坐标之间的距离,但我希望通过使用 pandas 来使其更加高效。

假设我有一些被测对象的 XY 坐标:

id_X = [1,2,7,19] #Subject 1
id_Y = [2,5,5,7] #Subject 1
cd_X = [3,3,8,20] #Subject 2
cd_Y = [2,5,6,7] #Subject 2

我希望能够测量这些主题与另一个重要的XY坐标之间的距离:

Factor_X = [10,20,30,20] #Important XY
Factor_Y = [2,5,6,7] #Important XY

为了获取第一个主题的距离,我使用以下方法并遍历每一行。
dist = math.sqrt(((id_X[0] - Factor_X[0])**2)+((id_Y[0] - Factor_Y[0])**2))

为了获取第二个对象的距离,我需要交换id_Xid_Ycd_Xcd_Y
如果我有很多对象,这种方法就会变得非常低效。因此,我正在尝试通过pandas实现相同的概念。
以下是我的尝试:
d = ({                
    'id_X' : [1,2,7,19], 
    'id_Y' : [2,5,5,7], 
    'cd_X' : [3,3,8,20], 
    'cd_Y' : [2,5,6,7],
    'Factor_X' : [10,20,30,20], 
    'Factor_Y' : [2,5,6,7],          
     })

df = pd.DataFrame(data= d)

df['distance'] = math.sqrt(((df['id_X']-df['Factor_X'])**2)+((df['id_Y']-df['Factor_Y'])**2))
df['distance'] = math.sqrt(((df['cd_X']-df['Factor_X'])**2)+((df['cd_Y']-df['Factor_Y'])**2))

但是这会返回一个错误:
TypeError: cannot convert the series to <class 'float'>

预期输出:

   id_X  id_Y  cd_X cd_Y  Factor_X  Factor_Y  id_distance  cd_distance
0  1     2     3    2     10        2         9            7
1  2     5     3    5     20        5         18           17
2  7     5     8    6     30        6         23           22
3  19    7     20   7     20        7         1            0

这种方法可行吗?它是否会创造出更加高效的时间管理方法?

1个回答

1
过滤掉 idcd,然后按照通常的方法进行处理。
ids = df.filter(like='id')
cds = df.filter(like='cd')  
factor = df.filter(like='Factor')

df['id_distance'] = ((ids.values - factor.values) ** 2).sum(1) ** .5
df['cs_distance'] = ((cds.values - factor.values) ** 2).sum(1) ** .5

df 
   id_X  id_Y  cd_X  cd_Y  Factor_X  Factor_Y  id_distance  cs_distance
0     1     2     3     2        10         2     9.000000          7.0
1     2     5     3     5        20         5    18.000000         17.0
2     7     5     8     6        30         6    23.021729         22.0
3    19     7    20     7        20         7     1.000000          0.0

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接