我有一个数据框,它看起来如下所示:
# df
colA colB colC
rqp 129 a
pot 217;345 u
ghay 716 b
rbba 217;345 d
tary 612;811;760 a
kals 716 t
ColB(两个组件中的任意一个)和ColC的组合形成独特的组合。 我想从这个数据框中创建一个如下所示的数据框
# newdf:
colAA coLBB
(129,a) (a,rqp)
(217,u) (u,pot)
(345,u) (u,pot)
(716,b) (b,ghay)
(217,d) (d,rbba)
(345,d) (d,rbba)
(612,a) (a,tary)
(811,a) (a,tary)
(760,a) (a,tary)
(716,t) (t,kals)
我尝试创建新列,如果colB中只有一个元素,但无法使用分号分隔符进行操作,也不知道如何创建元组列。
如果ColB中没有使用任何分号,则可以使用以下代码:
df['AA'] = list(zip(df[colB], df[colC]))
df['AB'] = list(zip(df[colC], df[colA]))
然而,ColB 中出现的分号会导致问题,需要将该字符串拆分成多个部分并分配元组。非常感谢您的帮助。