我有一个9列的文件。其中一列包含这样的字符串
Unique
3:107912234-107912321(-)
4:107913333-107913322(+)
Y:222002110-221002100(+)
MT:34330044-343123232(-)
X:838377373-834121212(+)
有大约400,000行带有不同字符串的数据。我该如何将其拆分成4个不同的列并保存在同一个数据框中?如果只有一个分隔符,我可以使用df.str(",")
,但由于这里有不同的分隔符,我感到困惑。
期望输出:
chr start end strand
3 107912234 107912321 -
4 107913333 107913322 +
Y 222002110 221002100 +
MT 34330044 343123232 -
X 838377373 834121212 +
df = df.join(df1, lsuffix='_orig')
。 - jezrael