将列拆分为多个列

3

我有一个包含一列数据的数据框。我想将其拆分成多个列。

106
B-PER
I-PER
I-PER
B-PER
I-PER
I-PER
I-PER
B-PER
B-PROPH
109
B-PER
B-PER
I-PER
B-PER
I-PER
B-PER
I-PER
B-PER
I-PER
B-PROPH
116
B-PER
I-PER
I-PER
B-PER
B-PER
B-PER
B-PER

我希望在整数值出现时将此列拆分为多个列。 我知道我必须遍历行,但不知道如何拆分。 需要的输出是:
106          109           116                          
B-PER        B-PER         B-PER
I-PER        B-PER         I-PER
I-PER        I-PER         I-PER
B-PER        B-PER         B-PER
I-PER        I-PER         B-PER
I-PER        B-PER         B-PER
I-PER        I-PER         B-PER
B-PER        B-PER
B-PROPH      I=PER
             PROPH
3个回答

2

使用:

#test numeric values
m = df.A.astype(str).str.isnumeric()
#repeat only numeric values to groups
df['g'] = df.A.where(m).ffill()
#filter out rows without numeric (because repeated)
df = df[~m]
#reshape
df1 = df.set_index([df.groupby('g').cumcount(), 'g'])['A'].unstack(fill_value='')

print (df1)

g      106      109    116
0    B-PER    B-PER  B-PER
1    I-PER    B-PER  I-PER
2    I-PER    I-PER  I-PER
3    B-PER    B-PER  B-PER
4    I-PER    I-PER  B-PER
5    I-PER    B-PER  B-PER
6    I-PER    I-PER  B-PER
7    B-PER    B-PER       
8  B-PROPH    I-PER       
9           B-PROPH   

1
这里提供一种方法,使用 pivot_table,假设你的列名叫做 'col':
g = df.col.str.isnumeric().cumsum()
out = df.pivot_table(df, 
                   columns=g, 
                   index=g.reset_index().groupby('col').cumcount(), 
                   aggfunc='first', 
                   fill_value='')
out.columns = out.loc[0]
out.drop(0)

0       106      109    116
1     B-PER    B-PER  B-PER
2     I-PER    B-PER  I-PER
3     I-PER    I-PER  I-PER
4     B-PER    B-PER  B-PER
5     I-PER    I-PER  B-PER
6     I-PER    B-PER  B-PER
7     I-PER    I-PER  B-PER
8     B-PER    B-PER       
9   B-PROPH    I-PER       
10           B-PROPH       

1
首先创建一个名为 key 的列和一个新的索引,使用 cumcount()
最后,我们可以使用 unstack
我们使用 iloc[1:] 来移除第一行的列名。
df['key'] = pd.to_numeric(df[0],errors='coerce').ffill()
df1 = df.set_index([df.groupby('key').cumcount(),'key']).unstack(1).iloc[1:].droplevel(0,1)

key    106.0    109.0  116.0
1      B-PER    B-PER  B-PER
2      I-PER    B-PER  I-PER
3      I-PER    I-PER  I-PER
4      B-PER    B-PER  B-PER
5      I-PER    I-PER  B-PER
6      I-PER    B-PER   B-PE
7      I-PER    I-PER    NaN
8      B-PER    B-PER    NaN
9    B-PROPH    I-PER    NaN
10       NaN  B-PROPH    NaN

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接