如何将两个Pandas数据框的列堆叠在一起?

3
有没有库函数或正确的方法可以将两个Pandas数据框列堆叠在一起?
例如,将4列变为2列:
a1  b1  a2  b2
 1   2   3   4
 5   6   7   8

to

c   d
1   2
5   6
3   4
7   8

我阅读的 Pandas 数据框的文档大部分只涉及连接行和行操作,但我相信一定有一种方法可以做到我描述的操作,而且我相信这很简单。任何帮助都将是非常棒的。
3个回答

7

您可以使用 pandas.DataFrame.iloc 选择第一组和第二组列。然后,将两部分的列名更改为cd。之后,您只需使用 pandas.concat 将它们连接在一起即可。

import pandas as pd
import numpy as np

df = pd.DataFrame(np.arange(1, 9).reshape((2, 4)),
        columns=["a1", "b1", "a2", "b2"])

part1 = df.iloc[:,0:2]
part2 = df.iloc[:,2:4]

new_columns = ["c", "d"]
part1.columns = new_columns
part2.columns = new_columns

print pd.concat([part1, part2], ignore_index=True)

这将给您带来以下内容:
   c  d
0  1  2
1  5  6
2  3  4
3  7  8

1
我会做以下事情。
import pandas as pd
df = pd.DataFrame({'a1' : pd.Series([1,5]), 'b1' : pd.Series([2,6]), 'a2' : pd.Series([3,7]), 'b2' : pd.Series([4,8])})

df1 = df[['a1','b1']]
df2 = df[['a2','b2']]
df1.columns = ['c','d']
df2.columns = ['c','d']
df1.append(df2)

我刚刚看到@Carsten也回答了这个问题,我也同意他的答案。


0

或者,使用melt

# Make data as in previous answers 
import pandas as pd
import numpy as np

df = pd.DataFrame(np.arange(1, 9).reshape((2, 4)),
                  columns=["a1", "b1", "a2", "b2"])

# Melt both columns and concatenate 
df = pd.concat([
    df[['a1', 'a2']].melt(value_name='c'), 
    df[['b1', 'b2']].melt(value_name='d')], 
    axis=1)

# Discard unwanted columns melt creates
df = df[['c', 'd']]

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接