DataFrame Pandas - 使用索引和列名作为新列名来扁平化数据框

5

以下是我的问题:

我有一个数据框,像这样:

   A B C
d1 1 2 3
d2 4 5 6

我希望生成如下的数据框。
   A-d1 B-d1 C-d1 A-d2 B-d2 C-d2
    1    2    3    4    5    6
1个回答

4

使用 stack 处理具有 MultiIndex 的 Series,然后在列表推导式中将其展平,并传递给 DataFrame 构造函数:

s = df.stack()
#python 3.6+
df1 = pd.DataFrame([s.values],  columns=[f'{j}-{i}' for i, j in s.index])
#python bellow 3.6
#df1 = pd.DataFrame([s.values],  columns=['{}-{}'.format(i, j) for i, j in s.index])
print (df1)
   A-d1  B-d1  C-d1  A-d2  B-d2  C-d2
0     1     2     3     4     5     6

您可以使用numpy.ravel将数据展平,并使用itertools.product创建新列:

from  itertools import product

c = [f'{j}-{i}' for i, j in product(df.index, df.columns)]
df1 = pd.DataFrame([df.values.ravel()], columns=c)
print (df1)
   A-d1  B-d1  C-d1  A-d2  B-d2  C-d2
0     1     2     3     4     5     6

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接