以下是我的问题:
我有一个数据框,像这样:
A B C
d1 1 2 3
d2 4 5 6
我希望生成如下的数据框。
A-d1 B-d1 C-d1 A-d2 B-d2 C-d2
1 2 3 4 5 6
使用 stack
处理具有 MultiIndex
的 Series,然后在列表推导式中将其展平,并传递给 DataFrame 构造函数:
s = df.stack()
#python 3.6+
df1 = pd.DataFrame([s.values], columns=[f'{j}-{i}' for i, j in s.index])
#python bellow 3.6
#df1 = pd.DataFrame([s.values], columns=['{}-{}'.format(i, j) for i, j in s.index])
print (df1)
A-d1 B-d1 C-d1 A-d2 B-d2 C-d2
0 1 2 3 4 5 6
您可以使用numpy.ravel
将数据展平,并使用itertools.product
创建新列:
from itertools import product
c = [f'{j}-{i}' for i, j in product(df.index, df.columns)]
df1 = pd.DataFrame([df.values.ravel()], columns=c)
print (df1)
A-d1 B-d1 C-d1 A-d2 B-d2 C-d2
0 1 2 3 4 5 6