将标题转换为行

4
我有这样一个表格。
user    01/12/15    02/12/15 someBool
u1      100         300      true
u2      200        -100      false
u3     -50          200      true

我希望将日期列分成两列datevalue,如下所示。
user    date       value   someBool
u1      01/12/15   100     true
u1      02/12/15   300     true
u2      01/12/15   200     false
u2      02/12/15  -100     false
u3      01/12/15   50      true
u3      02/12/15   200     true

如何在Python中实现这个功能?
使用Pandas中的pivot_table函数是否有帮助?

如果可能,请提供代码/伪代码,并给出Python版本的详细信息。

2个回答

7
您需要使用 melt 函数:
df = pd.melt(df, id_vars=['user','someBool'], var_name='date')
print (df)
  user someBool      date  value
0   u1     True  01/12/15    100
1   u2    False  01/12/15    200
2   u3     True  01/12/15    -50
3   u1     True  02/12/15    300
4   u2    False  02/12/15   -100
5   u3     True  02/12/15    200

使用stack的另一种解决方案:

df = df.set_index(['user','someBool'])
       .stack()
       .reset_index(name='value')
       .rename(columns={'level_2':'date'})
print (df)
  user someBool      date  value
0   u1     True  01/12/15    100
1   u1     True  02/12/15    300
2   u2    False  01/12/15    200
3   u2    False  02/12/15   -100
4   u3     True  01/12/15    -50
5   u3     True  02/12/15    200

3

numpy 重构整个事物

id_vars = ['user', 'someBool']

the_rest = df.columns.difference(id_vars).tolist()
m, n = len(df), len(the_rest)
var_slc = np.arange(m).repeat(n)

pd.DataFrame(
    np.hstack([
            df[id_vars].values[var_slc],
            np.tile(the_rest, m)[:, None],
            df[the_rest].values.reshape(-1, 1)
        ]), columns=id_vars + ['date', 'value']
)

  user someBool      date value
0   u1     True  01/12/15   100
1   u1     True  02/12/15   300
2   u2    False  01/12/15   200
3   u2    False  02/12/15  -100
4   u3     True  01/12/15   -50
5   u3     True  02/12/15   200

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接