Pandas面板合并

3

什么是当前最佳的Pandas合并面板数据的方法,例如以下数据:

p = pd.Panel(np.random.randn(2,5,4),
    items=['IBM', 'AA'],
    major_axis=pd.date_range('1/1/2000', periods=5),
    minor_axis=['Open', 'High', 'Low', 'Close'])
dp = pd.Panel(np.random.randn(2,1,1),
    items=['IBM', 'Z'],
    major_axis=pd.date_range('1/8/2000', periods=1),
    minor_axis=['Close'])

预期的合并操作如下:
p[:,:,'Close'].merge(dp[:,:,'Close'],
    how='outer',
    on=list(set(p.items) & set(dp.items)),
    left_index=True,
    right_index=True)

但是,我不明白如何高效地更新原始面板 p,以包含这个合并。

如果 print(p[:,:,'Close']) 是这样的:

                 IBM        AA
2000-01-01  0.190049  0.200745
2000-01-02 -0.239746 -0.434157
2000-01-03 -0.112571 -0.302251
2000-01-04 -1.764957 -0.810951
2000-01-05 -0.961327  1.436247

那么上面的表合并将会看起来像这样:
                 IBM        AA         Z
2000-01-01  0.190049  0.200745       NaN
2000-01-02 -0.239746 -0.434157       NaN
2000-01-03 -0.112571 -0.302251       NaN
2000-01-04 -1.764957 -0.810951       NaN
2000-01-05 -0.961327  1.436247       NaN
2000-01-08  0.006128       NaN  0.383452

谢谢。
1个回答

1
我会将其转换为数据框,使用"combine_first"函数并再次转换回去。
new = p.to_frame().combine_first(dp.to_frame()).to_panel()

print new[:,:,'Close']

                  AA       IBM        Z
major                                  
2000-01-01  1.348884  0.472272      NaN
2000-01-02  1.599357 -0.228739      NaN
2000-01-03  2.041504 -0.325773      NaN
2000-01-04  0.348960 -0.451274      NaN
2000-01-05 -1.902347  0.146647      NaN
2000-01-08       NaN -0.240884  0.39855

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接