什么是当前最佳的Pandas合并面板数据的方法,例如以下数据:
p = pd.Panel(np.random.randn(2,5,4),
items=['IBM', 'AA'],
major_axis=pd.date_range('1/1/2000', periods=5),
minor_axis=['Open', 'High', 'Low', 'Close'])
dp = pd.Panel(np.random.randn(2,1,1),
items=['IBM', 'Z'],
major_axis=pd.date_range('1/8/2000', periods=1),
minor_axis=['Close'])
预期的合并操作如下:
p[:,:,'Close'].merge(dp[:,:,'Close'],
how='outer',
on=list(set(p.items) & set(dp.items)),
left_index=True,
right_index=True)
但是,我不明白如何高效地更新原始面板 p,以包含这个合并。
如果 print(p[:,:,'Close']) 是这样的:
IBM AA
2000-01-01 0.190049 0.200745
2000-01-02 -0.239746 -0.434157
2000-01-03 -0.112571 -0.302251
2000-01-04 -1.764957 -0.810951
2000-01-05 -0.961327 1.436247
那么上面的表合并将会看起来像这样:
IBM AA Z
2000-01-01 0.190049 0.200745 NaN
2000-01-02 -0.239746 -0.434157 NaN
2000-01-03 -0.112571 -0.302251 NaN
2000-01-04 -1.764957 -0.810951 NaN
2000-01-05 -0.961327 1.436247 NaN
2000-01-08 0.006128 NaN 0.383452
谢谢。