我使用pandas对数据集进行分组。当我使用不同的函数聚合不同列时,我得到了一个分层列结构。
G1 = df.groupby('date').agg({'col1': [sum, np.mean], 'col2': 'sum', 'col3': np.mean})
导致:
col1 col2 col3
sum mean sum mean
date
2000-11-01 1701 1.384052 82336 54.222945
2000-11-02 11101 1.447894 761963 70.027260
2000-11-03 11285 1.479418 823355 77.984268
很不幸,我在文档中找不到有关这个结果结构的太多信息。在 pandas 文档中唯一找到的是分层的多索引。
如何访问这些值?
目前我使用 X['col1']['mean']
来访问整个 Series
。
2000-11-01 1.384052
2000-11-02 1.447894
2000-11-03 1.479418
因此,使用
X['col1']['mean'][1]
可以获取值1.447894
,但我担心性能问题,因为该代码首先对col1
(X ['col1'])进行切片,这会导致实际上包含2列的视图/副本(在此情况下不知道哪一个),然后还有另一个 mean
列的切片。
有什么提示吗? 在文档中哪里可以找到有关创建分层列的更多信息?