为什么DataFrame使用单个分组进行groupby操作时不会返回DataFrame？

Question

为什么DataFrame使用单个分组进行groupby操作时不会返回DataFrame？

3

我猜想这是我之前提出的一个简化版问题，链接在这里。【更新：很遗憾不是这个问题。】

如果你使用Pandas 0.11版本，可以尝试以下代码：

df = pd.DataFrame([[1,2],[1,3],[2,4]],columns='a b'.split())
print df
g = df.groupby('a').count()
print type(g)
print g

您会得到预期的结果：

   a  b
0  1  2
1  1  3
2  2  4
<class 'pandas.core.frame.DataFrame'>
   a  b
a      
1  2  2
2  1  1

但如果只有一个结果组，则会得到一个非常奇怪的Series：

df = pd.DataFrame([[1,2],[1,3],[1,4]],columns='a b'.split())
...

   a  b
0  1  2
1  1  3
2  1  4
<class 'pandas.core.series.Series'>
a   
1  a    3
   b    3
Name: 1, dtype: int64

但我更希望的结果是一个与此等效的DataFrame：

print pd.DataFrame([[3,3]],index=pd.Index([1],name='a'),columns='a b'.split())

   a  b
a      
1  3  3

我不知道如何轻松地从系列中获取它（也不确定为什么我首先会得到它）。

- patricksurry

我无法使用 pandas 0.12.0 复现这个问题，我只能得到两个计数的数据框。 - Marius

很好，这确实在0.12版本中得到了修复。但是奇怪的是，与pd.cut相关的行为似乎没有得到解决。对此有什么想法吗？ - patricksurry

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Phillip Cloud · Accepted Answer

在pandas 0.12中，这正是你所要求的。

In [3]: df = pd.DataFrame([[1,2],[1,3],[1,4]],columns='a b'.split())

In [4]: df.groupby('a').count()
Out[4]:
   a  b
a
1  3  3

为了重现您所看到的内容，请使用“squeeze=True”参数：

In [5]: df.groupby('a', squeeze=True).count()
Out[5]:
a
1  a    3
   b    3
Name: 1, dtype: int64

如果您无法进行升级，则执行以下操作：

In [3]: df.groupby('a').count().unstack()
Out[3]:
   a  b
a
1  3  3