pandas value_counts(显示值和比率)

3
作为pandas的新手,我想从特定列中获取值的数量和百分比,并将它们合并到单个框架中。我可以得到一个或另一个,但不知道如何将它们添加或合并到单个框架中。有什么想法吗?
框架/表格应该像这样:
some_value, count, count(as %)

这是我所拥有的内容...
import numpy as np
import pandas as pd 

np.random.seed(1)
values = np.random.randint(30, 35, 20)

df1 = pd.DataFrame(values, columns=['some_value'])
df1.sort_values(by=['some_value'], inplace = True)
df2 = df1.value_counts()
df3 = df1.value_counts(normalize=True)

print(df2)
print("------")
print(df3) 
4个回答

5

只需使用

pd.DataFrame({"count":df2,"%":df3*100})

将系列数据放入一个数据框中。
输出:
            count     %
some_value             
34              7  35.0
32              4  20.0
33              3  15.0
31              3  15.0
30              3  15.0

1

使用functools中的partial,并使用pd.DataFrame.agg调用函数列表来尝试此操作:

from functools import partial
vc_norm = partial(pd.Series.value_counts, normalize=True)
df1['some_value'].agg([pd.Series.value_counts, vc_norm])

输出:

    value_counts  value_counts
34             7          0.35
32             4          0.20
31             3          0.15
30             3          0.15
33             3          0.15

或者你可以像这样使用 lambda 函数:

df1['some_value'].agg([pd.Series.value_counts, lambda x: x.value_counts(normalize=True)])

0
计算,重命名和连接。让我们试试;
df1.some_value.value_counts().to_frame('count').join(df1.some_value.value_counts(normalize=True).to_frame('%'))



  count   %
34      7  0.35
32      4  0.20
33      3  0.15
31      3  0.15
30      3  0.15

0
我猜调用value_counts然后使用lambda函数进行归一化可能更高效,但你可以通过以下方式获得你想要的结果:
df1_counts = df1.value_counts().to_frame(name="count").merge(
    df1.value_counts(normalize=True).to_frame(name="count(as %)"),
    left_index=True,
    right_index=True,
)

导致的结果是:
| some_value | count | count(as %) |
|------------|-------|-------------|
| 34         | 7     | 0.35        |
| 32         | 4     | 0.20        |
| 33         | 3     | 0.15        |
| 31         | 3     | 0.15        |
| 30         | 3     | 0.15        |


最好!

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接