496得票16回答
计算数据框列中某个值出现的频率。

我有一个数据集 category cat a cat b cat a 我想返回类似以下内容的东西,显示唯一值及其频率。 category freq cat a 2 cat b 1

286得票33回答
如何计算无序列表中元素的频率?

给定一个无序的值列表,例如:a = [5, 1, 2, 2, 4, 3, 1, 2, 3, 1, 1, 5, 2] 如何获取列表中每个值出现的频率,像这样?# `a` has 4 instances of `1`, 4 of `2`, 2 of `3`, 1 of `4,` 2 of `5` ...

242得票10回答
相对频率/比例与dplyr

假设我想计算每个组中不同值的比例。例如,使用mtcars数据,如何使用dplyr一次性计算按am(自动/手动)分组的gears数量的相对频率?library(dplyr) data(mtcars) mtcars <- tbl_df(mtcars) # count frequency m...

179得票2回答
Pandas的“Freq”标签中有哪些有效值?

我正在尝试使用date_range。我发现了一些freq有效的值,例如BME和BMS,我希望能够快速查找正确的字符串来得到我想要的结果。 Pandas“Freq”标签中哪些值是有效的?

124得票7回答
在bash中获取列中唯一值的数量

我有几个以制表符分隔的文件,每个文件有多列。我想统计文件夹中所有文件某一列不同值的频率,并按计数进行降序排序(计数最高的排在前面)。如何在Linux命令行环境下完成? 可以使用任何常见的命令行语言,如awk、perl、python等。

116得票4回答
如何为单个Series计算直方图(频率表)?

我该如何为单个Series生成频率表(或直方图)?例如,如果我有my_series = pandas.Series([1,2,2,3,3,3]),那么如何获得类似于{1: 1, 2: 2, 3: 3}的结果-即每个值出现的次数计数在 Series中?

101得票7回答
Python中R table的等效命令

我有一个列表[[12, 6], [12, 0], [0, 6], [12, 0], [12, 0], [6, 0], [12, 6], [0, 6], [12, 0], [0, 6], [0, 6], [12, 0], [0, 6], [6, 0], [6, 0], [12, 0], [6, ...

92得票15回答
计算列表中单词出现的频率并按频率排序

我正在使用Python 3.3。 我需要创建两个列表,一个是单词的唯一列表,另一个是单词频率的列表。 我必须根据频率列表对唯一单词列表进行排序,以便具有最高频率的单词排在列表的第一位。 我已经有了文本中的设计,但不确定如何在Python中实现。 到目前为止,我发现的方法都使用了Coun...

69得票14回答
Python中的项目频率计数

假设我有一个单词列表,我想要找出每个单词在该列表中出现的次数。 一种明显的方法是:words = "apple banana apple strawberry banana lemon" uniques = set(words.split()) freqs = [(item, words.s...

58得票6回答
如何获取一列中出现频率最高的数值?

我有一个数据框,想知道给定列的最频繁值出现的次数。 我尝试以下方法: items_counts = df['item'].value_counts() max_item = items_counts.max() 结果我得到: ValueError: cannot convert fl...