wt在count()中的含义是什么(R语言)?

4

我已经反复谷歌搜索了,但似乎找不到一个对非英语为母语的人来说解释清楚它是什么意思。请给我一个具体的例子,带有和不带有wt的。


这是一个 dplyr 的函数或问题吗?如果是,请在问题中说明并加上 dplyr 标签。 - Rui Barradas
如果你在谈论一个变量,那么在生物学中,wt通常指代“野生型”,与特定的突变体相对。但是当然,没有更多的信息,就无法猜测你的问题与什么有关。 - Mario Niepel
3个回答

8

wt代表"weights"。

help('count')中使用对象df的第一个示例,在我看来非常清晰。

首先,创建该对象。

library(dplyr)

df <- tribble(
  ~name,    ~gender,   ~runs,
  "Max",    "male",       10,
  "Sandra", "female",      1,
  "Susan",  "female",      4
)

1. 现在,一个没有wt的示例。
从上面的数据集中可以看出,有:

  1. 2行的gender == "female"
  2. 1行的gender == "male"

非加权计数将返回这些计数。

# counts rows:
df %>% count(gender)
## A tibble: 2 x 2
#  gender     n
#  <chr>  <int>
#1 female     2
#2 male       1

2. 现在举一个权重参数wt的例子。

假设原始数据中有10行男性和5行女性。所有男性行都来自同一个人,"Max"。而女性行来自两个人,一个人只有一行,"Sandra",另一个人有4行,"Susan"

然后用户按name聚合了原始未处理的数据,结果如所发布的数据。为了获得考虑到原始数据的计数,请使用加权计数。
这就是wt示例上面的注释所说的内容。

# use the `wt` argument to perform a weighted count. This is useful
# when the data has already been aggregated once
# counts runs:
df %>% count(gender, wt = runs)
## A tibble: 2 x 2
#  gender     n
#  <chr>  <dbl>
#1 female     5
#2 male      10

4

把它看作是“按组汇总求和”,例如:

mtcars %>% 
  count(cyl, wt = mpg)
#   cyl     n
# 1   4 293.3
# 2   6 138.2
# 3   8 211.4

mtcars %>% 
  group_by(cyl) %>% 
  summarise(n = sum(mpg))
# # A tibble: 3 x 2
#     cyl     n
#   <dbl> <dbl>
# 1     4  293.
# 2     6  138.
# 3     8  211.

计数 {dplyr}
wt用于执行加权计数,将汇总从n = n()切换为n = sum(wt)


0

我会尽可能简单地解释这个问题。 如果我们有这样的数据集: 示例

这显示了不同的州、它们的县以及每个县的人口。

例如,我们可以看到“加利福尼亚”有多个县,每个县都有自己的人口。 现在,如果我们想要每个州的总人口呢?那就意味着将特定州的县的人口相加,对吧? 现在,这就是“wt”参数发挥作用的地方。 看一下这张图片 示例

现在我们可以看到,我们已经计算出了每个州的人数,并按其人口加权(wt)了n列。

我希望这能帮助您更好地理解它。 使用的图像快照来自我的datacamp工作区。


虽然该链接可能回答了问题,但最好在此处包括答案的基本部分并提供参考链接。如果链接页面更改,仅链接的答案可能会变得无效。-【来自评审】 - Matthieu H

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接