我正在尝试理解
我知道,如果按照以下方式操作,它应该按
然而,我发现结果仅按
除了试图按列对数据框进行排序的问题外,我还试图理解
dplyr
中的group_by
函数的工作方式。我正在使用datasets
包中附带的airquality
数据集(链接)。我知道,如果按照以下方式操作,它应该按
Temp
变量的升序排列记录。airquality_max1 <- airquality %>% arrange(Temp)
我看到了在airquality_max1
中的情况。我现在想按照Month
分组,并且按照Temp
的升序排列记录。因此最终结果应该首先列出所有Month == 5
的记录,按照Temp
的升序排列。然后它应该列出所有Month == 6
的记录,按照Temp
的升序排列,依此类推。因此我使用以下命令:
airquality_max2 <- airquality %>% group_by(Month) %>% arrange(Temp)
然而,我发现结果仅按
Temp
的升序排列,而未按Month
分组,即airquality_max1
和airquality_max2
相等。我不确定为什么在arrange
函数之前没有按Month
进行分组。有人能帮我理解我在这里做错了什么吗?除了试图按列对数据框进行排序的问题外,我还试图理解
group_by
的行为,因为我正在尝试将其用于向某人解释group_by
的应用。
arrange
中添加Month
参数。airquality_max2 <- airquality %>% arrange(Month, Temp)
- Ronak Shahgroup_by
... - MichaelChiricogroup_by
的应用,但却遇到了这种行为。 - Satya