我有一个数据框(假设为"df"),看起来像下面这样:
Hospital.Name | State | Mortality.Rate
'hospital_1' | 'AA' | 0.2
'hospital_2' | 'AA' | 0.3
'hospital_3' | 'BB' | 0.3
'hospital_4' | 'CC' | 0.5
(医院名称是唯一的)
现在我想按“州”对“死亡率”分组排序,即对某个州内的比率进行排序。如果比率相同,则使用“医院名称”来解决并列。
我想到了“order()”和“tapply()”函数。我编写的代码如下:
tapply(df$Mortality.Rate, df$State, order, df$Hospital.Name, na.last=NA)
然而,出现了一个错误“argument length differ”。当将“Rate”切片应用于“order”函数时,order的第二个参数(即df $Hospital.Name)没有被切片。
我该如何将第二个参数(用于解决排序中的平局)传递给tapply()或是否有其他方法?
Mortality.Rate
周围加引号。 - Konrad RudolphHospital.Name
部分在哪里?” - David Arenburg