9得票2回答
基于两个其他列创建新列,但在两者都存在时取平均值

我有两个数字列score.a和score.b。我想创建一个新的变量score.c,将观察到的得分从a或b中转移,但当它们都被观察到时,我需要取平均值。 help <- data.frame(deid = c(5, 7, 12, 15, 25, 32, 42, 77, 92, 100, ...

65得票8回答
R dplyr:使用字符串函数重命名变量

(与之有关的问题:在dplyr的rename函数中输入新的列名) 在 dplyr 链式操作(%>%) 中,我希望能够用旧列名的函数(如 tolower 或 gsub 等)来替换多个列名。library(tidyr); library(dplyr) data(iris) # This i...

11得票3回答
dplyr::count() 多列计数

我有如下数据集: dat = structure(list(C86_1981 = c("Outer London", "Buckinghamshire", NA, "Ross and Cromarty", "Cornwall and Isles of Scilly", NA, "Kirk...

14得票3回答
将长格式转换为宽格式,并创建包含二进制值的列

我知道 tidyr 包中的 spread 函数,但是我无法实现它。我有一个定义如下的 2 列 data.frame。 我需要将列 Subject 转置为二进制列,其中1和0。以下是数据框:studentInfo <- data.frame(StudentID = c(1,1,1,2,3,...

10得票3回答
跨多列进行变异以创建新的变量集。

我有一个按国家和年份水平的面板数据集,我想基于现有变量创建两个新变量。 年份 国家 变量1 变量2 变量3 变量4 变量1平均值 相对平均变量1 1910 德国 1 4 10 6 3 0.333 1911 德国 2 3 11 7 1.5 1.3333 1910 法国 ...

13得票1回答
当使用summarize函数时,dplyr仅返回一行。

我刚刚开始尝试使用dplyr的链式操作符。 以简单的例子为例:group_by(mtcars, cyl) %>% summarise(mean(disp), mean(hp)) 我得到了结果: # mean(disp) mean(hp) #1 230.7219 146.687...

8得票4回答
不同组的dplyr滞后

我正在尝试使用dplyr对包含同一组变量滞后的列以及(其中之一)其他组的滞后进行变异。编辑:抱歉,在第一版中,我在最后一秒重新排列了日期顺序,弄乱了顺序。 这是我期望的结果: 这是一个简单的代码示例: library(tidyverse) set.seed(2) df <...

7得票1回答
地图 + 并行地图,找不到变量

我正在尝试使用dplyr和purrr来整理模拟研究的结果。 我的结果保存为数据帧列表,其中包含来自几种不同分类算法的结果,并且我正在尝试使用purrr和dplyr来汇总这些结果。 我正在尝试计算以下内容: - 分配给每个簇的对象数 - 实际属于该簇的簇中对象的数量 - 使用3种不同算法(KE...

13得票2回答
使用lubridate在dplyr链中编辑年份

我有一个类似于以下玩具数据的数据框:df <- structure(list(year = c(2014, 2014, 2014, 2014, 2014, 2015, 2015, 2015, 2015, 2015, 2016, 2016, 2016, 2016, 2016), ...

10得票1回答
使用dplyr标准评估版本的do.call

我如何使用变量参数和函数来使用标准评估版本的dplyr中的summarise_使得do.call函数能够正常工作?## Some sample data, function, and variables to interpolate set.seed(0) dat <- data.fra...