最新 'dplyr' 问题 - 第3页

关联标签

9得票2回答

我有两个数字列score.a和score.b。我想创建一个新的变量score.c，将观察到的得分从a或b中转移，但当它们都被观察到时，我需要取平均值。 help <- data.frame(deid = c(5, 7, 12, 15, 25, 32, 42, 77, 92, 100, ...

65得票8回答

（与之有关的问题：在dplyr的rename函数中输入新的列名）在 dplyr 链式操作(%>%) 中，我希望能够用旧列名的函数（如 tolower 或 gsub 等）来替换多个列名。library(tidyr); library(dplyr) data(iris) # This i...

11得票3回答

我有如下数据集： dat = structure(list(C86_1981 = c("Outer London", "Buckinghamshire", NA, "Ross and Cromarty", "Cornwall and Isles of Scilly", NA, "Kirk...

14得票3回答

我知道 tidyr 包中的 spread 函数，但是我无法实现它。我有一个定义如下的 2 列 data.frame。我需要将列 Subject 转置为二进制列，其中1和0。以下是数据框：studentInfo <- data.frame(StudentID = c(1,1,1,2,3,...

10得票3回答

我有一个按国家和年份水平的面板数据集，我想基于现有变量创建两个新变量。年份国家变量1 变量2 变量3 变量4 变量1平均值相对平均变量1 1910 德国 1 4 10 6 3 0.333 1911 德国 2 3 11 7 1.5 1.3333 1910 法国 ...

13得票1回答

我刚刚开始尝试使用dplyr的链式操作符。以简单的例子为例：group_by(mtcars, cyl) %>% summarise(mean(disp), mean(hp)) 我得到了结果： # mean(disp) mean(hp) #1 230.7219 146.687...

8得票4回答

我正在尝试使用dplyr对包含同一组变量滞后的列以及（其中之一）其他组的滞后进行变异。编辑：抱歉，在第一版中，我在最后一秒重新排列了日期顺序，弄乱了顺序。这是我期望的结果: 这是一个简单的代码示例: library(tidyverse) set.seed(2) df <...

7得票1回答

我正在尝试使用dplyr和purrr来整理模拟研究的结果。我的结果保存为数据帧列表，其中包含来自几种不同分类算法的结果，并且我正在尝试使用purrr和dplyr来汇总这些结果。我正在尝试计算以下内容： - 分配给每个簇的对象数 - 实际属于该簇的簇中对象的数量 - 使用3种不同算法（KE...

13得票2回答

我有一个类似于以下玩具数据的数据框：df <- structure(list(year = c(2014, 2014, 2014, 2014, 2014, 2015, 2015, 2015, 2015, 2015, 2016, 2016, 2016, 2016, 2016), ...

10得票1回答

我如何使用变量参数和函数来使用标准评估版本的dplyr中的summarise_使得do.call函数能够正常工作？## Some sample data, function, and variables to interpolate set.seed(0) dat <- data.fra...