15得票2回答
如何快速汇总和总结数据?

我有一个数据集,其表头如下:PID Time Site Rep Count 我想要根据每个PID x Time x Site combo中的Rep对Count进行求和。 在得到的数据框中,我想要获得PID x Time x Site组合的Count平均值。 当前函数如下:dummy &lt...

15得票3回答
ddply函数与lm()函数的应用

如何在线性模型中使用ddply函数?x1 <- c(1:10, 1:10) x2 <- c(1:5, 1:5, 1:5, 1:5) x3 <- c(rep(1,5), rep(2,5), rep(1,5), rep(2,5)) set.seed(123) y <- r...

15得票2回答
在R中,dplyr相当于plyr :: ldply(tapply)的功能是什么?

我最终想要实现类似以下的功能,但是使用 dplyr 而不是 plyr:library(dplyr) probs = seq(0, 1, 0.1) plyr::ldply(tapply(mtcars$mpg, mtcars$cyl, ...

15得票2回答
使用ddply将函数应用于一组行

我经常使用ddply,但并不认为自己是专家。我有一个包含分组变量“Group”的数据框(df),其值为“A”、“B”和“C”,以及要汇总的变量“Var”具有数值。如果我使用ddply(df, .(Group), summarize, mysum=sum(Var)) 然后我获得了每个A、B和C的...

14得票1回答
有没有Python中与Hadley的ddply相似的实现?

我发现 Hadley 的 plyr 包对于 R 来说非常有用,它是一个用于转换数据的优秀 DSL。它解决的问题非常普遍,以至于在不使用 R 操作数据的其他编程语言中,我也会面临这个问题。请问是否有类似于 plyr 的 Python 模块存在呢?比如:def ddply(rows, *cols,...

14得票3回答
错误:withCallingHandlers导致R崩溃

我使用基于plyr的函数summarySE和ddply已有数月之久,一直没有任何问题。今天当我在 R 中运行我的极其基础的例程时,出现了一些错误信息,并导致 R 崩溃。 下面是一个示例代码以及在 R 崩溃前我获得的错误信息:install.packages("plyr") library(p...

14得票5回答
使用data.table汇总子总计和总计

我在R中有一个data.table:library(data.table) set.seed(1) DT = data.table( group=sample(letters[1:2],100,replace=TRUE), year=sample(2010:2012,100,repl...

14得票1回答
R语言的plyr包在3.0.2版本中不可用吗?

我尝试安装plyr包时收到警告消息,说它不适用于R 3.0.2版本。这是真的还是假的?如果不是,为什么我会收到这个消息?我尝试使用两个不同的CRAN镜像都得到了相同的消息。

14得票1回答
R ggplot和facet grid: 如何控制x轴断点

我正在尝试使用ggplot绘制每个日历年度中时间序列的变化,但是我在对x轴进行精细控制时遇到了问题。如果我不使用scale="free_x",那么我的x轴会显示出几年以及所涉及的年份,就像这样: 如果我使用scale="free_x",则如预期的那样,我会得到每个图的刻度标签,而且某些情...

14得票3回答
如何在使用ggplot2绘制的堆叠条形图上使用误差线

我在一个堆叠柱状图中无法正确放置误差线。根据之前的帖子,我使用了ddply来堆叠误差线。然后,这改变了堆叠的顺序,所以我对因子进行了排序。现在看起来一个柱状图的误差线是正确的,但另一个不正确。我想要的是一个看起来像下面这样的图表,只是用误差线显示标准误差。我列出了原始数据和ddply数据的dp...