8得票2回答
如何在除一个列外的所有列上进行聚合?

我需要在数据框的所有列上进行`gather_`操作,除了其中一列。例如: # I want to generate a dataframe whose column names are the letters of the alphabet. If you know of a simpler...

8得票3回答
快速的数据表操作

我正在寻找一些处理data.table对象的模式,这些对象的结构类似于使用reshape2包中的melt创建的数据框。我正在处理数百万行的数据表。性能至关重要。 问题的通用形式是是否有一种方法可以根据某列中的部分值进行分组,并使分组操作的结果创建一个或多个新列。 一个具体的问题形式可能是如...

8得票2回答
如何使用“重复”列重新整理数据框?

我是一名初学者,想学习使用R进行数据分析。最近我得到了一个预先格式化的环境观测模型数据集,以下是其中的一个示例子集: date site obs mod site obs mod 2000-09-01 0...

8得票4回答
reshape2:聚合函数的多个结果?

根据我所阅读的,reshape2中的*cast操作失去了result_variable功能。Hadley暗示使用plyr来实现此目的(将多个结果列附加到输入数据框中)。我该如何实现文档示例... aqm <- melt(airquality, id=c("month", "day"),...

8得票2回答
R reshape2中cast()调用自定义聚合函数出错

我想使用R来总结带有非唯一行名的数字数据表,生成一个具有唯一行名的结果表,其中使用自定义函数汇总值。汇总逻辑是:如果最大值与最小值的比率小于1.5,则使用值的平均值,否则使用中位数。由于表非常大,我尝试使用reshape2包中的melt()和cast()函数。 # 带有非唯一行名的示例表 t...

8得票1回答
如何将一个具有“四重嵌套”的多级结构的宽数据框转换为长数据框?

我进行了一项研究,回顾起来(人生经验教训:-))似乎生成了多层数据。现在我正在尝试将数据集从宽格式重构为长格式,以便使用例如lme4进行分析。 在这样做的过程中,我遇到了一个问题,这个问题我之前遇到过几次,但我从未找到好的解决方案。这次我再次搜索,但我可能使用了错误的关键字,或者这个问题比我...

8得票2回答
计算矩阵的总和

假设我有一个数据框,其中包含几列分类数据和一列定量数据。以下是一个示例: my_data <- structure(list(A = c("f", "f", "f", "f", "t", "t", "t", "t"), B = c(...

8得票3回答
从多列长数据到宽数据

我应该如何平稳地从foo过渡到foo2(最好使用tidyr或reshape2包)?这有点像this question,但我不想自动编号列,只想扩展多个列。它也有点像this question,但我认为我不想让列随着行值而变化。或者,对这个问题的一个有效答案是说服我它与其他问题完全相同。目前,“...

7得票5回答
将列值转换为它们自己的二进制编码列(虚拟变量)

我有一些CSV文件,其列包括性别、年龄、诊断等。 目前,它们被编码为这样: ID, gender, age, diagnosis 1, male, 42, asthma 1, male, 42, anxiety 2, male, 19, asthma 3, fem...

7得票2回答
Spread和dcast的区别

我有一个像这样的表格: > head(dt2) Weight Height Fitted interval limit value 1 65.6 174.0 71.91200 pred lwr 53.73165 2 80.7 193.5 91.63...