20得票3回答
为什么dplyr的filter会从一个因子变量中删除NA值?

当我使用dplyr包中的filter函数来降低一个因子变量的级别时,filter也会删除NA值。这里有一个例子: library(dplyr) set.seed(919) (dat <- data.frame(var1 = factor(sample(c(1:3, NA), size ...

20得票5回答
按行列号对文件进行子集筛选

我们希望从一个文本文件中按行和列进行子集筛选,其中行号和列号从另一个文件中读取。需要排除表头(第一行)和行名(第一列)。 inputFile.txt 是一个制表符分隔的文本文件。header 62 9 3 54 6 1 25 1 2 3 4 5 6 9...

20得票3回答
根据列名的部分匹配来子集化数据

我需要将一个数据框子集化,以包含特定的字符串。其中一些是完整的列名,下面的代码可以很好地完成这个任务:testData[,c("FullColName1","FullColName2","FullColName3")] 我的问题是,我需要将其扩展到包括列名中包含特定字符串的情况,这些字符串可能...

19得票4回答
我能否将枚举定义为另一个枚举的子集?

注意: 这基本上是我昨天在Stackoverflow上发布的另一个问题(链接)。但是,我发现在那个问题中使用了一个不太能将我的想法归结到本质的糟糕例子。由于对原始帖子的所有回复都涉及第一个问题,因此我认为将新示例放在单独的问题中可能是一个更好的主意-无重复意图。 模拟具有移动功能的游戏角...

19得票6回答
从数据框中选择所有未出现在另一个数据框中的行

我正在尝试解决一个棘手的R问题,通过关键字搜索仍未能解决。具体来说,我正在尝试从一个数据框中选择一个子集,其值不出现在另一个数据框中。这是一个例子: > test number fruit ID1 ID2 item1 "number1" "apples" ...

19得票5回答
正则表达式用于过滤符合模式的字符串列表

我更多地使用R,而且在R中做起来更容易:> test <- c('bbb', 'ccc', 'axx', 'xzz', 'xaa') > test[grepl("^x",test)] [1] "xzz" "xaa" ...

19得票4回答
数据表中的子集操作

我想从R中的一个data.table(来自包data.table)中进行子集筛选,而不是从一个data.frame中筛选。我的关键字是一个四位数的年份。我希望通过选择一系列的年份来进行子集筛选。例如,我想提取所有来自1999年、2000年和2001年的记录。 我尝试在DT[J(year)] ...

18得票4回答
基于向量的值过滤数据框行

什么是从数据帧中过滤行的最佳方法,当要删除的值存储在向量中时? 在我的情况下,我有一个带日期的列,并想要删除几个日期。 我知道如何使用“!=”删除对应于一天的行,例如:m[m$date != "01/31/11", ] 为了删除一个向量中指定的多个日期,我尝试了以下方法:m...

18得票1回答
在R中基于ID选择多行记录

我试图根据它们的ID选择行。例如,在名为test的数据框中,ID 201有6行数据,ID 202也有6行数据,203、204等类推。 现在我只想从数据集中提取201和202,所以总共应该有12行。然而out <- test[test$ID==c(201,202), ] out <...

18得票6回答
为什么使用名称进行子集(即删除)列操作不可行?

我非常担心这个问题已经被问过并且会被踩,但我在文档中没有找到答案(?"["), 而且发现很难搜索。data(wines) # This is allowed: alcoholic <- wines[, 1] alcoholic <- wines[, "alcohol"] nonal...