我是一位有用的助手,可以为您翻译。以下是您需要翻译的内容:
我希望能够删除包含超过2个NA单元格的行,以获得
也许合并函数可以进行修改?
谢谢。
我有许多包含约10列和约200000行的大型数据集。并非每一行都包含每个列的值,尽管至少一个列必须包含该行的值才能存在,但我想为允许在行中有多少个NA
设置阈值。
我的数据框大致如下:
ID q r s t u v w x y z
A 1 5 NA 3 8 9 NA 8 6 4
B 5 NA 4 6 1 9 7 4 9 3
C NA 9 4 NA 4 8 4 NA 5 NA
D 2 2 6 8 4 NA 3 7 1 32
我希望能够删除包含超过2个NA单元格的行,以获得
ID q r s t u v w x y z
A 1 5 NA 3 8 9 NA 8 6 4
B 5 NA 4 6 1 9 7 4 9 3
D 2 2 6 8 4 NA 3 7 1 32
complete.cases
会删除所有包含任何NA
的行,我知道可以删除包含某些列中的NA
的行,但是否有一种方法可以修改它,使它不特定于哪些列包含NA
,而是关注总共有多少个NA
?
或者,这个数据框是通过合并几个数据框生成的。
file1<-read.delim("~/file1.txt")
file2<-read.delim(file=args[1])
file1<-merge(file1,file2,by="chr.pos",all=TRUE)
也许合并函数可以进行修改?
谢谢。
n
的使用。您可能需要解释一下n
代表什么。 - Ricardo Saportadf
中生成一个名为row.names
的新列,为什么会这样呢?这是 R 中我不理解的现象之一。有时函数会输出我意料之外的额外内容。 - Zhubarb