I have a data frame which looks like:
df = read.table(text="S00001 S00002 S00003 S00004 S00005 S00006
GG AA GG AA GG AG
CC TT TT TC TC TT
TT CC CC TT TT TT
AA AA GG AA AG AA
TT CC CC TT TC TT
GG GG GG AA GG GG", header=T, stringsAsFactors=F)
我想要统计每一行中具有相同字母的字符数量(例如:"AA"、"CC"、"GG"或"TT")。我的做法是使用table()函数来计算所有元素,并根据列表名称是否为"homo"生成另一个列表。我尝试对这些列表进行子集操作,但未成功。以下是我的脚本:
A <- apply(df,1, function(x) table(x))
B <- apply(df,1, function(x) (names(table(x)) %in% c("AA","CC","GG","TT")))
A[B] ## this didn't work
我希望会生成一个数据框架:
我期待会生成一个数据框架:
2 3
1 3
2 4
4 1
2 3
1 5
非常感谢任何帮助。
c("AA","CC","GG","TT")
是你唯一的双字母选项? - David Arenburg