在R中使用apply()函数与用户定义的函数相关。

6
我有一个数据框,其中包含按照投票和政党标签排列的数据。
dat <- data.frame( v1=c(25, 0, 70), 
                   v2=c(75, 100, 20), 
                   v3=c(0, 0, 10), 
                   l1=c("pA", ".", "pB"), 
                   l2=c("pB", "pC", "pC"), 
                   l3=c(".", ".", "pD") )

使每行成为分析的单位。仅需考虑获取投票的政党,此函数提取积极的选票或相应的标签。

getpos <- function(vector, vorl="v"){ # change to "l" to report labels
    vot <- vector[grep( "v", colnames(vector) )]; 
    lab <- vector[grep( "l", colnames(vector) )];
    if (vorl=="v") {vot[vot>0]} else {lab[vot>0]};
}
getpos(dat[1,])           # votes for obs 1
getpos(dat[1,], vorl="l") # labels for obs 1

我希望在数据框dat的每一行中运行函数getpos,以产生不同长度的投票/标签向量列表。但应用该函数没有返回我期望的结果:

apply(X=dat, MARGIN=1, FUN=getpos, vorl="l")

有人能发现问题吗?此外,这是否可以更有效地实现?


apply 的第一件事是将 dat 转换为矩阵,这将导致所有数字被转换为字符。您需要从根本上重新思考如何组织这些数据。可能需要采用长格式而不是宽格式。 - joran
赞同@joran的评论 - 如果您重新组织为类似于data.frame(number=c(1,1,2,3,3,3), party=c("pA","pB","pC","pB","pC","pD"), votes=c(25,75,100,70,20,10)),那么您将更好地使用聚合函数等。 - thelatemail
@joran的组织建议看起来很有前途,我会尝试并报告。谢谢! - emagar
1个回答

11

这里发生的是,数据框中的行在被apply提取后不再具有列名(但它们仍然有names):

尝试:

getpos <- function(x, vorl="v"){ 
     vot <- x[grep( "v", names(x) )] ;  lab <- x[grep( "l", names(x) )];
     if (vorl=="v") {vot[vot>0]} else {lab[vot>0]};
 }

> apply(dat, MARGIN=1, FUN=function(x2) getpos(x2, vorl="l") )
#-------------
[[1]]
  l1 
"pA" 

[[2]]
  l2 
"pC" 

[[3]]
  l1   l3 
"pB" "pD" 

1
感谢 @DWin 解释了 apply 的作用。你的解决方案似乎很好用。感谢你分享知识! - emagar

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接