我正在使用 R 进行工作,并拥有一个命名的字符向量列表。每个向量都描述了生物通路中存在的基因。
请看以下示例:
gene_sets = list(pathwayX= c("Gene3"),pathwayY= c("Gene2", "Gene3"),pathwayz= c("Gene1", "Gene2","Gene3"))
> gene_sets
$pathwayX
"Gene3"
$pathwayY
"Gene2" "Gene3"
$pathwayZ
"Gene1" "Gene2" "Gene3"
我想做的是将列表转换为二进制矩阵,以基因作为列,通路作为行。0表示通路中不存在该基因,1则表示通路存在该基因。
Gene1 | Gene2 | Gene3 | |
---|---|---|---|
pathwayX | 0 | 0 | 1 |
pathwayY | 0 | 1 | 1 |
pathwayZ | 1 | 1 | 1 |
mtabulate
,我找到了激发这个函数的问答:从标签向量列表创建标签频率数据框。我已经投票支持那个问题。当我有时间时,我会更新我的答案并进行基准测试。 - Zheyuan Li