使用eulerr制作准确的维恩图

3

我想使用eulerr包创建Venn图。我有两个列表,希望用它们来创建Venn图。其中一个列表是第一个列表的子集。奇怪的是,eulerr似乎认为列表中只有一个值。

b

这是针对特定子集的独特值。我似乎无法确定它认为哪些值是唯一的。

https://pastebin.com/J7tPcfAt

> length(a)
[1] 3278

> length(b)
[1] 1318

当我检查子集之间的重叠时,我得到了预期的结果。
> length(which(a %in% b))
[1] 1318

> length(which((b %in% a)))
[1] 1318

> length(which(!(b %in% a)))
[1] 0

> length(which(!(a %in% b)))
[1] 1960

但是当我使用eulerr绘制一个维恩图时,我得到了:
library(eulerr)
fit <- euler(list("A" = a, "B" = b))
plot(fit, counts = TRUE)

在这里输入图片描述

值得注意的是,eulerr认为唯一属于A的值的数量比我使用的数量多一个。

length(which(!(a %in b)))

非常感谢您对这种行为的理解和帮助!


1
你可以通过 https://pastebin.com/ 分享数据。 - brettljausn
谢谢!刚刚更新了问题,通过pastebin包含了列表。 - John Gagnon
1个回答

3
我找到了导致这种行为的原因,但我无法解释为什么。这是因为在a和b中都有重复值,并且这个值是相同的。
> a[duplicated(a)]
[1] "Crybg3"
> b[duplicated(b)]
[1] "Crybg3"

如果我从这两个向量中删除这个值,它就可以正常工作。

a1 <- a[!duplicated(a)]
b1 <- b[!duplicated(b)]

fit <- euler(list("A" = a1, "B" = b1))
plot(fit, counts = TRUE)

> fit
    original fitted residuals region_error
A       1960   1960         0            0
B          0      0         0            0
A&B     1317   1317         0            0

diag_error:  0 
stress:      0 

enter image description here


2
我是这个包的作者。列表中的项目(用于列表方法)不应包含任何重复项,将每个集合的内容视为可以属于集合或不属于集合的人,不能在集合中重复出现两次。在下一个更新中,我会确保函数检查这一点。 - Johan Larsson

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接