我有一系列数据,显示某种类型的DNA元素在基因组中活跃的时间。它可能看起来像这样:
data.df <- data.frame(name=c("type1", "type1", "type1", "type2", "type2", "type2"),
active=c(9,11,10,21,21,18))
大约10年前有三个“type1”元素活跃,20年前有三个type2元素活跃。
我使用ggplot2创建了一个堆叠密度图,以获取每个元素活跃时间的分布情况,类似于以下内容:
ggplot(data.df, aes(x=active)) + geom_density(position="stack", aes(fill=name))
我有这些元素相对丰度的信息,想要将每个元素密度的高度乘以该数值。这将给我提供这些元素在基因组中的实际活性丰度,而不仅是它们的活动分布。
所以我的问题归结为:如何根据组别转换/乘以每个元素类型密度的高度?例如,如果我有1000个类型一元素和只有3个类型二元素在基因组中,堆叠密度图将被类型1主导,你几乎看不到与类型2相关的曲线。
希望这讲得清楚。谢谢!