我想比较一组得分(score
)的分布,这些得分按某些类别(centrality
)分组并按其他类别(model
)着色。我已经尝试使用seaborn实现:
plt.figure(figsize=(14,6))
seaborn.boxplot(x="centrality", y="score", hue="model", data=data, palette=seaborn.color_palette("husl", len(models) +1))
seaborn.despine(offset=10, trim=True)
plt.savefig("/home/i11/staudt/Eval/properties-replication-test.pdf", bbox_inches="tight")
这个图有一些问题:
- 存在大量离群点,我不喜欢它们在这里如何绘制。我能否删除它们?我能否改变外观以显示更少的混乱?至少可以将它们的颜色设置为匹配框的颜色吗?
model
值original
很特殊,因为所有其他分布都应与original
的分布进行比较。这应该在可视化中反映出来。我能否使每个组的第一个框为original
?我能否以某种方式偏移或标记它?是否可能通过每个original
分布和箱子组之间穿过中位数的水平线来绘制?- 一些
score
的值非常小,如何正确缩放y轴以显示它们?
编辑:
这里是一个使用对数刻度的y轴的示例-但还不是理想的。为什么一些框似乎在低端被截断了?