直方图和散点图是可视化数据和变量关系的很好的方法,但最近我一直在思考我错过了哪些可视化技术。你认为最不常用的图表类型是什么?
回答应该:
- 在实践中不是非常常用。
- 不需要太多的背景讨论就可以理解。
- 适用于许多常见情况。
- 包括可重复运行的代码示例(最好用R),可以附带链接图片。
回答应该:
除了Tufte先生出色的作品外,我还推荐William S. Cleveland的书籍:Visualizing Data和The Elements of Graphing Data。它们不仅内容优秀,而且都是用R完成的,我相信这些代码可以公开获取。
箱线图!以下是R帮助文档中的示例:
boxplot(count ~ spray, data = InsectSprays, col = "lightgray")
在我看来,这是一个快速查看数据或比较分布的最方便的方法。
对于更复杂的分布,有一个名为vioplot
的扩展。
我认为马赛克图表满足所提到的所有四个标准。在 R 中有一些示例,可以使用 mosaicplot 进行查看。
请查看Edward Tufte的作品,特别是这本书。
你也可以尝试观看并参加他的巡回演讲。非常好,包括四本他的书。(我发誓我不拥有他出版商的股票!)
顺便说一下,我喜欢他的微线条数据可视化技术。惊喜!Google已经写好并发布在Google Code上。