在IPython笔记本(Bokeh)中绘制大型数据集

10

我有一个大型数据集,想在IPython笔记本中绘制它。

我使用read_csv将0.5GB的.csv文件读入Pandas DataFrame中,这需要大约两分钟。然后我尝试绘制这些数据。

data = pd.read_csv('large.csv')
output_notebook()
p1 = figure()
p1.circle(data.index, data['myDataset'])
show(p1)

我的浏览器一直在旋转,没有显示任何图形。我尝试了以下方法:
  1. 使用output_file()代替output_notebook()
  2. 使用ColumnSource对象作为source参数来绘制图形
  3. 将我的数据降采样到更可管理的范围。
Bokeh在其网站上声称可以提供“对非常大的或流式数据集的高性能交互”。如何在不使计算机崩溃的情况下可视化这些大型数据集?
1个回答

10
这个问题过于宽泛,无法提供任何具体的代码建议。我很想知道您尝试的下采样大小是多少。默认的Bokeh HTML Canvas肯定可以容纳数万个圆。有一些选择:

你好 @bigreddot,能否请您看一下我的这个问题,我真的很难得到解决方案。http://stackoverflow.com/questions/36207525/how-to-generate-multiple-plots-by-clicking-a-single-plot-for-more-infomation-usi - Sandy
那个问题似乎是关于Matplotlib的,而不是关于Bokeh的。恐怕我对Matplotlib并不了解。 - bigreddot
感谢您的快速回复,在Bokeh中我能实现我的要求吗? - Sandy
很抱歉,您提供的问题链接已经失效,所以我无法回答。 - bigreddot

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接