让我先赞扬一下HoloViews的开发者,这个东西真的很神奇。只是由于它有很多组件,有点难以弄清楚如何将它们全部组合起来以实现我的目标 :)
我试图做多维数据绘图关联,即我希望有几个图表显示相同数据在不同维度上的视图。然后,我想利用Bokeh选择工具,在一个图表中选择数据,并查看其在其他图表中的位置。但我还需要使用Datashader来完成它,因为我的数据集很大。
这是我到目前为止的进展(在Python 2的Jupyter笔记本中运行)。
我试图做多维数据绘图关联,即我希望有几个图表显示相同数据在不同维度上的视图。然后,我想利用Bokeh选择工具,在一个图表中选择数据,并查看其在其他图表中的位置。但我还需要使用Datashader来完成它,因为我的数据集很大。
这是我到目前为止的进展(在Python 2的Jupyter笔记本中运行)。
import numpy as np
import pandas as pd
import holoviews as hv
import holoviews.operation.datashader as hvds
hv.notebook_extension('bokeh')
%opts Scatter [tools=['box_select', 'lasso_select']] (size=10 nonselection_color='red' color='blue') Layout [shared_axes=True shared_datasource=True]
# Create some data to plot
x1 = np.arange(0,10,1e-2)
x2 = np.arange(0,10,1e-2)
X1,X2 = np.meshgrid(x1,x2)
x1 = X1.flatten()
x2 = X2.flatten()
x3 = np.sin(x1) * np.cos(x2)
x4 = x1**2 + x2**2
# Pandas dataframe object from the data
print "Creating Pandas dataframe object"
df = pd.DataFrame.from_dict({"x1": x1, "x2": x2, "x3": x3, "x4": x4})
# Put the dataframe into a HoloViews table
dtab = hv.Table(df)
# Make some linked scatter plots using datashader
scat1 = dtab.to.scatter('x1', 'x2', [])
scat2 = dtab.to.scatter('x1', 'x3', [])
scat3 = dtab.to.scatter('x2', 'x4', [])
hvds.datashade(scat1) + hvds.datashade(scat2) + hvds.datashade(scat3)
这将产生以下结果:
这很简单易懂,但并不完全符合我的要求。数据范围和平移的更改是相互关联的,这非常棒,但是一个图表范围之外的数据仍然可以在其他图表上绘制。我希望所有图表中的数据都消失,只看到落在所有查看的数据范围内的数据,以便在多维空间中动态选择一些超立方体数据进行突出显示。
此外,最好使Bokeh选择工具以同样的方式工作,这样例如我可以选择某个图表上的一些点,并在其他图表上以红色或其他颜色显示它们。尽管我请求了'box_select'和'lasso_select',但我根本没有得到选择工具。我可能请求它们不正确,因为我不太清楚HoloViews如何传递选项。