Datashader在HoloViews中的点着色和聚合方法选择

Question

Datashader在HoloViews中的点着色和聚合方法选择

pythonjupyter-notebookbokehholoviewsdatashader

3

我的目标是在HoloViews中使用Datashader创建x、y、z散点图，其中点通过最小化'z'进行聚合，点的颜色根据'z'进行着色。最终目的是生成概率轮廓图等内容。

我已经在HoloViews+Datashader中有了不错的进展，甚至以酷炫的方式链接了这些图形（例如参见如何在HoloViews与Datashader+Bokeh后端中进行数据链接选择），但我无法控制点的颜色和聚合方法。

以下代码（在Jupyter笔记本中运行）在"普通香草" Datashader + Bokeh中做到了（几乎）我想要的效果。如何通过HoloViews实现同样的效果，以便利用该包中的优秀功能？

特别需要注意的是，我希望将颜色分配给特定的z值，并且不要自动归一化或类似的事情。我尝试在下面的代码中通过设置'span'参数在'shade'函数中实现这一点，但它并不完全有效，因为当我放大图时，我会看到新的绿色区域出现，这表明颜色的绝对归一化并没有保持恒定。无论如何，它应该足够接近以说明我的意思。

import pandas as pd
from bokeh.plotting import figure, output_notebook
import datashader as ds
from datashader.bokeh_ext import InteractiveImage
from datashader import transfer_functions as tf

output_notebook(hide_banner=True)

import matplotlib.colors as colors

#Define colormap
mn=0
mx=5
s0=0./(mx-mn)
s1=1./(mx-mn)
s2=2./(mx-mn)
s3=3./(mx-mn)
s4=4./(mx-mn)
s5=5./(mx-mn)

cdict = {
'red'  :  ((s0, 0., 0.), (s1, 1., 1.), (s2, 1., 1.), (s3, 1., 1.), (s4, .5, .5), (s5, .2, .2)),
'green':  ((s0, 1., 1.), (s1, 1., 1.), (s2, .5, .5), (s3, 0., 0.), (s4, 0., 0.), (s5, 0., 0.)),
'blue' :  ((s0, 0., 0.), (s1, 0., 0.), (s2, 0., 0.), (s3, 0., 0.), (s4, 0., 0.), (s5, 0., 0.))
}

chi2cmap = colors.LinearSegmentedColormap('chi2_colormap', cdict, 1024)
chi2cmap.set_bad('w',1.)


# Create some data to plot
x = np.arange(0,10,1e-2)
y = np.arange(0,10,1e-2)
X,Y = np.meshgrid(x,y)
x = X.flatten()
y = Y.flatten()
z = 5 * np.sin(x) * np.cos(y)

#------ Create pandas dataframe object from the data ------
print "Creating Pandas dataframe object"
df = pd.DataFrame.from_dict({"x": x, "y": y, "z": z})

# Create callback function for bokeh
def create_image(x_range, y_range, w, h):
    cvs = ds.Canvas(x_range=x_range, y_range=y_range, plot_width=200, plot_height=200)
    agg = cvs.points(df, 'x', 'y', ds.min('z'))
    img = tf.shade(agg, cmap=chi2cmap, how='linear', span=[mn,mx])
    #return tf.dynspread(img, threshold=0.9, max_px=10)
    return img

# Export image
#ds.utils.export_image(img, "test", fmt=".png", export_path=".", background="white")

# Interactive image via bokeh
p = figure(tools='pan,wheel_zoom,box_zoom,reset', background_fill_color="white",
           plot_width=500, plot_height=500, x_range=(np.min(x),np.max(x)), y_range=(np.min(y),np.max(y)))

p.axis.visible = False
p.xgrid.grid_line_color = None
p.ygrid.grid_line_color = None
InteractiveImage(p, create_image)

带输出的

- Ben Farmer

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Ben Farmer · Accepted Answer

我似乎已经成功了，这是我的解决方案。关键是创建一个派生自holoviews.operation.datashader.datashade的新类，并在那里更改聚合器和cmap数据成员：

class chi2_datashade(hvds.datashade):
    """Custom datashade class to do our projection and colormap"""
    aggregator = ds.min('z')
    cmap = chi2cmap
    normalization = 'linear'
    span = [mn,mx] # this requires https://github.com/ioam/holoviews/pull/1508 to work, which I just hacked in to holoviews for now

然后像使用原始的datashade类一样使用它：

data = hv.Points(df)
chi2_datashade(data)

在 span 数据成员方面存在问题，因为它不存在且未连接到底层的 datashader 选项。但这个问题将在即将推出的版本中得到解决，如果您想自己处理它，可以轻松更改源代码（请参见https://github.com/ioam/holoviews/pull/1508）。

实际上还有另一个问题，这次来自于 datashader，即它会根据最小值内部偏移 'z' 数据，并因此破坏 'span' 参数的含义。我向他们提出了这个问题，但如果您想自己处理，也可以在源代码中进行相当简单的修复（请参见https://github.com/bokeh/datashader/issues/368）。

以下是完整示例：

import numpy as np
import pandas as pd
import datashader as ds
import holoviews as hv
import holoviews.operation.datashader as hvds
import matplotlib.colors as colors
hv.notebook_extension('bokeh')

#Define colormap
mn=0
mx=5
s0=0./(mx-mn)
s1=1./(mx-mn)
s2=2./(mx-mn)
s3=3./(mx-mn)
s4=4./(mx-mn)
s5=5./(mx-mn)

cdict = {
'red'  :  ((s0, 0., 0.), (s1, 1., 1.), (s2, 1., 1.), (s3, 1., 1.), (s4, .5, .5), (s5, .2, .2)),
'green':  ((s0, 1., 1.), (s1, 1., 1.), (s2, .5, .5), (s3, 0., 0.), (s4, 0., 0.), (s5, 0., 0.)),
'blue' :  ((s0, 0., 0.), (s1, 0., 0.), (s2, 0., 0.), (s3, 0., 0.), (s4, 0., 0.), (s5, 0., 0.))
}

chi2cmap = colors.LinearSegmentedColormap('chi2_colormap', cdict, 1024)
chi2cmap.set_bad('w',1.)


# Create some data to plot
x = np.arange(0,10,1e-2)
y = np.arange(0,10,1e-2)
X,Y = np.meshgrid(x,y)
x = X.flatten()
y = Y.flatten()
z = 5 * np.sin(x) * np.cos(y)

#------ Create pandas dataframe object from the data ------
print "Creating Pandas dataframe object"
df = pd.DataFrame.from_dict({"x": x, "y": y, "z": z})

class chi2_datashade(hvds.datashade):
    """Custom datashade class to do our projection and colormap"""
    aggregator = ds.min('z')
    cmap = chi2cmap
    normalization = 'linear'
    span = [mn,mx] # this requires https://github.com/ioam/holoviews/pull/1508 to work, which I just hacked in to holoviews for now


data = hv.Points(df)
chi2_datashade(data)

这段代码生成了以下图片：

这张图片与原始图片有些不同，但是这只是由于我提到的datashader错误导致的。修复该错误并重新运行原始代码后，我得到了以下输出：

这两张图片非常相似。看起来Holoviews只是在所选“跨度”之外剪切数据，这对我目前的需求来说还可以接受。