Datashader在HoloViews中的点着色和聚合方法选择

3
我的目标是在HoloViews中使用Datashader创建x、y、z散点图,其中点通过最小化'z'进行聚合,点的颜色根据'z'进行着色。最终目的是生成概率轮廓图等内容。
我已经在HoloViews+Datashader中有了不错的进展,甚至以酷炫的方式链接了这些图形(例如参见如何在HoloViews与Datashader+Bokeh后端中进行数据链接选择),但我无法控制点的颜色和聚合方法。
以下代码(在Jupyter笔记本中运行)在"普通香草" Datashader + Bokeh中做到了(几乎)我想要的效果。如何通过HoloViews实现同样的效果,以便利用该包中的优秀功能?
特别需要注意的是,我希望将颜色分配给特定的z值,并且不要自动归一化或类似的事情。我尝试在下面的代码中通过设置'span'参数在'shade'函数中实现这一点,但它并不完全有效,因为当我放大图时,我会看到新的绿色区域出现,这表明颜色的绝对归一化并没有保持恒定。无论如何,它应该足够接近以说明我的意思。
import pandas as pd
from bokeh.plotting import figure, output_notebook
import datashader as ds
from datashader.bokeh_ext import InteractiveImage
from datashader import transfer_functions as tf

output_notebook(hide_banner=True)

import matplotlib.colors as colors

#Define colormap
mn=0
mx=5
s0=0./(mx-mn)
s1=1./(mx-mn)
s2=2./(mx-mn)
s3=3./(mx-mn)
s4=4./(mx-mn)
s5=5./(mx-mn)

cdict = {
'red'  :  ((s0, 0., 0.), (s1, 1., 1.), (s2, 1., 1.), (s3, 1., 1.), (s4, .5, .5), (s5, .2, .2)),
'green':  ((s0, 1., 1.), (s1, 1., 1.), (s2, .5, .5), (s3, 0., 0.), (s4, 0., 0.), (s5, 0., 0.)),
'blue' :  ((s0, 0., 0.), (s1, 0., 0.), (s2, 0., 0.), (s3, 0., 0.), (s4, 0., 0.), (s5, 0., 0.))
}

chi2cmap = colors.LinearSegmentedColormap('chi2_colormap', cdict, 1024)
chi2cmap.set_bad('w',1.)


# Create some data to plot
x = np.arange(0,10,1e-2)
y = np.arange(0,10,1e-2)
X,Y = np.meshgrid(x,y)
x = X.flatten()
y = Y.flatten()
z = 5 * np.sin(x) * np.cos(y)

#------ Create pandas dataframe object from the data ------
print "Creating Pandas dataframe object"
df = pd.DataFrame.from_dict({"x": x, "y": y, "z": z})

# Create callback function for bokeh
def create_image(x_range, y_range, w, h):
    cvs = ds.Canvas(x_range=x_range, y_range=y_range, plot_width=200, plot_height=200)
    agg = cvs.points(df, 'x', 'y', ds.min('z'))
    img = tf.shade(agg, cmap=chi2cmap, how='linear', span=[mn,mx])
    #return tf.dynspread(img, threshold=0.9, max_px=10)
    return img

# Export image
#ds.utils.export_image(img, "test", fmt=".png", export_path=".", background="white")

# Interactive image via bokeh
p = figure(tools='pan,wheel_zoom,box_zoom,reset', background_fill_color="white",
           plot_width=500, plot_height=500, x_range=(np.min(x),np.max(x)), y_range=(np.min(y),np.max(y)))

p.axis.visible = False
p.xgrid.grid_line_color = None
p.ygrid.grid_line_color = None
InteractiveImage(p, create_image)

带输出的

输入图像描述

1个回答

5

我似乎已经成功了,这是我的解决方案。关键是创建一个派生自holoviews.operation.datashader.datashade的新类,并在那里更改聚合器和cmap数据成员:

class chi2_datashade(hvds.datashade):
    """Custom datashade class to do our projection and colormap"""
    aggregator = ds.min('z')
    cmap = chi2cmap
    normalization = 'linear'
    span = [mn,mx] # this requires https://github.com/ioam/holoviews/pull/1508 to work, which I just hacked in to holoviews for now

然后像使用原始的datashade类一样使用它:

data = hv.Points(df)
chi2_datashade(data)

span 数据成员方面存在问题,因为它不存在且未连接到底层的 datashader 选项。但这个问题将在即将推出的版本中得到解决,如果您想自己处理它,可以轻松更改源代码(请参见https://github.com/ioam/holoviews/pull/1508)。

实际上还有另一个问题,这次来自于 datashader,即它会根据最小值内部偏移 'z' 数据,并因此破坏 'span' 参数的含义。我向他们提出了这个问题,但如果您想自己处理,也可以在源代码中进行相当简单的修复(请参见https://github.com/bokeh/datashader/issues/368)。

以下是完整示例:

import numpy as np
import pandas as pd
import datashader as ds
import holoviews as hv
import holoviews.operation.datashader as hvds
import matplotlib.colors as colors
hv.notebook_extension('bokeh')

#Define colormap
mn=0
mx=5
s0=0./(mx-mn)
s1=1./(mx-mn)
s2=2./(mx-mn)
s3=3./(mx-mn)
s4=4./(mx-mn)
s5=5./(mx-mn)

cdict = {
'red'  :  ((s0, 0., 0.), (s1, 1., 1.), (s2, 1., 1.), (s3, 1., 1.), (s4, .5, .5), (s5, .2, .2)),
'green':  ((s0, 1., 1.), (s1, 1., 1.), (s2, .5, .5), (s3, 0., 0.), (s4, 0., 0.), (s5, 0., 0.)),
'blue' :  ((s0, 0., 0.), (s1, 0., 0.), (s2, 0., 0.), (s3, 0., 0.), (s4, 0., 0.), (s5, 0., 0.))
}

chi2cmap = colors.LinearSegmentedColormap('chi2_colormap', cdict, 1024)
chi2cmap.set_bad('w',1.)


# Create some data to plot
x = np.arange(0,10,1e-2)
y = np.arange(0,10,1e-2)
X,Y = np.meshgrid(x,y)
x = X.flatten()
y = Y.flatten()
z = 5 * np.sin(x) * np.cos(y)

#------ Create pandas dataframe object from the data ------
print "Creating Pandas dataframe object"
df = pd.DataFrame.from_dict({"x": x, "y": y, "z": z})

class chi2_datashade(hvds.datashade):
    """Custom datashade class to do our projection and colormap"""
    aggregator = ds.min('z')
    cmap = chi2cmap
    normalization = 'linear'
    span = [mn,mx] # this requires https://github.com/ioam/holoviews/pull/1508 to work, which I just hacked in to holoviews for now


data = hv.Points(df)
chi2_datashade(data)

这段代码生成了以下图片:

输入图像描述

这张图片与原始图片有些不同,但是这只是由于我提到的datashader错误导致的。修复该错误并重新运行原始代码后,我得到了以下输出:

输入图像描述

这两张图片非常相似。看起来Holoviews只是在所选“跨度”之外剪切数据,这对我目前的需求来说还可以接受。


1
请注意,您可以使用以下参数创建实例,而不是像那样子类化datashade操作:hvds.datashade.instance(aggregator=ds.min('z'), cmap=chi2cmap, normalization='linear', span=(mn, max)) - philippjfr

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接