使用scipy.ndimage.filters.gaussian_filter和scipy.stats.gaussian_kde函数对给定的数据集进行处理,如果分别适当选择这两个函数中的sigma
和bw_method
参数,则可以得到非常相似的结果。
例如,对于随机的二维点分布,通过在gaussian_filter
中设置sigma=2.
(左图)和在gaussian_kde
中设置bw_method=sigma/30.
(右图),可以得到以下图形:
显然这些参数之间存在关系,因为一个应用了高斯滤波器,另一个则是基于高斯核密度估计对数据进行处理。
各个参数的定义如下:
sigma : scalar or sequence of scalars Gaussian核的标准差。对于每个轴,高斯滤波器的标准差都以序列或单个数值的形式给出,如果是单个数值,则所有轴的标准差相等。
根据高斯算子的定义,我可以理解这一点:
- scipy.stats.gaussian_kde,
bw_method
:
在这种情况下,我们假设bw_method : str, scalar or callable, optional 用于计算估计带宽的方法。可选择‘scott’、‘silverman’、标量常数或可调用函数。如果是标量,则直接使用kde.factor。如果是可调用函数,则仅应该将一个gaussian_kde实例作为参数,并返回标量值。如果未指定(默认值),则使用‘scott’。有关更多详细信息,请参阅说明。
bw_method
的输入是一个标量(浮点数),以便与sigma
进行比较。我在这里迷失了,因为我找不到有关此kde.factor
参数的任何信息。我想知道的是,如果可能的话,连接这两个参数(即使用浮点数时的
sigma
和bw_method
)的精确数学方程式。
MWE:
import numpy as np
from scipy.stats import gaussian_kde
from scipy.ndimage.filters import gaussian_filter
import matplotlib.pyplot as plt
def rand_data():
return np.random.uniform(low=1., high=200., size=(1000,))
# Generate 2D data.
x_data, y_data = rand_data(), rand_data()
xmin, xmax = min(x_data), max(x_data)
ymin, ymax = min(y_data), max(y_data)
# Define grid density.
gd = 100
# Define bandwidth
bw = 2.
# Using gaussian_filter
# Obtain 2D histogram.
rang = [[xmin, xmax], [ymin, ymax]]
binsxy = [gd, gd]
hist1, xedges, yedges = np.histogram2d(x_data, y_data, range=rang, bins=binsxy)
# Gaussian filtered histogram.
h_g = gaussian_filter(hist1, bw)
# Using gaussian_kde
values = np.vstack([x_data, y_data])
# Data 2D kernel density estimate.
kernel = gaussian_kde(values, bw_method=bw / 30.)
# Define x,y grid.
gd_c = complex(0, gd)
x, y = np.mgrid[xmin:xmax:gd_c, ymin:ymax:gd_c]
positions = np.vstack([x.ravel(), y.ravel()])
# Evaluate KDE.
z = kernel(positions)
# Re-shape for plotting
z = z.reshape(gd, gd)
# Make plots.
fig, (ax1, ax2) = plt.subplots(1, 2)
# Gaussian filtered 2D histograms.
ax1.imshow(h_g.transpose(), origin='lower')
ax2.imshow(z.transpose(), origin='lower')
plt.show()
scipy.ndimage.filters.gaussian_filter
不接受bw
作为输入,而是使用sigma
,即高斯核的标准差。 - Hugues Fontenelle