12得票4回答
核密度估计的峰值

我需要尽可能准确地找到核密度估计的峰值(连续随机变量的众数)。我可以找到近似值:x<-rlnorm(100) d<-density(x) plot(d) i<-which.max(d$y) d$y[i] d$x[i] 但在计算 d$y 时,精确的函数是已知的。我如何找到众数的...

12得票5回答
数值错误:不再支持多维索引(例如 `obj[:, None]`)。请在索引之前将其转换为NumPy数组。

我正在尝试使用seaborn绘制直方图。当我尝试设置kde=True时,会返回以下错误: ValueError: 不再支持多维索引(例如obj[:, None])。请在索引之前将其转换为numpy数组。 sns.histplot(data=df, x='age', kde=True); ...

11得票2回答
Python绘制概率分布的百分比轮廓线

给定一个具有未知函数形式的概率分布(以下为示例),我希望绘制“基于百分位”的轮廓线,即对应于积分为10%,20%,...,90%等区域的轮廓线。## example of an "arbitrary" probability distribution ## from matplotlib.ml...

11得票1回答
使用高斯核密度(Python)计算一个值与一组值的平均值之间的差异。

我使用这段代码来计算这些值的高斯核密度。from random import randint x_grid=[] for i in range(1000): x_grid.append(randint(0,4)) print (x_grid) 这是计算高斯核密度的代码。from sta...

11得票1回答
从R中的核密度估计中获取值

我想在R中获取对股票价格的对数密度估计。 我知道可以使用plot(density(x))进行绘图。 但实际上,我需要函数的值。 我正在尝试实现核密度估计公式。 这是我目前的进展:a <- read.csv("boi_new.csv", header=FALSE) S = a[,3] #...

11得票4回答
Scipy的高斯核密度估计和循环数据

我正在使用scipy的gaussian_kde来获取一些双峰数据的概率密度。但是,由于我的数据是角度(以度数表示的方向),当值接近极限时,我遇到了问题。下面的代码给出了两个示例kde,在定义域为0-360时会低估,因为它无法处理数据的循环性质。pdf需要在单位圆上定义,但我找不到任何适用于这种...

10得票2回答
计算密度估计曲线下的面积,即概率。

我有一个数据密度估计(使用 density 函数)来处理我的数据 learningTime(见下图),我需要找到概率 Pr(learningTime > c),即从给定数字 c(红色垂直线)到曲线末端的密度曲线下的面积。有什么想法吗?

10得票3回答
整合2D核密度估计

我有一个包含点的 x,y 分布,通过 scipy.stats.gaussian_kde 得到 KDE。这是我的代码和输出结果(可以从这里获取 x,y 数据): import numpy as np from scipy import stats # Obtain data from fil...

9得票4回答
使用scipy.stats.gaussian_kde处理二维数据

我正在尝试使用{{link1:scipy.stats.gaussian_kde类}}来平滑一些带有纬度和经度信息的离散数据,以便最终显示为类似于等高线地图的形式,其中高密度是峰值,低密度是山谷。 我很难将二维数据集放入gaussian_kde类中。我已经尝试了一维数据的操作,所以我认为二维数...

9得票1回答
自适应带宽核密度估计

对于标准的多元或单元核密度估计,存在大量信息和工具可用于实现。然而,我目前正在处理的离散地理数据非常稀疏,并且倾向于聚集在高人口密度的地区。 也就是说,我有一些地图上的点(经度和纬度),我想根据这些点来估计概率密度,但我需要以某种方式标准化人口密度。通过查看周围,似乎这种问题的适当方法是实施...