我有一个由一组点在表格中定义的复杂曲线,如下所示(完整的表格在这里):
# x y
1.0577 12.0914
1.0501 11.9946
1.0465 11.9338
...
如果我使用以下命令绘制此表格:
plt.plot(x_data, y_data, c='b',lw=1.)
plt.scatter(x_data, y_data, marker='o', color='k', s=10, lw=0.2)
我获得了以下内容:
其中,我手动添加了红点和线段。我需要的是一种计算每个点这些线段的方法,即:找到在此2D空间中给定点到插值曲线的最小距离的方法。
我不能使用数据点本身的距离(生成蓝色曲线的黑色点),因为它们不位于等间隔位置,有时它们接近,有时它们相距很远,这会深刻影响我的后续结果。
由于这不是一条行为良好的曲线,我真的不知道该怎么做。 我尝试用 UnivariateSpline 进行插值,但返回很差的拟合结果:
# Sort data according to x.
temp_data = zip(x_data, y_data)
temp_data.sort()
# Unpack sorted data.
x_sorted, y_sorted = zip(*temp_data)
# Generate univariate spline.
s = UnivariateSpline(x_sorted, y_sorted, k=5)
xspl = np.linspace(0.8, 1.1, 100)
yspl = s(xspl)
# Plot.
plt.scatter(xspl, yspl, marker='o', color='r', s=10, lw=0.2)
我也尝试了增加插值点的数量,但结果混乱不堪:
# Sort data according to x.
temp_data = zip(x_data, y_data)
temp_data.sort()
# Unpack sorted data.
x_sorted, y_sorted = zip(*temp_data)
t = np.linspace(0, 1, len(x_sorted))
t2 = np.linspace(0, 1, 100)
# One-dimensional linear interpolation.
x2 = np.interp(t2, t, x_sorted)
y2 = np.interp(t2, t, y_sorted)
plt.scatter(x2, y2, marker='o', color='r', s=10, lw=0.2)
如果您有任何想法/指针,将不胜感激。