使用多个独立变量的Python curve_fit

70

Python的curve_fit函数可以计算仅有一个自变量的函数的最佳拟合参数,但是是否有一种方法,可以使用curve_fit或其他方法来拟合具有多个自变量的函数?例如:

def func(x, y, a, b, c):
    return log(a) + b*log(x) + c*log(y)

其中x和y是自变量,我们希望拟合出a、b和c的值。

5个回答

88

您可以将多维数组传递给curve_fit作为自变量,但是您的func必须接受相同的内容。例如,将此数组称为X,并将其解包以获得更清晰的xy:

import numpy as np
from scipy.optimize import curve_fit

def func(X, a, b, c):
    x,y = X
    return np.log(a) + b*np.log(x) + c*np.log(y)

# some artificially noisy data to fit
x = np.linspace(0.1,1.1,101)
y = np.linspace(1.,2., 101)
a, b, c = 10., 4., 6.
z = func((x,y), a, b, c) * 1 + np.random.random(101) / 100

# initial guesses for a,b,c:
p0 = 8., 2., 7.
print(curve_fit(func, (x,y), z, p0))

给出拟合结果:

(array([ 9.99933937,  3.99710083,  6.00875164]), array([[  1.75295644e-03,   9.34724308e-05,  -2.90150983e-04],
   [  9.34724308e-05,   5.09079478e-06,  -1.53939905e-05],
   [ -2.90150983e-04,  -1.53939905e-05,   4.84935731e-05]]))

3
如果x和y的大小不同,有没有办法修改解决方案以使用曲线拟合。例如,x = linspace(0.1,1.1,101) 和 y = np.array([1.0,2.0])? - Scott G
1
我不确定我理解你的意思:func代表一个双变量函数(接受两个独立变量),因此对于拟合,它应该被定义为给出任何提供的输入值x_i和y_i的结果f(x_i,y_i)。如果x和y的大小不相同,则尝试在某些x处评估它,但y未定义,这肯定是无法完成的。 - xnx
5
我想分享我所遇到的与@ScottG相同的问题的解决方案。在x方向上有20个样本,在y方向上有30个样本,每个交叉点都有数据(20x30 = 600个样本总数)。我使用了x,y = np.mesgrid(x,y),然后使用np.stack((x,y), axis=2).reshape(-1, 2)来获取一个(600,2)的数组,它将成为xdata,包含所有600种x和y的组合。然后,我将这600个样本的数据从2D的(20,30)数组扁平化为1D的(600,)数组,即ydata。然后,您可以使用 x, y = np.hsplit(X, 2) 来在函数中拆分您的数据。(Xxdata)。 - Maxis
关于类似维度问题的后续观察:如果我的数组X包含不同类型的变量,会怎么样?在这里,我有x0, x4, y0, mylistcurve_fit似乎在内部将它们解包成numpy数组,但在mylist上遇到了错误。我得到的错误信息是:"ValueError: setting an array element with a sequence. The requested array has an inhomogeneous shape after 1 dimensions. The detected shape was (4,) + inhomogeneous part." 你有什么办法可以解决这个问题吗?令人惊讶的是,leastsq似乎可以工作,而我原以为curve_fit只是它的一个包装器。 - undefined

5

优化具有多个输入维度和可变参数数量的函数

该示例演示了如何通过增加系数数量来拟合具有二维输入(R^2 -> R)的多项式。该设计非常灵活,因此可调用 f 函数来自 curve_fit 只需一次定义即可对任意数量的非关键字参数进行操作。

enter image description here

最小可重现示例

import numpy as np
import matplotlib.pyplot as plt
from scipy.optimize import curve_fit

def poly2d(xy, *coefficients):
    x = xy[:, 0]
    y = xy[:, 1]
    proj = x + y
    res = 0
    for order, coef in enumerate(coefficients):
        res += coef * proj ** order
    return res

nx = 31
ny = 21

range_x = [-1.5, 1.5]
range_y = [-1, 1]
target_coefficients = (3, 0, -19, 7)

xs = np.linspace(*range_x, nx)
ys = np.linspace(*range_y, ny)
im_x, im_y = np.meshgrid(xs, ys)
xdata = np.c_[im_x.flatten(), im_y.flatten()]
im_target = poly2d(xdata, *target_coefficients).reshape(ny, nx)

fig, axs = plt.subplots(2, 3, figsize=(29.7, 21))
axs = axs.flatten()

ax = axs[0]
ax.set_title('Unknown polynomial P(x+y)\n[secret coefficients: ' + str(target_coefficients) + ']')
sm = ax.imshow(
    im_target,
    cmap = plt.get_cmap('coolwarm'),
    origin='lower'
    )
fig.colorbar(sm, ax=ax)

for order in range(5):
    ydata=im_target.flatten()
    popt, pcov = curve_fit(poly2d, xdata=xdata, ydata=ydata, p0=[0]*(order+1) )

    im_fit = poly2d(xdata, *popt).reshape(ny, nx)

    ax = axs[1+order]
    title = 'Fit O({:d}):'.format(order)
    for o, p in enumerate(popt):
        if o%2 == 0:
            title += '\n'
        if o == 0:
            title += ' {:=-{w}.1f} (x+y)^{:d}'.format(p, o, w=int(np.log10(max(abs(p), 1))) + 5)
        else:
            title += ' {:=+{w}.1f} (x+y)^{:d}'.format(p, o, w=int(np.log10(max(abs(p), 1))) + 5)
    title += '\nrms: {:.1f}'.format( np.mean((im_fit-im_target)**2)**.5 )
    ax.set_title(title)
    sm = ax.imshow(
        im_fit,
        cmap = plt.get_cmap('coolwarm'),
        origin='lower'
        )
    fig.colorbar(sm, ax=ax)

for ax in axs.flatten():
    ax.set_xlabel('x')
    ax.set_ylabel('y')

plt.show()

附言:本答案的概念与我在这里给出的另一个答案相同,但代码示例更加清晰。 在指定时间,我将删除另一个答案。


2

拟合未知数量的参数

在这个例子中,我们试图重现一些测量数据measData。 在这个例子中,measData是由函数measuredData(x, a=.2, b=-2, c=-.8, d=.1)生成的。实际上,我们可能以某种方式测量了measData,因此我们不知道它在数学上的描述方式。因此需要进行拟合。

我们通过由函数polynomFit(inp, *args)描述的多项式来进行拟合。由于我们想尝试不同阶数的多项式,因此灵活地处理输入参数的数量非常重要。 自变量(在您的情况下为x和y)编码在inp的“列”/第二维中。

import numpy as np
import matplotlib
import matplotlib.pyplot as plt
from scipy.optimize import curve_fit

def measuredData(inp, a=.2, b=-2, c=-.8, d=.1):
    x=inp[:,0]
    y=inp[:,1]
    return a+b*x+c*x**2+d*x**3 +y

def polynomFit(inp, *args):
    x=inp[:,0]
    y=inp[:,1]
    res=0
    for order in range(len(args)):
        print(14,order,args[order],x)
        res+=args[order] * x**order
    return res +y


inpData=np.linspace(0,10,20).reshape(-1,2)
inpDataStr=['({:.1f},{:.1f})'.format(a,b) for a,b in inpData]
measData=measuredData(inpData)
fig, ax = plt.subplots()
ax.plot(np.arange(inpData.shape[0]), measData, label='measuered', marker='o', linestyle='none' )

for order in range(5):
    print(27,inpData)
    print(28,measData)
    popt, pcov = curve_fit(polynomFit, xdata=inpData, ydata=measData, p0=[0]*(order+1) )
    fitData=polynomFit(inpData,*popt)
    ax.plot(np.arange(inpData.shape[0]), fitData, label='polyn. fit, order '+str(order), linestyle='--' )
    ax.legend( loc='upper left', bbox_to_anchor=(1.05, 1))
    print(order, popt)

ax.set_xticklabels(inpDataStr, rotation=90)

结果:

在这里输入图像描述

注:Original Answer翻译成“最初的回答”。

1

是的,我们可以为curve_fit传递多个变量。我写了一段代码:

import numpy as np
x = np.random.randn(2,100)
w = np.array([1.5,0.5]).reshape(1,2)
esp = np.random.randn(1,100)
y = np.dot(w,x)+esp
y = y.reshape(100,)

在上述代码中,我生成了一个形状为(2,100)的二维数据集x,即有两个变量和100个数据点。我使用一些噪声将依赖变量y与自变量x进行拟合。
def model_func(x,w1,w2,b):
  w = np.array([w1,w2]).reshape(1,2)
  b = np.array([b]).reshape(1,1)
  y_p = np.dot(w,x)+b
  return y_p.reshape(100,)

我们定义了一个模型函数,建立了yx之间的关系。
注意:模型函数输出的形状或预测的y应为(x的长度,)
popt, pcov = curve_fit(model_func,x,y)

popt 是一个包含预测参数的1D numpy数组。在我们的情况下,有3个参数。


-1

是的,有:只需将一个多维数组作为xData参数传递给curve_fit即可。


我一直在尝试将x和y合并到一个数组z=[x,y]中,以便x=z[0]y=z[1]。但是curve_fit似乎不喜欢这样做,并给出了一个错误:TypeError: unsupported operand type(s) for /: 'list' and 'float' - ylangylang

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接