Python的curve_fit
函数可以计算仅有一个自变量的函数的最佳拟合参数,但是是否有一种方法,可以使用curve_fit
或其他方法来拟合具有多个自变量的函数?例如:
def func(x, y, a, b, c):
return log(a) + b*log(x) + c*log(y)
其中x和y是自变量,我们希望拟合出a、b和c的值。
Python的curve_fit
函数可以计算仅有一个自变量的函数的最佳拟合参数,但是是否有一种方法,可以使用curve_fit
或其他方法来拟合具有多个自变量的函数?例如:
def func(x, y, a, b, c):
return log(a) + b*log(x) + c*log(y)
其中x和y是自变量,我们希望拟合出a、b和c的值。
您可以将多维数组传递给curve_fit
作为自变量,但是您的func
必须接受相同的内容。例如,将此数组称为X
,并将其解包以获得更清晰的x
,y
:
import numpy as np
from scipy.optimize import curve_fit
def func(X, a, b, c):
x,y = X
return np.log(a) + b*np.log(x) + c*np.log(y)
# some artificially noisy data to fit
x = np.linspace(0.1,1.1,101)
y = np.linspace(1.,2., 101)
a, b, c = 10., 4., 6.
z = func((x,y), a, b, c) * 1 + np.random.random(101) / 100
# initial guesses for a,b,c:
p0 = 8., 2., 7.
print(curve_fit(func, (x,y), z, p0))
给出拟合结果:
(array([ 9.99933937, 3.99710083, 6.00875164]), array([[ 1.75295644e-03, 9.34724308e-05, -2.90150983e-04],
[ 9.34724308e-05, 5.09079478e-06, -1.53939905e-05],
[ -2.90150983e-04, -1.53939905e-05, 4.84935731e-05]]))
该示例演示了如何通过增加系数数量来拟合具有二维输入(R^2 -> R)的多项式。该设计非常灵活,因此可调用 f 函数来自 curve_fit 只需一次定义即可对任意数量的非关键字参数进行操作。
最小可重现示例
import numpy as np
import matplotlib.pyplot as plt
from scipy.optimize import curve_fit
def poly2d(xy, *coefficients):
x = xy[:, 0]
y = xy[:, 1]
proj = x + y
res = 0
for order, coef in enumerate(coefficients):
res += coef * proj ** order
return res
nx = 31
ny = 21
range_x = [-1.5, 1.5]
range_y = [-1, 1]
target_coefficients = (3, 0, -19, 7)
xs = np.linspace(*range_x, nx)
ys = np.linspace(*range_y, ny)
im_x, im_y = np.meshgrid(xs, ys)
xdata = np.c_[im_x.flatten(), im_y.flatten()]
im_target = poly2d(xdata, *target_coefficients).reshape(ny, nx)
fig, axs = plt.subplots(2, 3, figsize=(29.7, 21))
axs = axs.flatten()
ax = axs[0]
ax.set_title('Unknown polynomial P(x+y)\n[secret coefficients: ' + str(target_coefficients) + ']')
sm = ax.imshow(
im_target,
cmap = plt.get_cmap('coolwarm'),
origin='lower'
)
fig.colorbar(sm, ax=ax)
for order in range(5):
ydata=im_target.flatten()
popt, pcov = curve_fit(poly2d, xdata=xdata, ydata=ydata, p0=[0]*(order+1) )
im_fit = poly2d(xdata, *popt).reshape(ny, nx)
ax = axs[1+order]
title = 'Fit O({:d}):'.format(order)
for o, p in enumerate(popt):
if o%2 == 0:
title += '\n'
if o == 0:
title += ' {:=-{w}.1f} (x+y)^{:d}'.format(p, o, w=int(np.log10(max(abs(p), 1))) + 5)
else:
title += ' {:=+{w}.1f} (x+y)^{:d}'.format(p, o, w=int(np.log10(max(abs(p), 1))) + 5)
title += '\nrms: {:.1f}'.format( np.mean((im_fit-im_target)**2)**.5 )
ax.set_title(title)
sm = ax.imshow(
im_fit,
cmap = plt.get_cmap('coolwarm'),
origin='lower'
)
fig.colorbar(sm, ax=ax)
for ax in axs.flatten():
ax.set_xlabel('x')
ax.set_ylabel('y')
plt.show()
附言:本答案的概念与我在这里给出的另一个答案相同,但代码示例更加清晰。 在指定时间,我将删除另一个答案。
拟合未知数量的参数
在这个例子中,我们试图重现一些测量数据measData
。
在这个例子中,measData
是由函数measuredData(x, a=.2, b=-2, c=-.8, d=.1)
生成的。实际上,我们可能以某种方式测量了measData
,因此我们不知道它在数学上的描述方式。因此需要进行拟合。
我们通过由函数polynomFit(inp, *args)
描述的多项式来进行拟合。由于我们想尝试不同阶数的多项式,因此灵活地处理输入参数的数量非常重要。
自变量(在您的情况下为x和y)编码在inp
的“列”/第二维中。
import numpy as np
import matplotlib
import matplotlib.pyplot as plt
from scipy.optimize import curve_fit
def measuredData(inp, a=.2, b=-2, c=-.8, d=.1):
x=inp[:,0]
y=inp[:,1]
return a+b*x+c*x**2+d*x**3 +y
def polynomFit(inp, *args):
x=inp[:,0]
y=inp[:,1]
res=0
for order in range(len(args)):
print(14,order,args[order],x)
res+=args[order] * x**order
return res +y
inpData=np.linspace(0,10,20).reshape(-1,2)
inpDataStr=['({:.1f},{:.1f})'.format(a,b) for a,b in inpData]
measData=measuredData(inpData)
fig, ax = plt.subplots()
ax.plot(np.arange(inpData.shape[0]), measData, label='measuered', marker='o', linestyle='none' )
for order in range(5):
print(27,inpData)
print(28,measData)
popt, pcov = curve_fit(polynomFit, xdata=inpData, ydata=measData, p0=[0]*(order+1) )
fitData=polynomFit(inpData,*popt)
ax.plot(np.arange(inpData.shape[0]), fitData, label='polyn. fit, order '+str(order), linestyle='--' )
ax.legend( loc='upper left', bbox_to_anchor=(1.05, 1))
print(order, popt)
ax.set_xticklabels(inpDataStr, rotation=90)
结果:
注:Original Answer翻译成“最初的回答”。是的,我们可以为curve_fit传递多个变量。我写了一段代码:
import numpy as np
x = np.random.randn(2,100)
w = np.array([1.5,0.5]).reshape(1,2)
esp = np.random.randn(1,100)
y = np.dot(w,x)+esp
y = y.reshape(100,)
def model_func(x,w1,w2,b):
w = np.array([w1,w2]).reshape(1,2)
b = np.array([b]).reshape(1,1)
y_p = np.dot(w,x)+b
return y_p.reshape(100,)
popt, pcov = curve_fit(model_func,x,y)
popt 是一个包含预测参数的1D numpy数组。在我们的情况下,有3个参数。
是的,有:只需将一个多维数组作为xData
参数传递给curve_fit
即可。
z=[x,y]
中,以便x=z[0]
和y=z[1]
。但是curve_fit
似乎不喜欢这样做,并给出了一个错误:TypeError: unsupported operand type(s) for /: 'list' and 'float'
。 - ylangylang
func
代表一个双变量函数(接受两个独立变量),因此对于拟合,它应该被定义为给出任何提供的输入值x_i和y_i的结果f(x_i,y_i)。如果x和y的大小不相同,则尝试在某些x处评估它,但y未定义,这肯定是无法完成的。 - xnxx,y = np.mesgrid(x,y)
,然后使用np.stack((x,y), axis=2).reshape(-1, 2)
来获取一个(600,2)
的数组,它将成为xdata
,包含所有600种x和y的组合。然后,我将这600个样本的数据从2D的(20,30)
数组扁平化为1D的(600,)
数组,即ydata
。然后,您可以使用x, y = np.hsplit(X, 2)
来在函数中拆分您的数据。(X
是xdata
)。 - MaxisX
包含不同类型的变量,会怎么样?在这里,我有x0, x4, y0, mylist
。curve_fit
似乎在内部将它们解包成numpy数组,但在mylist
上遇到了错误。我得到的错误信息是:"ValueError: setting an array element with a sequence. The requested array has an inhomogeneous shape after 1 dimensions. The detected shape was (4,) + inhomogeneous part." 你有什么办法可以解决这个问题吗?令人惊讶的是,leastsq
似乎可以工作,而我原以为curve_fit
只是它的一个包装器。 - undefined