我将使用Python中的statsmodels进行逻辑回归分析。例如:
import statsmodels.api as sm
import numpy as np
x = arange(0,1,0.01)
y = np.random.rand(100)
y[y<=x] = 1
y[y!=1] = 0
x = sm.add_constant(x)
lr = sm.Logit(y,x)
result = lr.fit().summary()
但是我希望为我的观测结果定义不同的权重。我正在合并四个大小不同的数据集,并希望对分析进行加权,使得来自最大数据集的观测结果不会主导模型。