用于线性拟合的数据组合算法?

3
我不确定这是否是询问的最佳位置,但过去你们在我的计算机科学作业中给了我很多帮助,所以我想试一试。我正在寻找一种算法,可以盲目地将多个依赖变量合并成一个指数,从而产生与外部变量最佳线性拟合。基本上,它将使用不同的数学运算符组合依赖变量,包括或不包括每个变量,等等,直到开发出一个与我的外部变量最相关的指数为止。有人见过/听说过这样的东西吗?即使你能指引我正确的方向或询问正确的地方,我也会很感激。谢谢。

听起来有点像分段线性函数,或者某种形式的曲线拟合 - Robert Harvey
你最好在http://math.stackexchange.com上提问,这是一个非常数学密集的问题。 - Hans Z
当然,我会尝试一下。至于背景,我正在开发一个指数,将个体化学化合物的浓度与空气温度相关联。我一直在使用手动回归分析,但认为盲目组合变量的方法也是一个有趣的研究方向。 - BoldlyBold
3个回答

1
听起来你正在尝试进行多元线性回归或多重回归。最简单的方法(即:不太准确)是分别计算每个分量变量的线性回归线,然后对每条线进行加权平均。除此之外,恐怕我帮不上太多忙了。

0

你所询问的东西本质上就是回归分析的全部内容。

这就是线性回归所做的事情,也是“机器学习”所做的很大一部分(机器学习基本上只是更复杂的回归和分类算法的名称)。有数百或数千种不同的方法,具有各种权衡,但基本的方法通常非常有效。

如果你想了解更多,Coursera上的课程是深入了解这个领域的好地方。


0
这似乎是使用多个解释变量的简单线性回归。由于这里的暗示是您正在使用计算方法,您可以简单地应用线性模型到您拥有的每个解释变量的所有可能组合的数据上(是否包含交互效应取决于您自己),选择一个适合度度量标准(例如R^2),并用它来排列每个所拟合模型的拟合优度?对于许多领域来说,模型质量也有一定主观性-如果一个包含15个变量的模型只比一个仅包含3个变量的简单模型稍微改进了拟合度,您可能会拒绝该模型。如果您尚未阅读过,我毫不怀疑您会在下面的文本中找到许多有用的建议:

Draper, N.R. and Smith, H. (1998).Applied Regression Analysis Wiley Series in Probability and Statistics

您也可以尝试搜索LASSO模型选择方法。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接