稀疏最小二乘回归的工具

7
我希望进行稀疏高维(几千个特征)的最小二乘回归,使用几十万个示例。我愿意使用非花哨的优化方法 - 随机梯度下降就可以了。
请问是否有已经实现这种方法的软件,这样我就不用自己写了。
谢谢。

1
感谢您的评论。我正在寻找一些可以处理梯度计算和所有数据整理的东西。最终我没有找到任何东西。R似乎在处理大型数据集时会崩溃。我使用Python中的NumPy实现了一个解决方案。 - Owen
3个回答

5
虽然我不确定,但这让我想到了LAPACK(线性代数库),它可能能够提供支持。它通常对大型矩阵计算感兴趣,包括稀疏矩阵和外存大小。基本版本是FORTRAN,但也有C和其他语言的库端口。
由于LAPACK在许多底层调用中使用BLAS(基本线性代数子程序),您可能还需要查看Sparse BLAS

3

我相信R软件包可以用于解决这类问题。它功能强大且灵活,该页面链接了许多在线资源。


1

我建议看一下LAPACK。它是一个相当成熟的线性代数库,尽管与它的接口可能有点棘手,因为它是用Fortran编写的。不过这没关系,因为如果你正确地获取函数原型,Fortran与C是ABI兼容的。

[编辑] 经过进一步审查,发现LAPACK不支持稀疏矩阵。它可以处理带状矩阵以某些目的,但对于线性最小二乘问题,它仅支持一般矩阵。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接