如果我需要使用过大而无法放入内存的矩阵进行大量数据拟合,需要寻找哪些工具/库?具体而言,如果我通常在使用php + mysql从网站获取数据,如何建议制作一个脱机进程,可以在合理的时间内运行大型矩阵操作?
可能的答案可能是“您应该使用这种语言和这种分布式矩阵算法,在许多机器上执行映射减少” 。我想php不是这方面的最佳语言,因此流程更像是其他脱机进程从数据库中读取数据,进行学习,并将规则以php可以稍后利用的格式存储回来(由于网站的其他部分都是用php构建的)。
不确定这是否是正确的地方来发问(本来想在机器学习SE上提出这个问题,但它从未超出beta版)。
可能的答案可能是“您应该使用这种语言和这种分布式矩阵算法,在许多机器上执行映射减少” 。我想php不是这方面的最佳语言,因此流程更像是其他脱机进程从数据库中读取数据,进行学习,并将规则以php可以稍后利用的格式存储回来(由于网站的其他部分都是用php构建的)。
不确定这是否是正确的地方来发问(本来想在机器学习SE上提出这个问题,但它从未超出beta版)。