我有一个Ruby脚本读取一个巨大的表格(~20m行),进行一些处理并将其馈送到Solr进行索引。这一直是我们流程中的一个大瓶颈。我计划在这里加速事情,并希望实现某种形式的并行性。我对Ruby的多线程特性感到困惑。我们的服务器有
我应该采用哪种方法?此外,任何关于并行数据库读取和馈送系统的输入都将受到高度赞赏。
ruby 1.8.7 (2009-06-12 patchlevel 174) [x86_64-linux]
。从这篇博客文章和StackOverflow上的这个问题可以看出,Ruby没有“真正的”多线程方法。我们的服务器有多个核心,因此使用parallel gem似乎是另一种方法。我应该采用哪种方法?此外,任何关于并行数据库读取和馈送系统的输入都将受到高度赞赏。