将Solr数据存储在Amazon S3中

3
我正在亚马逊EC2上使用Solr,希望配置Solr实例以便自动将数据存储在Amazon S3而不是服务器上的任何地方。然而,我找不到任何有用的信息来实现此操作。有人知道吗?如果无法使用Amazon S3实现此操作,您推荐哪种云存储服务呢?
谢谢!

我对Solr不熟悉。它如何存储其索引数据?是平面文件还是数据库?网站称其可扩展。它如何跨多个实例进行扩展? - greg_diesel
我也是Solr的新手。据我所知,它不存储平面文件。至于可扩展性,我认为这是因为您可以配置所有Solr实例使用相同的Solr核心。 - Woooooooo
我也在寻找这个问题的答案,因为我无法找到相应的配置,甚至没有任何有用的链接。 - Vikash
1个回答

4
你需要将 Solr 索引存储在可连接到服务器的 EBS 卷上。S3 用于直接向互联网提供文件(如图像和 CSS 文件)或用于一般文件存储(如备份),不适合用作数据库的挂载磁盘。
对于高 IO 的 Solr,SSD 支持的 EBS 卷非常适合。你还可以制作 EBS 卷的快照来备份数据。
如果设置了 Solr 从服务器,则还可以使用服务器的临时存储。大多数实例类型都带有一个大分区作为临时存储,这是易失性存储,意味着如果关闭服务器,则会丢失所有数据。但是,它是免费的且相当快速。它非常适合从由 EBS 支持的主 Solr 实例复制其数据的从节点。

嗨Xevo。你能告诉我更多关于你所说的Solr从节点的细节吗?我认为这是适合我的正确解决方案,但我并不真正理解... - Woooooooo
哦,我还应该提到AWS有自己的搜索服务,称为CloudSearch:http://aws.amazon.com/cloudsearch/这项服务基于Solr,但由亚马逊管理。它不支持Solr的所有高级功能。但是,如果您的搜索需求不太复杂,它非常棒。 - Xevo
关于设置从节点,我使用了这个维基页面来进行设置:https://wiki.apache.org/solr/SolrReplication - Xevo
Solr 4.0还支持一种名为SolrCloud的新复制类型(请勿与亚马逊的CloudSearch混淆!)。这是Solr开发人员推荐用于复制的功能。但设置起来要稍微复杂一些:https://cwiki.apache.org/confluence/display/solr/SolrCloud - Xevo
非常感谢Xevo!XD - Woooooooo

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接