如何在Apache Solr 1.4.1中配置Apache Tika

Question

5

我希望能够索引大量的PDF文件。

我找到了一份参考资料，显示可以使用Apache Tika来完成这项工作，但遗憾的是我找不到任何参考资料描述如何在Solr 1.4.1中配置Apache Tika。

一旦配置好了，我该如何直接将文档发送到Solr，而不使用curl呢？

我正在使用solrnet进行索引。

- Ahsan Iqbal

2个回答

3

目前SolrNet中的ExtractingRequestHandler支持尚未完善。您可以继续实现它，或者使用其他方法并自行创建HttpWebRequests。

- Mauricio Scheffer

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Pascal Dimassimo · Accepted Answer