如何在Apache Solr 1.4.1中配置Apache Tika

5

我希望能够索引大量的PDF文件。

我找到了一份参考资料,显示可以使用Apache Tika来完成这项工作,但遗憾的是我找不到任何参考资料描述如何在Solr 1.4.1中配置Apache Tika。

一旦配置好了,我该如何直接将文档发送到Solr,而不使用curl呢?

我正在使用solrnet进行索引。

2个回答

5

3

目前SolrNet中的ExtractingRequestHandler支持尚未完善。您可以继续实现它,或者使用其他方法并自行创建HttpWebRequests。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接