我希望能够索引大量的PDF文件。
我找到了一份参考资料,显示可以使用Apache Tika来完成这项工作,但遗憾的是我找不到任何参考资料描述如何在Solr 1.4.1中配置Apache Tika。
一旦配置好了,我该如何直接将文档发送到Solr,而不使用curl呢?
我正在使用solrnet进行索引。
我希望能够索引大量的PDF文件。
我找到了一份参考资料,显示可以使用Apache Tika来完成这项工作,但遗憾的是我找不到任何参考资料描述如何在Solr 1.4.1中配置Apache Tika。
一旦配置好了,我该如何直接将文档发送到Solr,而不使用curl呢?
我正在使用solrnet进行索引。
目前SolrNet中的ExtractingRequestHandler支持尚未完善。您可以继续实现它,或者使用其他方法并自行创建HttpWebRequests。