有没有办法在上传文档的同时执行OCR?
我们能否索引整个文档?
即使用户需要付费查看完整文档,搜索引擎是否能够索引整个文档?
文档能否作为预览显示,只显示选定的摘录,其余部分模糊但文档格式仍可查看?
我一直在尝试使用简单的PHP函数或其他看起来不像“火箭科学”的东西来寻找这些问题的简单解决方案。但无论我到哪里看,都会看到人们谈论ApachePOI和Solr Cell等服务器命令,这些我都不知道。对于最后一个问题,我只能想到使用PHPGD生成带有模糊内容的图像,但如果文档中包含格式化文本、图像和表格等,我不确定如何操作。
因此,如果有人有简单的解决方案,甚至是复杂的解决方案,但是有简单易懂的说明,那就更好了。例如“面向新手的PHP文档内容提取”,从基础开始讲解。
提前感谢您!