13得票1回答
Python OCR库或手写字符识别引擎

你能推荐一些Python OCR和手写字符识别的库或源代码吗?

7得票3回答
使用OCR引擎tesseract提取文档时无法理解坐标。

我从tesseract中提取了一个图像文档,并成功地进行了提取。但是我无法理解提取文档的坐标。 问题描述:- 它显示坐标,但请告诉我这些坐标是否表示像素或其他内容。这些坐标有四个,类似于 title="bbox 10 13 43 46",那么10、13、43和46是什么意思?它们代表什么位...

12得票1回答
有没有适用于Android和iOS的OCR开源库或SDK(免费)?

我正在寻找适用于Android和iOS应用程序的OCR开源库或SDK(免费)。 我将扫描名片以获取内容,并将提取的内容存储为联系人,可以选择存储在云端、手机上或邮箱账户中。 非常感谢任何可用的资源。

44得票2回答
扫描文档中的分割文本行

我正在尝试寻找一种方法来分割经过自适应阈值处理的扫描文档中的文本行。目前,我将文档的像素值存储为从0到255的无符号整数,并计算每行像素的平均值,然后根据像素值的平均值是否大于250,将行分成不同区间,并取其中每个区间行的中位数。然而,这种方法有时会失败,因为图像上可能会有黑色斑点。 是否有...

10得票4回答
如何在ASP.Net Web应用程序中使用MODI?

我编写了一个基于Microsoft Office Document Imaging COM API的OCR包装库,在本地运行的控制台应用程序中,它可以无缝运行,测试结果良好。 然而,当我们尝试将它与在IIS6下作为ASP.Net Web应用程序运行的WCF服务集成时,问题就开始出现。我们在尝...

12得票4回答
Python OCR:忽略文档中的签名

我正在尝试对一份扫描文件进行OCR识别,其中包含手写签名。请参见下面的图像。 我的问题很简单,是否有办法在忽略签名的情况下使用OCR提取人名?当我运行Tesseract OCR时,它无法检索到这些名称。我尝试了灰度处理/模糊处理/阈值化,并使用下面的代码,但没有成功。有什么建议吗?ima...

39得票6回答
如何使用Tesseract对文档进行分段,然后输出生成的边界框和标签。

我试图让Tesseract输出一个带有标记的边界框文件,该文件是页面分割(OCR之前)产生的结果。我知道它一定能够在“开箱即用”的情况下做到这一点,因为在ICDAR比赛中展示的结果表明了这一点,参赛者必须对各种文档进行分割(学术论文在此)。以下是论文中的示例,说明了我想要创建的内容: 我已...

12得票2回答
图像文本检测中的边缘检测问题

我正在尝试在自然图像中检测文本,使用pEpshtein的论文(使用笔画宽度变换检测自然场景中的文本(2010))。第一步是边缘检测。 我的文本内部出现了一些额外的边缘。我应该如何去除这些边缘? 原始图像: 我的边缘检测结果: 在这个例子中,你可以看到text“WHY HURRY...

9得票3回答
如何使用pytesseract获取每行文字的置信度

我已成功安装并配置好了Tesseract,可以将图片转换为文字... text = pytesseract.image_to_string(Image.open(image)) 然而,我需要获取每行的置信度值。使用pytesseract无法找到实现此操作的方法。有人知道如何做吗? 我知...

23得票2回答
需要Tesseract收据扫描建议

我曾多次为各种OCR项目与Tesseract奋斗过,今天我发现了一个使用案例,本以为这会是它的一大优势,但经过多个小时的尝试,仍然无法满足需求。我想在这里提出问题,看看是否有其他人能提供解决方案。 今天早上,我妻子问我是否有简便方法可以扫描她从沃尔玛收到的收据,并逐渐建立类别和特定物品的花费...