OCR(光学字符识别)用于屏幕上的文本

4
我正在尝试创建一款自动化PC的软件,它可以通过捕获屏幕截图并使用OCR(光学字符识别)技术来查找特定按钮进行点击。我已经掌握了鼠标和键盘控制部分,但现在需要一个OCR来处理截图。我发现Tesseract OCR似乎不能很好地处理屏幕上的文本。文本要么太小,要么一些文字似乎连接在一起,比如K和X。我该怎么做呢?
附注:这是用于自动化测试程序的。

你可以把测试机上的字体大小调大并微调字体吗? - Tom Ritter
你究竟想测试什么?如果是一个简单的测试程序,您可以使用SendMessage和GetWndText查询Windows,以搜索您喜欢的按钮和控件。为什么要费力进行OCR? - Paulo Santos
我可以调大文本的大小,但是应用程序内部的一些字体如果不修改代码就无法调大。 - Hao Wooi Lim
2个回答

0

在进行OCR之前,也许可以参考一下这个问题中的图像增强。否则,这个问题与".NET OCR"非常相似。

如果你感觉非常勇敢,你总是可以尝试使用简单的感知器或基于神经网络的方法 :-)


0

我不确定这是否真正符合您的要求,但我见过一些更好的OCR自动化是由Tevron的CitraTest完成的。它包含了一个字体库,如果没有字体集,他们将根据您的提交创建一个新的字体集。这个工具的负面因素是成本和与可变屏幕分辨率相关的通常问题。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接