Windows ocr能识别自定义符号/字体吗?

3
我正在开发UWP应用,Windows拥有OCR引擎:Windows.Media.Ocr。
我的问题是:有人知道Windows OCR是否可以训练识别新字符或使用自定义字体?如果是,我该如何操作?
我想要实现的目标是识别非字母符号。例如,我想要识别字符⌰(Unicode:U+2330)或⌖(U+2316)。
我想要识别的字符是任何语言都不包含的符号。
2个回答

3

我在WUP应用程序中使用了Windows.Media.Ocr库,并提供了一些不同字体的测试结果。


Arial

字体 - Arial
测试单词 - Hello @ World
预期结果 - Hello @ World
原始结果 - Hello @ World
准确度 - 100%

enter image description here


Agency FB

字体 - Agency FB
测试文字 - Hello @ World
期望结果 - Hello @ World
原始结果 - Hello World
准确率 - 84.6%(错漏 - @ 符号和一个空格)

enter image description here


现代

字体 - 现代
测试词语 - 你好 @ 世界
期望结果 - 你好 @ 世界
原始结果 - 你好 @ world
准确率 - 92.3% (W 被识别为 w)

enter image description here


草书体

字体 - 草书体 测试单词 - Hello @ World
期望结果 - Hello @ World
原始结果 - HeUe@ worw
准确率 - 46.1%
在此输入图片描述


更新 [1]

Arial Unicode MS

字体 - Arial Unicode MS
测试符号 - ⌰ ⌖
期望结果 - ⌰ ⌖
原始结果 - (无法识别)
准确率 - 0%

enter image description here


更新2

enter image description here

希望这对你有所帮助。

我认为您并没有完全回答我的问题,但是您给了我一些想法,并引导我去寻找其他可能解决问题的方法。谢谢。所以,我想要实现的是识别非字母符号。例如,我想要识别字符⌰(Unicode:U+2330)或⌖(U+2316)。请问您在使用Windows OCR的示例中是否能够识别这些Miscellaneous Technical Unicode子集字符。我明天会尝试一下。提前致谢。 - Xaren
@Xaren请查看我的答案中的“更新1”部分。希望对您有所帮助。 - Vineet Choudhary
像⌰和⌖这样的字符 - Xaren
除此之外,当您想要检测用户手写笔记时,Windows Media OCR 是无用的。我真的很想看到一个识别用户输入文本(通过触摸)并具有可接受成功率的示例。请参见http://stackoverflow.com/questions/35954842/windows-ocr-engine-fails-to-recognize-the-text-in-canvas-converted-to-bitmap/35964300#35964300 - belzebu
嘿@Vineet Choudhary,关于以下字体怎么样…… ict4u.net/databases/database-images/… 我能否识别以下字体。或者你能看一下这个http://stackoverflow.com/questions/38824278/add-new-language-for-ocr-engine - Cloy
显示剩余3条评论

2
我认为对你的问题给出的简短答案是否定的。如支持的语言所述,在Windows.Media.Ocr命名空间中:

共有25种支持的语言。根据识别准确度和性能,支持的语言分为三组:

  • 优秀:捷克语、丹麦语、荷兰语、英语、芬兰语、法语、德语、匈牙利语、意大利语、挪威语、波兰语、葡萄牙语、罗马尼亚语、塞尔维亚西里尔文、塞尔维亚拉丁文、斯洛伐克语、西班牙语和瑞典语。
  • 非常好:简体中文、希腊语、日语、俄语和土耳其语。
  • 良好:繁体中文和韩语。

语言是正确识别文本所必需的信息。每种语言都使用一些特定于该语言的资源,因此必须提前指定。

注意:只有设备上安装的语言才可以使用。用户可以通过设置应用程序安装新语言。

所以,如果你的符号不属于任何语言,OCR引擎就无法识别它。
至于自定义字体,正如Vineet Choudhary的回答所示,也许OCR引擎可以识别一些,但文本识别的准确度取决于你的字体。如果是手写或草书体,文本识别的准确度可能会非常低。

嘿 @Jay Zuo - MSFT,你觉得下面这个字体怎么样?http://www.ict4u.net/databases/database-images/micr.jpg .................我该如何识别这个字体。 - Cloy

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接