我需要一个开源OCR库,能够扫描复杂的印刷数学公式(例如通过LaTeX生成的某些公式)。我想要得到一些类似于LaTeX的输出(或者只是一些类似于AST的数据)。
目前是否已经存在这样的东西?还是当前的OCR技术只能解析面向行的文本?
(请注意,我还在Metaoptimize上发布了这个问题,因为那里的一些人可能具有额外的知识。)
OpenAI也将该问题描述为im2latex。
我需要一个开源OCR库,能够扫描复杂的印刷数学公式(例如通过LaTeX生成的某些公式)。我想要得到一些类似于LaTeX的输出(或者只是一些类似于AST的数据)。
目前是否已经存在这样的东西?还是当前的OCR技术只能解析面向行的文本?
(请注意,我还在Metaoptimize上发布了这个问题,因为那里的一些人可能具有额外的知识。)
OpenAI也将该问题描述为im2latex。
SESHAT是一个用C ++编写的开源系统,用于识别手写的数学表达式。SESHAT是在Valencia大学的PRHLT研究中心的博士论文的一部分而开发的.
在线演示: http://cat.prhlt.upv.es/mer/
源代码: https://github.com/falvaro/seshat
Seshat是一个开源系统,用于识别手写的数学表达式。给定以笔画序列表示的样本,解析器能够将其转换为LaTeX或其他格式,如InkML或MathML。
http://www.sciaccess.net/en/InftyReader/
我不知道为什么PDF不能在LaTeX中具有元数据?就像:将LaTeX方程式放入其中!这很难吗?(我对PDF语法一无所知,但我想这是可以做到的)。考虑到当前技术只能逐个符号地读取(参见http://detexify.kirelabs.org/classify.html),我怀疑是否存在用于完整数学方程的OCR。
Infty的表现相当不错。我的前公司将其集成到一个为盲人朗读方程式的应用程序中,并且从用户那里得到了良好的反馈。
有一个很棒的短视频:http://www.youtube.com/watch?v=LAJm3J36tLQ,讲解如何训练 Fine Reader 识别数学公式。如果你已经在使用 Fine Reader,最好还是坚持使用一个工具。当然这并不是免费软件 :(