math公式的OCR库

我需要一个开放的OCR库,能够扫描复杂的打印math公式(例如一些通过LaTeX生成的公式)。 我想要得到一些类似LaTeX的输出(或者只是一些AST类的数据)。

有没有这样的事情? 还是现在的OCR技术只能parsing面向行的文本?

(请注意,我也在Metaoptimize上发布了这个问题,因为有些人可能有更多的知识。)

OpenAI也将这个问题描述为im2latex 。

不知道这个接受的input的性质是你所需要的,或者如果这个工作足够好,或者你已经看到了。

SESHAT是一个用C ++编写的用于识别手写mathexpression式的开源系统。 SESHAT是作为在瓦伦西亚理工大学的PRHLT研究中心的博士论文的一部分而开发的。

在线演示: http : //cat.prhlt.upv.es/mer/

来源: https : //github.com/falvaro/seshat

Seshat是一个用于识别手写mathexpression式的开源系统。 给定一个表示为笔画序列的样本,parsing器能够将其转换为LaTeX或其他格式,如InkML或MathML。

InftyReader是我知道的唯一一个。 这不是免费的软件(这似乎是钱去非营利组织,IIRC)。

http://www.sciaccess.net/en/InftyReader/

我不知道为什么PDF在LaTeX中不能有元数据? 如:将LaTeX公式放在里面! 这很难吗? (我不知道任何有关PDF语法,但我想它可以完成)。

LaTeX语法是math符号的一种试验和真实标准。 产生MathML和其他东西的人不考虑这一点似乎令人惊讶的愚蠢。 InftyReader生成MathML或LaTeX语法。

如果我想HTML(纯),然后使用TTH读取LaTeX语法。 只是工作。

ABBYY FineReader(一个很好的OCR程序)声称你可以训练软件的math,但这是非常braindead(谁有时间?)

而Unicode有很多math符号。 今天的OCR读者无法理解它们,显示了软件和大脑在这个活动中的不足之处。

对于“一次一个符号”来说,TeX显然会在符号放置的地方做出规定。 他们不能编写知道这些规则的软件?! TeX甚至是公有领域! 他们可以在商业产品中“使用它”。

根据Metaoptimize的答案和Tesseract邮件列表上的讨论 ,似乎还没有一个开放/免费的解决scheme,可以做到这一点。

似乎能够做到的唯一的解决scheme(但我不能validation,因为它是Windows和非自由的),就像其他人提到的InftyProject 。

查看“ Web方程式” 。 它可以将手写方程转换成LaTeX,MathML或SymbolTree。 我不确定引擎是否是开源的。

考虑到目前的技术一次只能读取一个符号(参见http://detexify.kirelabs.org/classify.html ),我怀疑是否有完整的math方程的OCR。

Infty工作得很好。 我以前的公司将它整合到一个应用程序中,为盲人大声朗读方程式,并从用户那里得到很好的反馈。

http://www.inftyproject.org/en/download.html

你知道,Win7中只有一个应用程序: mathinput面板 。 它甚至处理手写input(实际上是为了这个)。 给它一个镜头,如果你有Win7的,它是免费的!

有这个伟大的短video: http : //www.youtube.com/watch?v= LAJm3J36tLQ解释如何你可以训练你的精读者认识math公式。 如果您已经使用Fine Reader,最好使用一种工具。 当然这不是免费的洁具:(

由于复杂公式的mathOCR输出可能会有错误 – 即使人类遇到了麻烦,您也必须对结果进行校对,至less如果这些结果是重要的话。 然后(人类)校对者将不得不纠正结果,这意味着你需要有一个math公式编辑器。 鉴于人类所需要的努力,可能有限的复杂公式语料库,您可能会发现将任务分配给人类更容易。

作为一个研究问题,通过OCR阅读math是有趣的 – 你需要一个二维语法和一个符号识别器的forms化。
除了这里已经提到的参考,为什么不谷歌呢? 在加州理工学院,罗切斯特大学,滑铁卢大学和加州大学伯克利分校完成了一些工作。 有多less是准备开箱使用的? 不知道。

Mathpix是专门为从math图像中提取LaTex而devise的。 这是一个非常精确的利基工具。 此外,它可以识别手写和印刷的math。