Python有标准的词法分析器/语法分析器工具吗?

3
一个志愿者工作需要我们将大量的LaTeX文档转换为ePub文件格式。这是一系列开源小说书籍,目前只通过按需印刷服务以纸质形式出版。我们希望能够将这本书提供给书籍阅读器设备(如Kindle)的用户,这需要使用ePub格式以获得最佳结果。
幸运的是,ePub是一个非常简单的格式,但是没有一种简单的方法可以使LaTeX产生所需的XHTML输出。
我们尝试了替代的LaTeX编译器(例如plastex),但最终我们认为,编写一个理解LaTeX语言微小子集并直接编译为XHTML / ePub的编译器可能会更容易。
之前我在Windows上使用了一个名为GOLD的工具。这使我可以直接从BNF语法转到存根解析器。它还允许我在任何我喜欢的语言中实现解析器。(我会选择Python)。
这个产品必须在Linux上工作,所以我想知道是否有一个在Ubutnu / Eclipse / Python下同样有效的等效工具链。想法是我们将采取TeX的语法,只实现其中的微小子集,但我们不想花费大量时间担心语法和解析。解析器生成器显然会节省我们大量的时间。
Sal
更新1:如果有出色的文档或教程解决方案,将获得额外加分。
更新2:如果已经有TeX的语法文件可用,那么额外的奖励将会实现我们关心的函数。

要求我们推荐或寻找工具、库或喜爱的离线资源的问题不适合于 Stack Overflow,因为它们往往会吸引有个人偏见的答案和垃圾邮件。相反,请描述问题以及到目前为止已经做了什么来解决它。 - Taryn East
3个回答

5

1
Pyparsing 不再托管在 wikispaces.com 上。请前往 https://github.com/pyparsing/pyparsing。 - PaulMcG

3

3

我曾经使用tex4ht将LaTeX转换成XHTML+MathML,效果很好。从此以后,您可以将输出的HTML作为ePub的基础。

当然,这会破坏Python工具链,所以它可能不会成为您最喜欢的方法...


这不是问题。我们的志愿团队中有Python和Tex专家。唯一的问题是我们想要使用稳定的工具进行开发。 - Salim Fadhley

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接