如何将DVI转换为TeX?

5
有什么办法可以将DVI文件转换成TeX格式吗?

1
类似的东西今天是这样的:https://dev59.com/MXI-5IYBdhLWcg3w6c-1 - P Shved
在TeX.stackexhange上有一个相关的问题:http://tex.stackexchange.com/q/46779/10944 - madth3
7个回答

10

这类似于将PDF转换为XML的问题,也被称为“试图将汉堡变回牛”。TeX->DVI和XML->PDF都会丢失文档结构和语义方面的信息。

重新创建(部分)原始文档需要大量的启发式方法和大型语料库。通常不可能完全还原。文本字符串可能是可能的,向量更难。位图几乎不可能。


2
哦,我真的很喜欢汉堡/奶牛图片!非常非常形象。 - Boldewyn
@Boldewyn 我是从Mike Kay(Saxon)那里得到的,但他好像是从别处得到的。 - peter.murray.rust

4
您所要求的是不可能的。我认为(与PostScript相同),即使在DVI文件中识别单词也可能需要启发式算法。DVI文件仅是描述如何将单个字母放置在纸张上的内容,没有其他信息。
您可以通过使用dvi2tty或运行dvips后跟ps2ascii来部分实现,以获得最佳结果。

4
还有 catdvi、dvitype 和 dvi2tty,可从 ctan 获取。

2

对于再次发现这个问题的人,或者对于所有回答我的人,我找到了最好的答案: 我正在寻找的是非常困难的,它试图找出一个原始文本,可以编译成给定的DVI(或PDF,因为我可以轻松地将DVI转换为PDF)。InftyReader可以做到这一点。它完美地工作,我在它上面尝试了一堆PDF文件,然后重新制作成PDF文件,一切都很完美!


是的,很好的提醒!OCR系统通常对换行不太敏感:你有没有看过它如何处理多行方程式。 - Charles Stewart

2

我非常确定这是不可能的。 DVI 文件包含有关渲染页面的信息,而不是它包含哪些 tex 命令。


我认为这是可能的,没有任何疑问。问题在于是否能够做得足够好,值得一试。 - Charles Stewart

0

嗯,差不多吧。

我认为最简单的方法是使用dvi->rtf转换器。我发布了一个问题:Q#1859373 dvi2rtf: who can convert DVI files to RTF。在那里,我发布了一个未经测试的实现,它给出了一个糟糕的解决方案,丢弃了所有格式。

有了这样一个工具,你就可以使用word2007/8和优秀的docx2tex实用程序将rtf转换为tex。

结果可能不好阅读,但我可以看到一些使用这种方法的情况。


0

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接