有什么办法可以将DVI文件转换成TeX格式吗?
这类似于将PDF转换为XML的问题,也被称为“试图将汉堡变回牛”。TeX->DVI和XML->PDF都会丢失文档结构和语义方面的信息。
重新创建(部分)原始文档需要大量的启发式方法和大型语料库。通常不可能完全还原。文本字符串可能是可能的,向量更难。位图几乎不可能。
对于再次发现这个问题的人,或者对于所有回答我的人,我找到了最好的答案: 我正在寻找的是非常困难的,它试图找出一个原始文本,可以编译成给定的DVI(或PDF,因为我可以轻松地将DVI转换为PDF)。InftyReader可以做到这一点。它完美地工作,我在它上面尝试了一堆PDF文件,然后重新制作成PDF文件,一切都很完美!
我非常确定这是不可能的。 DVI 文件包含有关渲染页面的信息,而不是它包含哪些 tex 命令。
嗯,差不多吧。
我认为最简单的方法是使用dvi->rtf转换器。我发布了一个问题:Q#1859373 dvi2rtf: who can convert DVI files to RTF。在那里,我发布了一个未经测试的实现,它给出了一个糟糕的解决方案,丢弃了所有格式。
有了这样一个工具,你就可以使用word2007/8和优秀的docx2tex实用程序将rtf转换为tex。
结果可能不好阅读,但我可以看到一些使用这种方法的情况。