PDF 转换为 Github 风格的 Markdown

10

我有一份PDF格式的项目描述,希望能够在github网站上预览它,而不是点击“查看原始文件”并下载。

我曾想过可能存在从pdf转换为github风格markdown的转换器,但没有找到。

再次说明,我的输入是一个pdf文件,我想要的输出是在github网站上预览PDF文件的内容,而不需要下载。


PDF是一种非常复杂的格式。它可能有许多层信息。它甚至可能不包含实际文本,只有轮廓符号。连字可能会被相应的Unicode符号替换。任何非平凡的格式都很难(如果可能的话)转换为Markdown。而且你不能对比PDF文件,所以如果你的描述发生了变化,你只能在你的repo中得到一个新的blob。总的来说,将你的描述保留在“.md”中并生成“.pdf”更加方便。 - fjarri
@Bogdan,这不是关于保留的问题,而是文件以PDF格式提供。 - Seçkin Savaşçı
这就是为什么它不是一个答案,而只是一条评论。我只是想提出一个想法,展示一个可能的转换器有多么复杂和不可靠。我只知道基于OCR的解决方案可以做到这一点,但似乎有些过度了。 - fjarri
@Bogdan 我完全同意基于OCR的解决方案是一种过度杀伐的做法。 - Seçkin Savaşçı
现在已经可以实现了!请查看我的(更新后的)答案。 - VonC
@VonC 但是如何将PDF文件生成Markdown文件呢? - lifebalance
1个回答

2
2015年3月更新:“PDF查看!”

只需浏览到PDF文档,我们就会像处理其他文件一样在您的浏览器中呈现它
演示文稿论文, 我们都可以为您提供服务。
感谢Mozilla和PDF.js的每一位贡献者。

https://cloud.githubusercontent.com/assets/2546/6703741/cbb216c0-ccfc-11e4-9c15-ecb6a33e8ddb.gif


原始答案(2014年10月):
这在GitHub上目前还不被支持。
你能做的最好的事情是使用Greasemonkey扩展程序,它可以让你调用一个PDF阅读器,比如最近的pdf.js(一个使用HTML5构建的便携式文档格式(PDF)查看器),让你完全在线查看PDF,而无需安装任何PDF插件。请参见jsbin上的示例

2
@lifebalance 这个问题与生成Markdown的过程关系不大,更多的是关于在GitHub上预览PDF内容的能力。要生成Markdown,您仍需要克隆存储库或直接下载PDF,并应用第三方工具(如https://github.com/johnlinp/pdf-to-markdown),但无法保证成功。 - VonC

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接