我所做的研究越多,前景变得越暗淡。
我正在尝试使用Python进行Flat Save或Static Save网页。这意味着将所有样式合并为内联属性,并将所有链接更改为绝对URL。
我已经尝试了几乎所有免费的转换网站、API甚至是Github上的库。但是没有一个令人印象深刻。我找到的最好的Python实现用于平整化样式是https://github.com/davecranwell/inline-styler。我稍微改编了一下以适应Flask,但生成的文件并不是很好。以下是它的外观: 显然,它应该看起来更好。以下是它应该的样子: 似乎处理格式错误的HTML、无法识别的CSS属性、Unicode错误等问题是一个永无止境的斗争。有没有更好的方法建议?我知道可以在本地浏览器中选择文件->保存,但当我尝试批量执行此操作并提取特定的XPath时,这并不可行。
Evernote的网络剪贴板似乎使用了iFrames,但这似乎比我想象的要复杂。但至少在Evernote上,剪贴内容看起来还不错。
我正在尝试使用Python进行Flat Save或Static Save网页。这意味着将所有样式合并为内联属性,并将所有链接更改为绝对URL。
我已经尝试了几乎所有免费的转换网站、API甚至是Github上的库。但是没有一个令人印象深刻。我找到的最好的Python实现用于平整化样式是https://github.com/davecranwell/inline-styler。我稍微改编了一下以适应Flask,但生成的文件并不是很好。以下是它的外观: 显然,它应该看起来更好。以下是它应该的样子: 似乎处理格式错误的HTML、无法识别的CSS属性、Unicode错误等问题是一个永无止境的斗争。有没有更好的方法建议?我知道可以在本地浏览器中选择文件->保存,但当我尝试批量执行此操作并提取特定的XPath时,这并不可行。
Evernote的网络剪贴板似乎使用了iFrames,但这似乎比我想象的要复杂。但至少在Evernote上,剪贴内容看起来还不错。
getComputedStyle
并将其应用于HTML标签。 - Mohsen