我正在尝试保存一个网页(就像我们在浏览器中做的那样),连同所有内容和格式一起保存。我尝试了WebClient、WebRequest示例,但它们只能下载文本部分和有时的javascript。但没有css和图像等等。
在.Net中是否有任何api,或者任何第三方api可用?
我认为这是可能的,因为很多应用程序都可以运行离线阅读,并且它们以相同的格式和样式显示保存的页面。 如何实现? 有什么想法吗?
编辑1: 可以使用HtmlAgilityPack解析和保存网页。但是否有办法分离主要文章和其他内容,例如广告、其他外部链接。是否有办法区分相关和不相关的内容? (如果这个问题不清楚,我很抱歉)
此外,有人能提供一些建议,这些离线阅读应用程序(如稍后阅读/pocket等)如何保存网页并格式化它。
在C#中有没有类似的方法?
我认为这是可能的,因为很多应用程序都可以运行离线阅读,并且它们以相同的格式和样式显示保存的页面。 如何实现? 有什么想法吗?
编辑1: 可以使用HtmlAgilityPack解析和保存网页。但是否有办法分离主要文章和其他内容,例如广告、其他外部链接。是否有办法区分相关和不相关的内容? (如果这个问题不清楚,我很抱歉)
此外,有人能提供一些建议,这些离线阅读应用程序(如稍后阅读/pocket等)如何保存网页并格式化它。
在C#中有没有类似的方法?