我一直在用Java编写代码来获取一些页面上的数据,而Jsoup是最好的处理库之一。但是,不幸的是,我必须将整个代码移植到C/C++上。然而,我找不到任何像样的html解析器来用于C++。是否有类似于Jsoup的C++库,或者如何实现类似的结果?
[目前我正在使用Curl来获取页面的源代码,并在互联网上漫游以寻找一个html解析器]
我一直在用Java编写代码来获取一些页面上的数据,而Jsoup是最好的处理库之一。但是,不幸的是,我必须将整个代码移植到C/C++上。然而,我找不到任何像样的html解析器来用于C++。是否有类似于Jsoup的C++库,或者如何实现类似的结果?
[目前我正在使用Curl来获取页面的源代码,并在互联网上漫游以寻找一个html解析器]
很遗憾,我猜在C++中没有像Jsoup那样的解析器...
除了这里已经提到的库之外,这里有一个关于C++(还包括一些C)解析器的好概述:Free C or C++ XML Parser Libraries
对于解析,我使用TinyXML-2用于(Html-) DOM解析; 它是一个非常小的(只有2个文件)库,可以在大多数操作系统上运行(甚至是非桌面操作系统)。
如果您在使用C++ CLI,请查看NSoup - 适用于.NET的Jsoup端口。
还有一些:
也许您可以将文档对象模型/解析器和CSS选择器组合在一起?