我正在开发一个应用程序,它从互联网聚合一些信息,并重新格式化内容。因此,我正在寻找一种解析HTML的方法。考虑到XML和HTML在结构上非常相似,我想“也许我应该只使用NSXMLParser”,我已经在使用它来解析我的RSS订阅,并且已经习惯了使用它,但我遇到了一个问题。
解析器无法识别<p>
作为元素。它可以轻松提取像<title>
或<img>
这样的元素,但不喜欢<p>
。是否有人尝试过这样做,并且如果有的话,您对此问题有任何建议或解决方法吗?我认为XMLParser适用于我正在做的事情,并且我想使用它,但是,如果我无法获得<p>
元素中的文本,那么它对我来说完全没有用。
欢迎任何建议,即使是建议完全不同的方法。我已经研究了一些第三方库来完成此操作,但据我所读,它们都存在一些错误,并且我更愿意使用Apple提供的东西。