在使用Python编程时,如果我需要加载未定义实体的XHTML文档,我会创建一个解析器并更新实体字典(即nbsp
):
import xml.etree.ElementTree as ET
parser = ET.XMLParser()
parser.entity['nbsp'] = ' '
tree = ET.parse(opener.open(url), parser=parser)
我尝试使用VB.Net将XHTML文档解析为Linq XDocument:
Dim x As XDocument = XDocument.Load(url)
出现了XmlException:
引用未声明的实体“nbsp”
搜索了一下,我没有找到任何更新实体表或使用简单方法来解析XHTML文档中未定义实体的示例。
如何解决这个看起来很简单的问题呢?
XDocument.Load
方法是否也会读取 DTD 中的实体表? - Mr Lister