我有一些使用SGML结构化的文档,并且有一个DTD文件描述了这种结构。
有人能向我推荐一个适用于Python 3的库或模块以解析这些数据吗?对于Python 2.x,我的谷歌搜索结果似乎只有SGMLParser,但这当然已经被弃用(并从Py3k中完全删除)。
许多人似乎建议使用lxml
,但由于依赖性问题,这对我来说不是一个选项。
我知道BeautifulSoup
非常适合混乱的标记,但A)在我上次听到它时它不兼容py3k,并且B)这个内容结构良好。
我有一些使用SGML结构化的文档,并且有一个DTD文件描述了这种结构。
有人能向我推荐一个适用于Python 3的库或模块以解析这些数据吗?对于Python 2.x,我的谷歌搜索结果似乎只有SGMLParser,但这当然已经被弃用(并从Py3k中完全删除)。
许多人似乎建议使用lxml
,但由于依赖性问题,这对我来说不是一个选项。
我知道BeautifulSoup
非常适合混乱的标记,但A)在我上次听到它时它不兼容py3k,并且B)这个内容结构良好。