在我看到的所有BeautifulSoup示例和教程中,都是传递一个HTML/XML文档并返回一个soup对象,然后可以使用该对象来修改文档。但是,如何使用BeautifulSoup从头创建HTML/XML文档呢?换句话说,我有数据想要放入XML文件中,但是XML文件尚不存在,我想从头开始构建它。我该怎么做呢?
只需要创建一个空的BeautifulSoup()
对象:
soup = BeautifulSoup()
然后开始添加元素:
soup.append(soup.new_tag("a", href="http://www.example.com"))
对于XML,您可以使用xml
树构建器开始一个XML头:
soup = BeautifulSoup(features='xml')
首先需要安装lxml库。这将在 BeautifulSoup
对象上设置.is_xml
标志(也可以手动设置)。