我有以下的bs4对象列表:
>>> listing
<div class="listingHeader">
<h2>
....
>>> type(listing)
<class 'bs4.element.Tag'>
我想将原始HTML作为字符串提取出来。我尝试过:
>>> a = listing.contents
>>> type(a)
<type 'list'>
所以这样行不通。我该怎么做?
我有以下的bs4对象列表:
>>> listing
<div class="listingHeader">
<h2>
....
>>> type(listing)
<class 'bs4.element.Tag'>
我想将原始HTML作为字符串提取出来。我尝试过:
>>> a = listing.contents
>>> type(a)
<type 'list'>
所以这样行不通。我该怎么做?
只需获取字符串表示:
html_content = str(listing)
这是一个未经美化的版本。
如果您想要一个美化过的版本,请使用prettify()
方法:
html_content = listing.prettify()
soup.prettify( formatter="html" )
来美化输出 - 参考https://www.crummy.com/software/BeautifulSoup/bs4/doc/#output-formatters - gr4nt3d