BeautifulSoup
中,.text
和 .get_text()
之间有什么区别?
获取元素文本时应该优先使用哪一个?
>>> from bs4 import BeautifulSoup
>>>
>>> html = "<div>text1 <span>text2</span><div>"
>>> soup = BeautifulSoup(html, "html.parser")
>>> div = soup.div
>>> div.text
'text1 text2'
>>> div.get_text()
'text1 text2'
get_text()
来使用自定义分隔符,并且应该使用它,因为.text
是一个私有属性,甚至没有记录在文档中。 - Selcukget_text()
,因为它有明确的文档说明,但我发现很多bs4用户直接使用.text
,所以我对这种做法的缺点感到好奇。谢谢! - alecxediv.string
是什么? - Remi Guan