<p class="qotCJE">
<a href="https://ejje.weblio.jp/content/to+pay" title="to payの意味" class="crosslink">to pay</a>
<a href="https://ejje.weblio.jp/content/charges" title="chargesの意味" class="crosslink">charges</a>
from one's
<a href="https://ejje.weblio.jp/content/bank+account" title="bank accountの意味" class="crosslink">bank account</a>
</p>
我将尝试重构这个被拆分成上述HTML代码的句子:“从某人的银行账户支付费用”。我的问题是句子的一部分没有包含在HTML标签中。当我尝试使用以下内容时:
BeautifulSoup.find_all()
我只能获取链接标签之间的文本,当我尝试使用时。
BeautifulSoup.contents
我只得到“from one's”,但没有链接标签中间的文本。
有没有办法遍历这段代码并重构句子?
编辑: 上面的代码只是一个例子,我正在尝试爬取一个词典,因此字符串的顺序和哪些部分将在标签内/外是任意的。
soup.text
。 - Alex Hall.text
或者get_text()
应用到<p>
标签上,而不是<a>
标签。 - Alex Hall