我正在使用lxml解析一些HTML。HTML如下:
<td valign="top">first text field<br>second text field</td>
不,换行标签在后面没有关闭。
element.text
返回其中的第一个文本,而 element.xpath('string()')
返回两个文本,且没有 \n
或其他分隔符。
我想如果我只想要第二个文本字段,可以进行两次解析并从前者中“减去”后者,但这不是理想的。我认为必须有其他方法可以获取第二个文本字段,但我却被难住了。