我正在使用BeautifulSoup从此网站的搜索结果中提取一些数据:http://www.cpso.on.ca/docsearch/default.aspx
以下是经过.prettify()处理的HTML代码示例:
基本上每个块都有3个块。
我希望输出结果为:
Smith, Jane Suite 042 21 Jump St Toronto ON M4C 5T2
我还需要将条目分隔为新行。
我在编写第二个块中存储的地址时遇到了问题。
我也将其写入文件中。
到目前为止,这是我的代码... 它不起作用 :p
<tr>
<td>
<a class="doctor" href="details.aspx?view=1&id= 72374">
Smith, Jane
</a>
(#72374)
</td>
<td>
Suite 042
<br />
21 Jump St
<br />
Toronto ON M4C 5T2
<br />
Phone: (555) 555-5555
<br />
Fax: (555) 555-555
</td>
<td align="center">
</td>
</tr>
基本上每个块都有3个块。
我希望输出结果为:
Smith, Jane Suite 042 21 Jump St Toronto ON M4C 5T2
我还需要将条目分隔为新行。
我在编写第二个块中存储的地址时遇到了问题。
我也将其写入文件中。
到目前为止,这是我的代码... 它不起作用 :p
for tr in soup.findAll('tr'):
#td1 = tr.td
td2 = tr.td.nextSibling.nextSibling
for a in tr.findAll('a'):
target.write(a.string)
target.write(" ")
for i in range(len(td2.contents)):
if i != None:
target.write(td2.contents[i].string)
target.write(" ")
target.write("\n")
for
循环缺少:
,而且内部循环没有缩进。那是实际的代码还是发布时的错误? - Jacob<a></a>
中,为什么您期望代码将其打印出来? - Francis Avila