我正在使用以下代码获取网站的标题。
如果网站列表中包含“坏”(不存在的)网站/网页,或者该网站存在某种错误,例如“404页面未找到”等,则脚本将中断和停止。
我该如何让脚本忽略/跳过“坏”(不存在的)和有问题的网站/网页?
from bs4 import BeautifulSoup
import urllib2
line_in_list = ['www.dailynews.lk','www.elpais.com','www.dailynews.co.zw']
for websites in line_in_list:
url = "http://" + websites
page = urllib2.urlopen(url)
soup = BeautifulSoup(page.read())
site_title = soup.find_all("title")
print site_title
如果网站列表中包含“坏”(不存在的)网站/网页,或者该网站存在某种错误,例如“404页面未找到”等,则脚本将中断和停止。
我该如何让脚本忽略/跳过“坏”(不存在的)和有问题的网站/网页?