我尝试解析HTML页面,获取货币值并写入CSV文件中。
我有以下代码:
问题是我不知道如何仅检索货币的值。 我尝试了一些正则表达式,如“^[0-9]{3}” - 以三个数字开头,但没有起作用。
#!/usr/bin/env python
import urllib2
from BeautifulSoup import BeautifulSoup
contenturl = "http://www.bank.gov.ua/control/en/curmetal/detail/currency?period=daily"
soup = BeautifulSoup(urllib2.urlopen(contenturl).read())
table = soup.find('div', attrs={'class': 'content'})
rows = table.findAll('tr')
for tr in rows:
cols = tr.findAll('td')
for td in cols:
text = td.find(text=True) + ';'
print text,
print
问题是我不知道如何仅检索货币的值。 我尝试了一些正则表达式,如“^[0-9]{3}” - 以三个数字开头,但没有起作用。