Selenium WebDriver和Unicode

17

这是我使用Selenium 2库的第二天,但Unicode编码问题似乎从未消失。

我只是在执行最基本的操作,想要打印页面源代码:

from selenium import webdriver


driver = webdriver.Firefox()
driver.get("http://google.com")

print driver.page_source

当然,我遇到了一个错误:

UnicodeEncodeError: 'ascii' codec can't encode character u'\u0119' in position 62045:  
ordinal not in range(128)

我该如何将此内容编码为utf-8
2个回答

30

根据这个类似的question,你有两个选项。

第一个是将源代码转换为全ASCII码,这样会失去Unicode字符。

(driver.page_source).encode('ascii', 'ignore')

第二个选项是将其编码为UTF-8,像这样:(driver.page_source).encode('utf-8'),我认为你会更喜欢这个选项。


1

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接