Selenium WebDriver和Unicode

Question

17

这是我使用Selenium 2库的第二天，但Unicode编码问题似乎从未消失。

我只是在执行最基本的操作，想要打印页面源代码：

from selenium import webdriver


driver = webdriver.Firefox()
driver.get("http://google.com")

print driver.page_source

当然，我遇到了一个错误：

。

UnicodeEncodeError: 'ascii' codec can't encode character u'\u0119' in position 62045:  
ordinal not in range(128)

我该如何将此内容编码为utf-8？

- nutship

2个回答

1

使用print(repr(string))代替print(string)以返回对象的可打印表示。

- ron_g

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- jaynp · Accepted Answer

根据这个类似的question，你有两个选项。

第一个是将源代码转换为全ASCII码，这样会失去Unicode字符。

(driver.page_source).encode('ascii', 'ignore')

第二个选项是将其编码为UTF-8，像这样：(driver.page_source).encode('utf-8')，我认为你会更喜欢这个选项。