我正在使用Python和BeautifulSoup4(我并不依赖它)来爬取一个网站。问题是,当我使用urllib获取页面的HTML时,它并不包括整个页面,因为其中一些内容是通过JavaScript生成的。有没有办法解决这个问题?
我正在使用Python和BeautifulSoup4(我并不依赖它)来爬取一个网站。问题是,当我使用urllib获取页面的HTML时,它并不包括整个页面,因为其中一些内容是通过JavaScript生成的。有没有办法解决这个问题?
BeautifulSoup
。但是,无论如何,这个选项比第一个选项慢一些。