我有一个网络爬虫的Python脚本,需要运行数小时,无法在本地机器上完全运行。是否有便捷的方法将其部署到简单的Web服务器上?该脚本基本上将网页下载为文本文件。什么是最佳实现方式?谢谢!
我有一个网络爬虫的Python脚本,需要运行数小时,无法在本地机器上完全运行。是否有便捷的方法将其部署到简单的Web服务器上?该脚本基本上将网页下载为文本文件。什么是最佳实现方式?谢谢!
Scrapy
。 scrapyd
工具可以让您分发爬取 - 您可以在不同的服务器上运行多个scrapyd
服务并在它们之间分配负载。详情请参见:
还有一个Scrapy Cloud
服务:
Scrapy Cloud将高效的Scrapy开发环境与强大的完整功能的生产环境相结合,以部署和运行您的爬虫。这就像Scrapy的Heroku,尽管其他技术将在不久的将来得到支持。它在Scrapinghub平台的基础上运行,这意味着您的项目可以根据需要按比例扩展。
在2021年,Replit.com使得在云端编写和运行Python非常方便。