设置
我使用终端(Mac OS)的标准命令将数据导出到 .csv 文件中,例如:
scrapy crawl spider -o spider_ouput.csv
问题
在导出新的spider_output.csv
时,Scrapy会将其附加到现有的spider_output.csv
中。
我可以想到两个解决方案:
- 命令Scrapy进行覆盖而不是附加
- 在爬行之前命令终端删除现有的
spider_output.csv
我已经读到了(让我吃惊的是)Scrapy目前无法执行1号。一些人已经提出了解决方法,但我似乎无法使它工作。
我已经找到了一个解答来解决第二个问题,但我也无法使其工作。
有人可以帮帮我吗?也许有第三个解决方案我没有想到的?