我的第一个疑问是,是否可以编写通用脚本来爬取所有100个网站,或者在爬取技术中只能为特定网站编写脚本。 (愚蠢的问题)。我认为我应该询问哪种可能性更容易。为每个网站编写100个不同的脚本很难。
第二个问题。 我的主要语言是PHP,但在Stackoverflow上搜索后,我发现Python中最先进的爬虫之一是“Beautiful Soup”。 是否可以在PHP中调用Python中的“Beautiful Soup”? 还是最好使用Python编写整个脚本?
给我一些线索,告诉我该如何操作。
抱歉我的英语不太好。
此致敬礼,