我能在PHP中使用Scrapy吗?还有没有类似的工具适用于PHP?
虽然我不是技术人员,但我正在研究现有的网络爬虫工具及其特点,以便支持我的技术同事。
我能在PHP中使用Scrapy吗?还有没有类似的工具适用于PHP?
虽然我不是技术人员,但我正在研究现有的网络爬虫工具及其特点,以便支持我的技术同事。
Scrapy是针对Python的,无法在PHP中使用。
然而,在PHP中您可以使用Goutte来完成这项工作。它使用Guzzle HTTP和Symfony组件,如BrowserKit和DomCrawler在后台执行此任务。
看看这个:
use Goutte\Client;
$client = new Client();
// Go to the symfony.com website
$crawler = $client->request('GET', 'http://www.symfony.com/blog/');
// Get the latest post in this category and display the titles
$crawler->filter('h2 > a')->each(function ($node) {
echo $node->text().'\n';
});
注意,它不支持JavaScript。
你不能使用PHP编写Scrapy爬虫。
尽管如此,通常使用Scrapy(使用Python编写爬虫)并将提取的数据存储在数据库或应用程序可访问的其他地方非常普遍。例如,直接将提取的项目存储到ElasticSearch中并使您的应用程序查询ES以搜索/过滤/聚合数据相当容易。
但是,如果您的同事不了解Python,则需要花费一些时间学习语言,然后再学习Scrapy框架。