我已经用PHP创建了一个非常简单的网络爬虫,它可以在一些足球网站上抓取比赛结果。
但是当我抓取一个网站时,需要0.5-1秒的时间。如果我有很多URL需要抓取,那么就需要花费很长时间。
以下是我的代码开始抓取网站:
但是当我抓取一个网站时,需要0.5-1秒的时间。如果我有很多URL需要抓取,那么就需要花费很长时间。
以下是我的代码开始抓取网站:
$doc = new DOMDocument();
$doc->loadHTMLFile("http://resultater.dai-sport.dk/tms/Turneringer-og-resultater/Pulje-Stilling.aspx?PuljeId=229");
$xpath = new DOMXpath($doc);
我自己创建了爬虫,也许有更好的方法或更快的方法?或者我的速度期望值太高了?