我正在尝试使用PHP、CURL和POST方法来抓取一个网站,以便在网页抓取之前提交一个表单。我遇到的问题是与POST方法相关的:没有数据提交到服务器,因此抓取的网页不包含我要查找的内容。
我确定问题与表单类型有关:enctype="multipart/form-data"。 考虑到表单是multipart/form-data,我该如何管理这个POST请求? 我需要以特殊的方式编码post_string吗?
以下是我正在使用的代码:
function curl($url) {
//POST string
$post_string="XXXX";
$options = Array(
CURLOPT_RETURNTRANSFER => TRUE,
CURLOPT_FOLLOWLOCATION => TRUE,
CURLOPT_AUTOREFERER => TRUE,
CURLOPT_CONNECTTIMEOUT => 120,
CURLOPT_TIMEOUT => 120,
CURLOPT_MAXREDIRS => 10,
CURLOPT_USERAGENT => "Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.9.1a2pre) Gecko/2008073000 Shredder/3.0a2pre ThunderBrowse/3.2.1.8",
CURLOPT_URL => $url,
CURLOPT_CAINFO => dirname(__FILE__)."/cacert.pem",
CURLOPT_POSTFIELDS => $post_string,
);
$ch = curl_init();
curl_setopt_array($ch, $options);
$data = curl_exec($ch);
curl_error($ch);
curl_close($ch);
return $data;
}
$scraped_page = curl("XXXURLXXX");
echo $scraped_page;
谢谢!