如何在PHP中发出HTTP请求并不等待响应

248

在PHP中,有没有一种方法可以发出HTTP请求而不等待响应? 我不关心响应,我只想做一些类似于file_get_contents()的事情,但在执行我的代码的其余部分之前不等待请求完成。这对于在我的应用程序中设置“事件”或启动长时间的进程非常有用。

有什么想法吗?


10
一项函数 - 'curl_multi',在PHP文档中查找它。应该能够解决你的问题。 - James Butler
28
这篇帖子的标题有误导性。我想寻找类似于Node.js的请求或AJAX请求中真正异步调用的方法。被接受的答案不是异步的(它会阻塞而且没有提供回调函数),只是一个更快的同步请求。请考虑修改问题或接受其他答案。 - Johntron
通过标头和缓冲区处理连接并不是百分之百可靠的。我刚刚发布了一个新答案,与操作系统、浏览器或PHP版本无关。 - RafaSashi
3
异步并不意味着您不关心响应。它只是意味着调用不会阻塞主线程的执行。异步仍然需要一个响应,但是响应可以在另一个执行线程或稍后在事件循环中处理。这个问题正在询问一种"fire-and-forget"的请求方式,这取决于消息传递语义、是否关心消息顺序或交付确认,可以是同步或异步的。 - CMCDragonkai
我认为你应该以非阻塞模式进行此HTTP请求(这确实是你想要的)... 因为当你调用资源时,基本上你想知道是否已到达服务器(或任何其他原因,你只需要响应)。最好的答案就是使用fsockopen并将流读取或写入设置为非阻塞模式。这就像拨打电话然后忘记它一样。 - KiX Ortillan
18个回答

43

我之前接受的答案没有起作用。它仍然等待响应。但是这个方法有效,取自如何在PHP中进行异步GET请求?

function post_without_wait($url, $params)
{
    foreach ($params as $key => &$val) {
      if (is_array($val)) $val = implode(',', $val);
        $post_params[] = $key.'='.urlencode($val);
    }
    $post_string = implode('&', $post_params);

    $parts=parse_url($url);

    $fp = fsockopen($parts['host'],
        isset($parts['port'])?$parts['port']:80,
        $errno, $errstr, 30);

    $out = "POST ".$parts['path']." HTTP/1.1\r\n";
    $out.= "Host: ".$parts['host']."\r\n";
    $out.= "Content-Type: application/x-www-form-urlencoded\r\n";
    $out.= "Content-Length: ".strlen($post_string)."\r\n";
    $out.= "Connection: Close\r\n\r\n";
    if (isset($post_string)) $out.= $post_string;

    fwrite($fp, $out);
    fclose($fp);
}

79
这并不是异步的!尤其是如果另一端的服务器宕机,这段代码将会停顿30秒(fsockopen中的第5个参数)。此外,fwrite将花费很长时间来执行(可以通过stream_set_timeout($fp, $my_timeout)来限制),你最好将fsockopen的超时设置为较低的0.1秒(100毫秒),$my_timeout也设置为100毫秒。但你会冒请求超时的风险。 - Chris Cinelli
3
我保证这是异步的,不需要30秒。那只是超时时间上限。你的设置可能导致了这种情况,但对我而言,它运行得很好。 - Brent
11
@UltimateBrent,代码中没有表明它是异步的。它不会等待响应,但这并不意味着它是异步的。如果远程服务器打开连接然后挂起,这段代码将等待30秒直到达到超时。 - chmac
18
它之所以看起来像异步工作,是因为在关闭套接字之前没有从套接字中读取数据,所以即使服务器没有及时发送响应,它也不会挂起。然而,这绝对不是异步的。如果写缓冲区已满(非常少见),你的脚本一定会卡在那里。你应该考虑把标题改成类似“请求网页而无需等待响应”的内容。 - howanghk
8
这既不是异步的,也没有使用curl,你怎么敢称其为“curl_post_async”,还得到了赞... - Daniel W.
显示剩余12条评论

30
如果你控制想要异步调用的目标(例如你自己的“longtask.php”),你可以从那一端关闭连接,两个脚本将同时运行。它的工作原理如下:
  1. quick.php通过cURL打开longtask.php(没有任何技巧)
  2. longtask.php关闭连接并继续执行(神奇!)
  3. cURL在连接关闭时返回到quick.php
  4. 两个任务并行继续执行
我尝试过这种方法,并且它非常有效。但是,quick.php不会知道longtask.php的执行情况,除非你为进程之间创建某些通信方式。
在longtask.php中尝试使用以下代码,可以在做任何其他事情之前关闭连接,但仍然继续运行(并抑制任何输出):
while(ob_get_level()) ob_end_clean();
header('Connection: close');
ignore_user_abort();
ob_start();
echo('Connection Closed');
$size = ob_get_length();
header("Content-Length: $size");
ob_end_flush();
flush();

这段代码是从PHP手册的用户贡献注释中复制而来,并进行了一些改进。


5
可以实现,但如果你使用的是MVC框架,可能会很难实现,因为这些框架拦截和重写调用的方式不同。例如,在CakePHP控制器中无法运行。 - Chris Cinelli
这段代码有一个疑问,你需要在这些行之后执行longtask中的过程吗?谢谢。 - morgar
它不能完美地工作。尝试在你的代码后面添加 while(true);。页面将会挂起,这意味着它仍在前台运行。 - Sos.
我该如何“通过cURL打开它”?我该如何“创建进程间通信的一些手段”? - RedGuy11

24

你可以使用exec()来调用可以进行HTTP请求的工具,比如wget,但你必须将程序的所有输出都重定向到某个地方,比如一个文件或者/dev/null,否则PHP进程会等待该输出。

如果你想要完全将进程与Apache线程分离,请尝试类似以下方式(我不确定,但希望你能理解):

exec('bash -c "wget -O (url goes here) > /dev/null 2>&1 &"');

这不是一项好的业务,你可能需要类似于cron job调用心跳脚本来轮询一个实际的数据库事件队列以执行真正的异步事件。


4
同样地,我也做了以下操作:exec("curl $url > /dev/null &");。 - Matt Huggins
3
有没有叫做“bash -c“的' wget '比仅使用' wget '更有优势? - Matt Huggins
4
在我的测试中,使用exec("curl $url > /dev/null 2>&1 &");是这里最快的解决方案之一。它比上面“已接受”的答案中的post_without_wait()函数(14.8秒)极快(100次迭代只需1.9秒)。而且这是一个单行命令... - rinogo
使用完整路径(例如/usr/bin/curl)可以使它更快。 - Putnik
这会等到脚本执行完毕吗? - cikatomo
1
在大多数共享服务器上,exec() 不是被禁用了吗? - RedGuy11

17
你可以使用这个库:https://github.com/stil/curl-easy 然后就相当简单了:
<?php
$request = new cURL\Request('http://yahoo.com/');
$request->getOptions()->set(CURLOPT_RETURNTRANSFER, true);

// Specify function to be called when your request is complete
$request->addListener('complete', function (cURL\Event $event) {
    $response = $event->response;
    $httpCode = $response->getInfo(CURLINFO_HTTP_CODE);
    $html = $response->getContent();
    echo "\nDone.\n";
});

// Loop below will run as long as request is processed
$timeStart = microtime(true);
while ($request->socketPerform()) {
    printf("Running time: %dms    \r", (microtime(true) - $timeStart)*1000);
    // Here you can do anything else, while your request is in progress
}

以下是上述示例的控制台输出。它将显示一个简单的实时时钟,指示请求运行了多长时间:


动画


1
这应该是问题的被接受的答案,因为即使它不是真正的异步,它比被接受的答案和所有使用 Guzzle 的“异步”答案更好(在此期间您可以执行操作,而请求仍在进行). - 0ddlyoko
采纳的答案 © - programmer403
我不想在我的服务器上安装任何其他东西;我想要一个纯PHP版本。但是如果必须安装,我该如何安装呢? - RedGuy11
@0ddlyoko 为什么使用 exec() 比接受的答案更好呢? - Boolean_Type

16
截至2018年,Guzzle 已成为HTTP请求的事实标准库,在多个现代框架中使用。它是纯PHP编写的,不需要安装任何自定义扩展。
它可以非常好地执行异步HTTP调用,甚至可以池化它们,例如当您需要进行100个HTTP调用时,但不想同时运行超过5个。

并发请求示例

use GuzzleHttp\Client;
use GuzzleHttp\Promise;

$client = new Client(['base_uri' => 'http://httpbin.org/']);

// Initiate each request but do not block
$promises = [
    'image' => $client->getAsync('/image'),
    'png'   => $client->getAsync('/image/png'),
    'jpeg'  => $client->getAsync('/image/jpeg'),
    'webp'  => $client->getAsync('/image/webp')
];

// Wait on all of the requests to complete. Throws a ConnectException
// if any of the requests fail
$results = Promise\unwrap($promises);

// Wait for the requests to complete, even if some of them fail
$results = Promise\settle($promises)->wait();

// You can access each result using the key provided to the unwrap
// function.
echo $results['image']['value']->getHeader('Content-Length')[0]
echo $results['png']['value']->getHeader('Content-Length')[0]

请查看http://docs.guzzlephp.org/en/stable/quickstart.html#concurrent-requests


4
然而,这个答案不是异步的。显然 Guzzle 不支持此功能 - daslicious
2
Guzzle要求您安装curl。否则它是非并行的,并且它不会给您任何关于非并行的警告。 - Velizar Hristov
感谢@daslicious提供的链接 - 是的,看起来它并不完全是异步的(当您想发送请求但不关心结果时),但在该线程中向下滚动几篇文章,一个用户提供了一种解决方法,即设置非常低的请求超时值,仍然允许连接时间,但不等待结果。 - Simon East
我不想在我的服务器上安装任何其他东西;我想要一个纯PHP版本。但是如果必须安装Guzzle,我该怎么办? - RedGuy11
2
"composer require guzzle/guzzle" 给我的项目添加了 537 个文件和 2.5 百万字节的新代码!仅仅是一个 HTTP 客户端!不需要。 - EricP
3
我们的项目需要像@EricP这样的人才。 - matt

12
/**
 * Asynchronously execute/include a PHP file. Does not record the output of the file anywhere. 
 *
 * @param string $filename              file to execute, relative to calling script
 * @param string $options               (optional) arguments to pass to file via the command line
 */ 
function asyncInclude($filename, $options = '') {
    exec("/path/to/php -f {$filename} {$options} >> /dev/null &");
}

这不是异步的,因为exec会一直阻塞,直到你退出或者fork要运行的进程。 - Daniel W.
7
你有没有注意到末尾的& - philfreo
那么这会阻止脚本运行吗?我有点困惑。 - pleshy
2
@pleshy 不会的。& 符号意味着在后台运行脚本。 - daisura99
在大多数共享服务器上,exec() 不是被禁用了吗? - RedGuy11

9
  1. 使用 CURL 设置较低的 CURLOPT_TIMEOUT_MS 来模拟请求的中止。

  2. 设置 ignore_user_abort(true) 以在连接关闭后继续处理。

使用这种方法,无需通过头文件和缓冲区实现连接处理,过于依赖于操作系统、浏览器和 PHP 版本。

主进程

function async_curl($background_process=''){

    //-------------get curl contents----------------

    $ch = curl_init($background_process);
    curl_setopt_array($ch, array(
        CURLOPT_HEADER => 0,
        CURLOPT_RETURNTRANSFER =>true,
        CURLOPT_NOSIGNAL => 1, //to timeout immediately if the value is < 1000 ms
        CURLOPT_TIMEOUT_MS => 50, //The maximum number of mseconds to allow cURL functions to execute
        CURLOPT_VERBOSE => 1,
        CURLOPT_HEADER => 1
    ));
    $out = curl_exec($ch);

    //-------------parse curl contents----------------

    //$header_size = curl_getinfo($ch, CURLINFO_HEADER_SIZE);
    //$header = substr($out, 0, $header_size);
    //$body = substr($out, $header_size);

    curl_close($ch);

    return true;
}

async_curl('http://example.com/background_process_1.php');

后台进程

ignore_user_abort(true);

//do something...

NB

如果您想让cURL在小于一秒钟的时间内超时,可以使用CURLOPT_TIMEOUT_MS属性,但是在“类Unix系统”上有一个错误/“特性”,如果值小于1000毫秒,则导致libcurl立即超时并显示错误“cURL Error(28):Timeout was reached”。造成这种行为的解释如下:

[...]

解决方案是使用CURLOPT_NOSIGNAL禁用信号。

相关资源


1
你如何处理连接超时(解析、DNS)?当我将timeout_ms设置为1时,我总是最终得到“解析超时4毫秒”或类似的消息。 - Martin Wickman
我不知道,但对我来说4毫秒已经相当快了... 我认为你无法通过更改任何curl设置来更快地解决问题。也许尝试优化目标请求... - RafaSashi
1
好的,但timeout_ms = 1设置了整个请求的超时时间。因此,如果您的解析需要超过1毫秒的时间,则curl将超时并停止请求。我不明白这怎么可能会起作用(假设解析需要> 1毫秒)。 - Martin Wickman
1
虽然这似乎没有太多意义,但它可以完美地运行,并且是进行 PHP 异步操作的相当不错的解决方案。 - Jared Scarito
1
这个例子展示了如何成功地使用小于1000毫秒(1秒)的值来使用CURLOPT_TIMEOUT_MS,同时还使用CURLOPT_NOSIGNAL来避免已知的错误https://www.php.net/manual/en/function.curl-setopt.php#104597。 - undefined

5

您可以使用非阻塞套接字和PHP的某个pecl扩展:

您可以使用提供抽象层的库,将您的代码与pecl扩展分离:https://github.com/reactphp/event-loop

您也可以使用基于前一个库的异步HTTP客户端:https://github.com/reactphp/http-client

查看ReactPHP的其他库:http://reactphp.org

异步模型需要小心。 我建议观看此YouTube视频:http://www.youtube.com/watch?v=MWNcItWuKpI


我不想在我的服务器上安装任何其他东西;我想要一个纯PHP版本。但是如果必须安装,我该如何安装呢? - RedGuy11

5

swoole扩展。 https://github.com/matyhtf/swoole 是PHP的异步和并发网络框架。

$client = new swoole_client(SWOOLE_SOCK_TCP, SWOOLE_SOCK_ASYNC);

$client->on("connect", function($cli) {
    $cli->send("hello world\n");
});

$client->on("receive", function($cli, $data){
    echo "Receive: $data\n";
});

$client->on("error", function($cli){
    echo "connect fail\n";
});

$client->on("close", function($cli){
    echo "close\n";
});

$client->connect('127.0.0.1', 9501, 0.5);

我不想在我的服务器上安装其他任何东西;我想要一个纯PHP版本。但是如果必须的话,我该如何安装它呢? - RedGuy11

4

让我来展示我的方法 :)

需要在服务器上安装nodejs

(我的服务器发送1000个https get请求只需2秒钟)

url.php:

<?
$urls = array_fill(0, 100, 'http://google.com/blank.html');

function execinbackground($cmd) { 
    if (substr(php_uname(), 0, 7) == "Windows"){ 
        pclose(popen("start /B ". $cmd, "r"));  
    } 
    else { 
        exec($cmd . " > /dev/null &");   
    } 
} 
fwite(fopen("urls.txt","w"),implode("\n",$urls);
execinbackground("nodejs urlscript.js urls.txt");
// { do your work while get requests being executed.. }
?>

urlscript.js >

var https = require('https');
var url = require('url');
var http = require('http');
var fs = require('fs');
var dosya = process.argv[2];
var logdosya = 'log.txt';
var count=0;
http.globalAgent.maxSockets = 300;
https.globalAgent.maxSockets = 300;

setTimeout(timeout,100000); // maximum execution time (in ms)

function trim(string) {
    return string.replace(/^\s*|\s*$/g, '')
}

fs.readFile(process.argv[2], 'utf8', function (err, data) {
    if (err) {
        throw err;
    }
    parcala(data);
});

function parcala(data) {
    var data = data.split("\n");
    count=''+data.length+'-'+data[1];
    data.forEach(function (d) {
        req(trim(d));
    });
    /*
    fs.unlink(dosya, function d() {
        console.log('<%s> file deleted', dosya);
    });
    */
}


function req(link) {
    var linkinfo = url.parse(link);
    if (linkinfo.protocol == 'https:') {
        var options = {
        host: linkinfo.host,
        port: 443,
        path: linkinfo.path,
        method: 'GET'
    };
https.get(options, function(res) {res.on('data', function(d) {});}).on('error', function(e) {console.error(e);});
    } else {
    var options = {
        host: linkinfo.host,
        port: 80,
        path: linkinfo.path,
        method: 'GET'
    };        
http.get(options, function(res) {res.on('data', function(d) {});}).on('error', function(e) {console.error(e);});
    }
}


process.on('exit', onExit);

function onExit() {
    log();
}

function timeout()
{
console.log("i am too far gone");process.exit();
}

function log() 
{
    var fd = fs.openSync(logdosya, 'a+');
    fs.writeSync(fd, dosya + '-'+count+'\n');
    fs.closeSync(fd);
}

1
请注意,许多托管提供商不允许使用某些PHP函数(例如popen/exec)。请参阅disable_functions PHP指令。 - Eugen Mihailescu
大多数共享服务器上不是禁用了 exec() 吗?此外,我需要一个纯 PHP 的解决方案。 - RedGuy11

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接