PhantomJS进程间通信

3

我想实现这样的一个解决方案:使用PhantomJS打开一个网站,对其进行评估,并将输出保存到文件中以供处理。特别是扫描恶意脚本。我已经成功地实现了使用运行一次的PhantomJS的解决方案。例如,下面的代码完美地工作...

var system = require('system');
var page = require('webpage').create();
var lastReceived = new Date().getTime();
var requestCount = 0;
var responseCount = 0;
var requestIds = [];
var fileSystem = require('fs');
var startTime = new Date().getTime();

page.onResourceReceived = function (response) {
    if(requestIds.indexOf(response.id) !== -1) {
        lastReceived = new Date().getTime();
        responseCount++;
        requestIds[requestIds.indexOf(response.id)] = null;
    }
};
page.onResourceRequested = function (request) {
    if(requestIds.indexOf(request.id) === -1) {
        requestIds.push(request.id);
        requestCount++;
    }
};

page.open('http://adserver.example.com/adserve/;ID=164857;size=300x250;setID=162909;type=iframe', function () {});

var checkComplete = function () {
    // We don't allow it to take longer than 5 seconds but
    // don't return until all requests are finished
    if((new Date().getTime() - lastReceived > 300 && requestCount === responseCount) || new Date().getTime() - startTime > 5000)  {
        clearInterval(checkCompleteInterval);
        console.log(page.content);
        phantom.exit();
    }
}

var checkCompleteInterval = setInterval(checkComplete, 1);

然而,我尝试创建一个不需要反复重新启动PhantomJS的自动化系统极其困难,并且存在相当大的开销。 我尝试使用命名管道从中读取数据,然后尝试打开传递过来的url,但由于某些原因无法正确打开。非常希望并深表感激能够得到任何关于此事的指导。

1个回答

5

需要提及的一点是,PhantomJS在HTTP通信方面表现出色。因此,为了实现高级功能和更好的性能,我总是使用资源池模式+webserver模块。尽管该模块仍被标记为实验性的,但我一直发现它相当稳定,直到现在为止。

因此,在您的情况下,最好通过HTTP通信而不是通过文件IO进行通信。

以下是一个非常基本的示例:

var page = require('webpage').create();
var server = require('webserver').create();
var system = require('system');
var host, port;

if (system.args.length !== 2) {
    console.log('Usage: server.js <some port>');
    phantom.exit(1);
} else {
    port = system.args[1];
    var listening = server.listen(port, function (request, response) {
        var page=require('webpage').create();
        page.open(request.post.target, function(status){
            response.write("Hello "+page.title);
            response.close();
        });
    });
    if (!listening) {
        console.log("could not create web server listening on port " + port);
        phantom.exit();
    }

    //test only
    var url = "http://localhost:" + port + "/";
    console.log("SENDING REQUEST TO:");
    console.log(url);
    var data='target=http://stackoverflow.com/';
    page.open(url,'post', data, function (status) {
        if (status !== 'success') {
            console.log('FAIL to load the address');
        } else {
            console.log("GOT REPLY FROM SERVER:");
            console.log(page.content);
        }
        phantom.exit();
    });
}

这是一个非常巧妙的侧面解决问题的方法! - Aidan Kane

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接