使用Node.js从URL读取内容

Question

使用Node.js从URL读取内容

46

我正在尝试使用Node.js从URL中读取内容，但是我似乎只得到了一堆字节。我显然做错了什么，但我不确定是什么。这是我目前的代码：

var http = require('http');

var client = http.createClient(80, "google.com");
request = client.request();
request.on('response', function( res ) {
    res.on('data', function( data ) {
        console.log( data );
    } );
} );
request.end();

任何见解都会非常感激。

- Luke

4个回答

27

HTTP和HTTPS：

const getScript = (url) => {
    return new Promise((resolve, reject) => {
        const http      = require('http'),
              https     = require('https');

        let client = http;

        if (url.toString().indexOf("https") === 0) {
            client = https;
        }

        client.get(url, (resp) => {
            let data = '';

            // A chunk of data has been recieved.
            resp.on('data', (chunk) => {
                data += chunk;
            });

            // The whole response has been received. Print out the result.
            resp.on('end', () => {
                resolve(data);
            });

        }).on("error", (err) => {
            reject(err);
        });
    });
};

(async (url) => {
    console.log(await getScript(url));
})('https://sidanmor.com/');

- sidanmor

9

数据对象是一组字节的缓冲区。只需调用.toString()即可获取可读的代码：

console.log( data.toString() );

参考文献：Node.js缓冲区

- user578895

1

另一种选项是 console.log(JSON.stringify(data));。否则，我发现 npm install eyes 对于其 inspector() 功能非常有用。 - Dave

9

@sidanmor的代码略作修改。主要问题是，并非每个网页都是纯ASCII码，用户应该能够手动处理解码（甚至编码成base64）。

function httpGet(url) {
  return new Promise((resolve, reject) => {
    const http = require('http'),
      https = require('https');

    let client = http;

    if (url.toString().indexOf("https") === 0) {
      client = https;
    }

    client.get(url, (resp) => {
      let chunks = [];

      // A chunk of data has been recieved.
      resp.on('data', (chunk) => {
        chunks.push(chunk);
      });

      // The whole response has been received. Print out the result.
      resp.on('end', () => {
        resolve(Buffer.concat(chunks));
      });

    }).on("error", (err) => {
      reject(err);
    });
  });
}

(async(url) => {
  var buf = await httpGet(url);
  console.log(buf.toString('utf-8'));
})('https://httpbin.org/headers');

- ttimasdf

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- user896993 · Accepted Answer

尝试使用客户端的onerror事件查找问题。

var http = require('http');

var options = {
    host: 'google.com',
    path: '/'
}
var request = http.request(options, function (res) {
    var data = '';
    res.on('data', function (chunk) {
        data += chunk;
    });
    res.on('end', function () {
        console.log(data);

    });
});
request.on('error', function (e) {
    console.log(e.message);
});
request.end();