我正在使用 playwright 库进行网络爬虫,并且URL存储在CSV文件中。我尝试读取CSV文件并将URL选择到一个数组中,以便在爬取代码中使用。
这是我编写的代码。
在方法“.on('data'”中,值被推入数组并打印到控制台,但是在执行后,当我尝试从数组中获取URL时,它返回一个空数组。
这是我编写的代码。
// Support
const csv = require('csv-parser');
const fs = require('fs');
// Array to store the URL.
var urls = [];
// This prints an empty array.
console.log(urls);
fs.createReadStream('sample.csv')
.pipe(csv())
.on('data', (row) => {
// Trying push the URL in the array
urls.push(row);
// This prints the values of URLs
console.log(urls);
})
.on('end', () => {
console.log('CSV file successfully processed');
});
// Here I don't see the URLs but an empty array.
console.log("URLS:" + urls);
在方法“.on('data'”中,值被推入数组并打印到控制台,但是在执行后,当我尝试从数组中获取URL时,它返回一个空数组。