我是Puppeteer的新手,正在尝试使用Node.JS和Puppeteer从网站中提取元数据。我似乎无法正确地获取语法。下面的代码可以完美地提取Title标签,使用两种不同的方法,以及来自段落标签的文本。如何提取名称为“description”的meta数据的内容文本?例如:
meta name="description" content="Stack Overflow is the largest, etc"
我将非常感激任何建议!我似乎找不到任何例子(5个小时的搜索和代码黑客之后)。我的示例代码:const puppeteer = require('puppeteer');
async function main() {
const browser = await puppeteer.launch({headless: false});
const page = await browser.newPage();
await page.goto('https://stackoverflow.com/', {waitUntil: 'networkidle2'});
const pageTitle1 = await page.evaluate(() => document.querySelector('title').textContent);
const pageTitle2 = await page.title();
const innerText = await page.evaluate(() => document.querySelector('p').innerText);
console.log(pageTitle1);
console.log(pageTitle2);
console.log(innerText);
};
main();
element.content
而不是element.textContent
:) - Amit