获取整个 Playwright 页面的 HTML 和文本

5

我正在Node.js中使用Playwright,获取页面文本或HTML时遇到了一些问题。我只想要将URL作为字符串获取,如下所示:<html><div class="123"><a>链接</a>一些内容</div><div>另一些内容</div></html>

const browser = await playwright.chromium.launch({
    headless: true,
});

const page = await browser.newPage();
await page.goto(url);

我试图使用const pageText = page.$('div').innerText;const pageText2 = await page.$$eval('div', el => el.innerText);,但两者都不起作用,只返回undefined。

1个回答

13

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接