使用Google Apps Script获取网站的HTML

4

我正在尝试使用Google Apps Script获取Google网站的HTML内容。 然而,当我使用该网站上建议的代码https://developers.google.com/apps-script/reference/url-fetch/url-fetch-app#fetch(String,Object)时。

var response = UrlFetchApp.fetch("https://sites.google.com/a/*********.net/********/****");
Logger.log(response.getContentText());

尽管如此,这并没有记录我试图访问的站点的html,它似乎返回默认的Google网站html。 我在网上找不到任何解释,除了该站点正在使用“https”,而上面的Google网站表示这不应该是问题。 我能够从其他网站获取html,包括一些使用https的其他站点,因此我感到困惑。

非常感谢您的帮助。

1个回答

2
尝试使用SitesApp API替代。 您的新代码将如下所示。
var page = SitesApp.getPageByUrl("https://sites.google.com/a/*********.net/********/****");
var htmlContent = page.getHtmlContent();
Logger.log(htmlContent);

我认为你当前代码中的问题与身份验证有关。如果你的网站是私有的(必须登录才能查看),发出未提供身份验证信息的http请求可能不起作用。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接