我该如何找到网站的sitemap.xml文件?
例如访问stackoverflow/sitemap.xml 会返回404错误。
在stackoverflow/robots.txt中写着:
"这其实是不正确的,因为由于某些无可救药的原因,Sitemap路径必须是绝对路径而不是相对路径。Sitemap: /sitemap.xml"
我该如何找到网站的sitemap.xml文件?
例如访问stackoverflow/sitemap.xml 会返回404错误。
在stackoverflow/robots.txt中写着:
"这其实是不正确的,因为由于某些无可救药的原因,Sitemap路径必须是绝对路径而不是相对路径。Sitemap: /sitemap.xml"
由于没有标准,所以也就没有保证。但通常情况下,网站地图会被自我标注并放置在根目录下,例如:
example.com/sitemap.xml
一些服务器对大小写敏感,需要注意这一点。如果在该目录下找不到地图文件,可以查看根目录下的机器人文件:
example.com/robots.txt
如果在机器人文件中找不到,则前往Google搜索:
site:example.com filetype:xml
这将限制搜索结果为目标域上的XML文件。此时需要基于你所使用的特定网站进行尝试和错误判断。如果通过以上Google搜索短语获得了多页搜索结果,则尝试进一步限制搜索结果:
filetype:xml site:example.com inurl:sitemap
或者
filetype:xml site:example.com inurl:products
如果仍然无法找到,请使用“右键单击 > 查看源代码”进行搜索(也称为“控制查找”或Ctrl + F
),以查看代码中是否有对它的引用。
我认为关于站点地图的位置并没有一个标准。这就是为什么当您使用Google的网络管理员工具添加站点地图时,应该指定一个任意的URL。
网站地图的位置影响它可以包含哪些URL,但除此之外没有标准。这里有一个很好的链接,可以提供更多解释:http://www.sitemaps.org/protocol.html#location
将domain.com更改为您想要查找网站地图的域名。 这应该列出给定域名的所有XML文件...包括所有站点地图 :)inurl:domain.com filetype:xml 点击此处查看网站地图搜索示例