如何在网站上findsitemap.xmlpath?
我怎样才能find网站的sitemap.xml文件?
例如去stackoverflow / sitemap.xml得到我一个404。
在stackoverflow / robots.txt写入以下内容:
“这在技术上是无效的,因为对于一些被遗忘的原因,sitemappath必须是ABSOLUTE而不是相对的。Sitemap:/sitemap.xml”
我不认为有一个标准的网站地图的位置。 这就是为什么当您使用Google的网站pipe理员工具添加网站地图时,应该指定任意url到您的站点地图的原因。
没有标准,所以没有保证。 有了这个说法,网站地图通常会被贴上标签,并且是这样的:
example.com/sitemap.xml
在某些服务器上,情况是敏感的,所以记住这一点。 如果不存在,请查看根目录中的robots文件:
example.com/robots.txt
如果您没有看到它在机器人文件中列出的Google头文件,请search:
site:example.com filetype:xml
这会将结果限制为目标域上的XML文件。 在这一点上,它的试验和错误,并根据您正在使用的网站的具体情况。 如果您从上面的Googlesearch短语中获得了几页结果,请尝试进一步限制结果:
filetype:xml site:example.com inurl:sitemap
要么
filetype:xml site:example.com inurl:products
如果仍然无法find它,可以right-click > "View Source"
然后为.xml
执行search(又名:“控制查找”或Ctrl + F
),以查看代码中是否有引用。
网站地图的位置影响可以包含哪些url,但是没有标准。 这是一个很好的链接,更多的解释: http : //www.sitemaps.org/protocol.html#location
根据协议文档 ,网站devise人员至less可以使用三种选项将sitemap.xml位置通知给search引擎:
- 通过他们提供的界面通知每个search引擎的位置
- 将url添加到robots.txt文件
- 通过http提交url到search引擎
因此,除非他们select在其robots.txt文件上发布站点地图位置,否则不能真正知道他们放置sitemap.xml文件的位置。