什么是不同的站点地图格式?何时使用它们

2020-10-17| 发布者: admin| 查看: |

  有9种站点地图格式这是Google的网站管理员工具支持的。站点地图允许网站管理员通知各个搜索引擎网站上可以抓取的网站链接。站点地图还向网站管理员提供有关XML文件中每个URL的信息。其他详细信息包括上次更新URL时,更改频率以及与网站中其他网址进行比较时的重要性。这将允许搜索引擎更有效地抓取网站。根据网站的类型或发布的内容,有不同的方法来生成站点地图。这是必要的,因为内容审核使用站点地图进行爬网,从而提供有关如何使其更好的信息。允许正确的站点地图类型不仅可以使网站爬行更成功,而且可以在搜索引擎中取得更好的成功。

  生成的站点地图中包含的所有信息都是搜索引擎在为互联网用户提供搜索结果时所寻找的信息。无论网站是由新手还是专业网站管理员构建,重要的是要知道哪种类型的网站地图是网站(以及网站上的内容)的理想选择,以及如何构建网站以充分发挥其潜力。

  WEB页面的XML站点地图文件

  这些文件将用于从网站提交页面。

  这是提交的首选网页格式。并非所有搜索引擎都支持下面的站点地图,所有来自sitemaps.org的搜索引擎都可以支持网页的XML站点地图。

  当它是最简单的形式时,它是一个XML文件,它将列出网站的URL,以及与每个URL关联的所有其他元数据。这将包括最后更新时间,更改频率,重要程度以及相对于网站上其他网址的相对位置。这使搜索引擎能够更智能,更高效地抓取网站。

  这些Web爬网程序从站点内的链接发现页面,然后从其他站点发现页面。站点地图将补充数据,这些数据将允许支持站点地图的抓取工具选择站点地图中的所有网址,然后使用其关联的元数据了解这些网址。

  使用站点地图生成器并不能保证搜索引擎包含网页,但它可以提供有关如何更好地抓取您的网站的信息。

  RSS 2.0和ATOM 1.0

  RSS 2.0提要有时是通过许多博客自动创建的。

  RSS代表Really Simple Syndication,它是一种网站内容联合格式。它是一种XML语言。

  在最高级别,RSS文档是RSS元素,具有称为版本的强制属性,该属性规定文档将遵循哪个版本的RSS。当它符合规范时,2.0必须是版本。

  Atom 1.0提要是基于XML的文档。提要由“条目”组成,每个条目由大量元数据组成,每个条目都有一个标题。

  Atoms主要用于新闻网站的博客和头条新闻。

  Atom被用作RSS的替代品,因为RSS被认为有缺陷而开发。

  据说Atom格式干净利落地完全指定,可以自由扩展到任何人,由每个人实现,绝对供应商中立。

  许多应用程序(包括iTunes)都支持使用Atom 1.0。

  使用Atom格式允许在非Atom的Feed文档的上下文之外再次使用元素。

  当资源和内容的链接包含超出正常美国ASCII字符集的字符时,使用Atom很方便。

  带有网页网址的文本文件

  如果您无法使用上述任何格式创建站点地图,则可以创建一个包含URL的文本文件。站点地图每行将有一个Web URL,许多搜索引擎(如Google和Yahoo)都可以扫描文本文件站点地图。确保站点地图和搜索引擎兼容。跟着这些步骤:

  文本站点地图不应包含超过50,000个网址。

  对于Yahoo,主文本站点地图应命名为urllist.txt。

  文本文件站点地图应保存为UTF-8文档。如果您在一个非英语字符的网站上进行交易,这一点尤为重要。

  用于视频搜索的XML站点地图文件

  您网站上的视频可以编入索引,并可在Google Video上进行搜索。Google视频站点地图向Google提供有关视频及其内容的元数据。谷歌的视频网站是在互联网上搜索视频和使用视频站点地图的最大实体,网站所有者可以告诉搜索引擎类别,标题,描述,运行时间以及针对每个视频的观众网站。这有助于搜索引擎获得网站上丰富的视频内容的知识,这将反过来改善在视频搜索结果上查看时网站的列表。

  视频信息(包括URL)在作为单独的站点地图提交时或在搜索引擎的视频搜索中包含在常规站点地图中时可搜索。

  然后,视频将显示为视频的缩略图,以及从站点地图中提取的相关信息。

  用于视频搜索的媒体RSS源

  mRSS订阅源是RSS订阅源的扩展,主要区别在于它指定它是站点地图中的媒体RSS扩展。这是必要的,以便新闻阅读器应用程序知道提要中包含媒体,并且他们将反过来知道如何解释它。

  Feed中的标记将包含描述符,例如“medium”和“item”。媒体将是图像,文档,音频或视频。

  在Feed中,还可能有标签,以便让观众更深入地了解所包含的信息。文件大小,类型,高度,宽度和持续时间将是Feed中包含的描述符。此处将再次显示媒体,并且还将显示“isDefault”,指示此项目是否为默认项目或第一个要播放的项目。

  将会看到标题,描述和缩略图,它们非常明显。

  可选标签包括:评级,关键字,版权,播放器,赠送金额和文字。“text”标签可以允许包含网站的文本记录(或隐藏式字幕文件)。

  GOOGLE代码搜索的XML站点地图文件

  此功能是Google在互联网上搜索源代码文件时的功能。这对于其网站具有源代码的网站所有者非常有用,因为他们可以创建帮助Google索引代码的代码站点地图。代码站点地图看起来像普通的XML站点地图,但确实有一些额外的XML站点地图要求和标记。

  请记住,在制作代码站点地图时,必须确保包含代码文件的所有相关文件扩展名。

  您可能还需要收紧作为代码文件接受的文件名模式。

  生成站点地图时,可以使用输出过滤器完成这两项操作。

  移动网页的XML站点地图文件

  这种格式允许开发人员识别针对移动设备优化的内容,因为最近格式发生了很小的变化。

  除非为功能手机(非智能手机)设计了特定功能手机版本的网站,否则不应创建功能手机站点地图。

  可以创建列出视频内容的单独站点地图,或将视频内容的相关信息添加到已存在的站点地图中。对于网站制作者来说,这只是一个方便的问题。

  功能手机的移动站点地图利用站点地图协议以及其他命名空间和标记要求。

  如果选择使用站点地图生成工具,请检查它是否可以为移动网页创建站点地图。

  请包含标记,以确保正确抓取移动网址。

  列出在单个站点地图中提供多种标记语言的URL。

  Search Console将自动检测并支持XHTML移动配置文件,WML和cHTML。

  地理数据的XML站点地图文件

  当您的网站上存在GeoRSS或KML文件形式的地理数据时,可以使用此选项。

  搜索引擎正在改进和创新使用位置数据的新方法。

  如果搜索引擎具有用户的位置,则它会将该位置的结果推送到搜索到的任何项目的搜索结果页面的顶部。

  即使用户未在搜索字词中输入其位置,也会发生这种情况。这就是为什么网站所有者将准确的位置信息纳入其网站非常重要的原因。

  地理站点地图是一种特定形式的XML,它将包含所有位置的所有地理信息。

  有专门针对地理数据的站点地图生成器。这些对新手网站管理员很有帮助。

  找到创建地理站点地图所需的工具。

  正确填写您的商家信息。

  提供网站详细信息。

  您现在可以下载KML和地理站点地图详细信息,然后将其上传到您的网站。使用FTP上传器。

  向您的网站管理员提供地理站点地图。

  新闻的XML站点地图文件

  为新闻设计的网站现在可以通过这种特殊的站点地图格式提交新闻内容。在处理文件之前,必须先向这些用户注册Google新闻。

  新闻站点地图应该是“最新的” - 它应该只包含过去2天内发布的文章的URL。超过2天的文章可以从新闻站点地图中删除,但将保留30天的新闻索引。

  我们鼓励网站创建者不断更新他们的新闻站点地图,并发布新文章。

  创建新闻站点地图时,它可能包含不超过1,000个URL。要包含更多内容,您必须将URL分解为多个站点地图,然后使用站点地图索引文件来帮助管理它们。

  使用站点地图协议中提供的XML格式。站点地图索引文件,不应列出超过50,000个站点地图。此限制的原因是为了确保在提供大文件时Web服务器不会过载。

  发布新闻文章时,您不应每次都创建新闻站点地图。您应该使用新文章URL更新当前站点地图。

  请勿使用Google Sitemap生成器创建新的站点地图,因为这会包含与某些新闻文章不对应的网址。有很多第三方工具可以帮助生成Google新闻站点地图。

  创建站点地图后,将其上传到包含新闻文章的最高级目录。

  网站管理员可以为网站选择正确的站点地图格式,也可以从提供正确类型的生成器创建站点地图。在选择站点地图类型时,网站管理员应考虑将在网站上发布的内容类型以及相关的任何地理数据。正确执行所有这些操作不仅可以使爬网更容易,而且有助于确保网站格式正确并通过搜索引擎准确找到。当网站所有者不确定要使用哪种网站地图格式时,他们应该审核其内容并选择最适合他们的内容。

 
QQ在线咨询
售前咨询热线
023-63612427
售后服务热线
023-63612876
返回顶部