WordPress站点地图插件Google (XML) Sitemaps Generator的配置

站点地图有很多类型:XML站点地图、新闻站点地图、视频站点地图,一般的博客只需要XML站点地图,生成此类地图的插件有Google (XML) Sitemaps Generator等,当然也可以用一些在线站点地图生成工具,如xml-sitemaps.com

Google (XML) Sitemaps Generator安装后需要注意一些设置才能更好的发挥作用。配置页面在 设置》XML-Sitemap,我们从上往下看。

1.上一次执行的结果

首先,最上面的模块是上一次生成sitemap的信息,还有手动生成的触发器。如果是刚刚安装插件还没有生成过地图,建议手动生成,如果你 Blog 或服务器更新了某些东西,可以在这里手动 重建 sitemap。

2.基本设置

接下来是基本设置模块,看图解

google xml sitemap基本设置

  • 创建Gzip的文件会在地图同级目录生成一个同样内容的gzip文件,由于是压缩过的,所以体积要比地图文件小,当站点地图非常大时,这种差异更明显,对于大型网站(上万个页面的网站)来说,有个gzip格式的站点地图让google抓取可以更快。 对于中小型网站来说,两者体积相差不大,不需要耗费服务器资源去生成这个gzip副本。
  • 建立模式下面的 在更改内容后自动更新sitemap是建议勾选的,这样可以保持地图的最新状态,缺点是这样会频繁更新地图,消耗比较多的服务器资源,不过一般的服务器,虚拟主机是不需要担心这个的。除非服务器太烂了,比如 Godaddy的虚拟主机,那还是取消这个吧,定期去第一个模块手动生成地图吧。
  • 通知Google,Bing博客的更新指的是像搜索引擎发送Ping通知:“Hello!我的网站更新了,详情参阅我们的sitemap文件XXXX。”
  • 将sitemap添加到虚拟robots文件去,这个功能笔者觉得是多余的。虚拟的robots文件是WordPress禁止搜索引擎收录时访问 域名/robots.txt路径时返回的一个虚拟的(并不存在的)robots文件(如果根目录有物理robots文件时会显示物理的robots文件)。既然都禁止搜索引擎收录了,还添加sitemap信息进去干什么呢,反而有挑逗Google的嫌疑:“hello!这是我的sitemap文件地址:XXXX,但是我不让你爬行!”
  • 高级设置里可以对sitemap进行一些限制,这个按照个人情况设置。最后一个在后台建立sitemap强烈建议勾选,使得我们不需要等待整个生成过程结束。

 3.附加页面

这个模块允许我们添加其他域名(尤其是子域名)的相关页面,比如用子域名开了个论坛 forum.jeriffcheng.com ,那么我可以在这里添加上这个地址。一般情况下不要添加过多的其他域名的链接,Google很反感这种做法。

4.日志优先+优先权

这个和最后一个模块优先权一起说。最后一个模块“优先权”可以统一设置各个类型的页面的优先权,而这个日志优先模块则可以覆盖最后一个模块的设置,给日志(Post)单独设置优先权。

日志优先权

5.Sitemap文件的位置

一般情况下不需要更改这个,默认路径是 域名/sitemap.xml

6.Sitemap内容

选择哪些类型的页面会包含在Sitemap中,建议勾选 首页+日志+独立页面+分类。并且包括最后修改时间。

sitemap包含哪些页面

7.不包含的项目

这个模块可以指定排除哪些分类的日志,或者指定日志

8.更改频率

这里设置的频率应该切合实际的情况,比如博客每天更新一贴,那么首页频率设为每天,可以让google蜘蛛及时抓取。需要提醒的是,有的人希望蜘蛛天天都来抓取内容,所以把频率都设为每天,连根本不会变化的独立页面都设成每天。这样做适得其反,Google蜘蛛并不傻,发现来几次后根本没新的内容,自己“上当”后将不再参考这个频率设置,将会根据网站实际更新情况调整爬行频率。蜘蛛说:“敢骗我,小心我以后不来了!”


所有这些都设置好之后,生成站点地图,打开查看,我们会发现头部和尾部有些文字说明和链接,这个插件强制插入的信息,估计想做些外链吧,如果想去掉这些的话,打开插件根目录的sitemap.xsl 文件,删掉相关部分,如下图所示:

google xml sitemap

 

作为开源程序,我们可以随意更改代码而不用承担责任,如果是商业化的代码,那就不能随意更改了 :)

站点地图生成后,我们需要在robots.txt文件最后一行注明地图的地址,以便让Google能很轻松地发现它,并且按照地图来抓取网站内容。如:

Sitemap: http://www.jeriffcheng.com/sitemap.xml

Leave a Reply

Your email address will not be published. Required fields are marked *