使用robotstxt和gsitemap模块简化Google Sitemaps提交

in

robotstxt是一个辅助生成 http://YourDrupalRoot/robots.txt 文件的模块.而robots.txt是可以帮助站长告知网络蜘蛛(搜索引擎的机器人)那些目录不要被收录,而那些希望被收录的咚咚.详细可以见robotstxt.org .

gsitemap是一个辅助Drupal站长提交Google Sitemaps的模块.其可以工作在两种不同的模式.

  1. 配合Sitemaps账号的设置,提供Sitemap.xml文件
  2. 没有Sitemaps账号的情况下主动提交Sitemap.xml文件(我不知道这样是否有效,只是在WatchDog中看到主动提交成功,因我有Sitemaps账号所以也没有深究)

在安装上以上2个模块后:

第一步、先配置robotstxt模块,其默认的配置如下

User-agent: *
Disallow: /node/
Disallow: /database/
Disallow: /includes/
Disallow: /misc/
Disallow: /modules/
Disallow: /sites/
Disallow: /themes/
Disallow: /admin/







需要注意的是需要将

Disallow: /node/

这一行去掉,node可是Drupal的基本页面单元。

可以使用浏览器访问地址 http://YourDrupalRoot/robots.txt 来检查。如果看到以上的配置文本即配置成功。

第二步、确认sitemap.xml地址

gsitemap默认生成的地址是 http://YourDrupalRoot/gsitemap。而Google Sitemaps对非.xml结尾的地址似乎有问题。总是提示找不到。

解决方法就是使用Drupal系统自带的path(url_alias/Url别名)模块设置一个gsitemap.xmlgsitemap的别名。

第三步A、配置gsitemap模块主动提交

方法很简单:只需要在模块配置中的Other Settings中勾选上有Submit sitemap to Google的两项即可。

到底有效与否不知道 ;-P

第三步B、配置gsitemap模块适应Sitemaps账号

  1. 在Google Sitemaps的Sitemaps地址一栏填写:http://YourDrupalRoot/gsitemap.xml
  2. 使用上传文件的方式验证网站
  3. 复制下给出的文件名,将这个文件名粘贴到模块设置Other Settings中的Verification link

剩下的就是等待迎接Google的蜘蛛人。;-)

评论

发表新评论

此内容将保密,不会被其他人看见。
  • 您可以发表 PHP 代码。当然,您需要包括 <?php ?> 标签。
  • 自动将网址与电子邮件地址转变为链接。

更多关於格式化选项的信息

CAPTCHA
网络上没人知道你是机器还是人?也许下面的验证码可以给你分类-_!
Image CAPTCHA
Copy the characters (respecting upper/lower case) from the image.