相信很多站长都知道robots吧,(不知道的搜一下),但是很多站长却忽略了元标记也可以阻止网站的收录。
我的博客地址是ourys.com,域名原来是一个电影网站,最后我没有做电影网站,一心做自己的博客网站。但是过了一个多月,google收录的还是我以前的网站,而且一直保持在原来的数量。我一直很相信google收录的速度,比别的搜索引擎快很多,但是别的搜索引擎都收录了,google却还是没有动静,用了google的网站管理员工具,sitmap没有问题(注意如果你是网站管理者切记使用google的管理员工具,让收录由被动变主动),反复提交了好多次,等了很久很久一点反应都没有,还用了google的reader工具(新站注意用一下,可以让google很快的检查到你网站的更新),一切的一切都没有动静,在管理员工具中看到的google爬虫确实又来到了自己的网站,这就让我纳闷了。最后没有办法,直接到了google网站管理员支持论坛把这个问题提出来了,两个小时左右就得到了google的回答,这是回答内容:
Hector 你好,
你的网站收录问题,是因为我在你的网页上看到的下面一段代码:
<meta name='robots' content='noindex,nofollow' />
关于noindex元标记,你可以参考下面这篇文章。
所以,你可以将这段代码去掉,过一段时间Google就会重新收录你的网页,网页摘要也会得到更新了。
引用:
以下为引用的内容:
要完全阻止网页内容列入 Google 的网络索引中(即使其他网站链接到此网页),可使用 noindex 元标记。 只要 Googlebot 提取网页,便会看到 noindex 元标记并阻止该网页显示在网络索引中。 Google 网络索引还允许使用 robots.txt 文件中的"Noindex:" 来阻止未抓取网址链接的引用显示在我们的网络搜索结果中。
noindex 元标记标准在 http://www.robotstxt.org/meta.html 上进行了说明。 如果您不具备对服务器的根访问权限,此方法将非常有用,因为它允许您逐页控制对网站的访问。
要阻止所有漫游器将您网站上的网页编入索引,请将以下元标记放入网页的 部分:
要允许其他漫游器将您网站上的网页编入索引,仅阻止 Google 的漫游器将网页编入索引:
如果看到某一页面上有 noindex 元标记,Google 就会将此页面从我们的搜索结果中完全丢弃,不管是否还有其他页面链接到它。 但是,其他搜索引擎可能会以不同的方式解译此指令。 因此,指向网页的链接可能仍会显示在搜索结果中。
请注意,由于我们必须抓取您的网页才能看到 noindex 元标记,因此在极少数情况下 Googlebot 可能会看不到和不遵循 noindex 元标记。 如果您的网页仍在结果中显示,可能是因为在您添加标记之后我们尚未抓取过您的网站。 (此外,如果您还在使用 robots.txt 文件拦截此网页,我们也无法看到此标记。)
如果内容当前出现在我们的索引中,我们将在下次抓取此内容时将其删除。 要加快删除过程,请使用 Google 网站管理员工具中的网址删除请求工具。
总结以上,是因为我用的网站模版里面有了<meta name='robots' content='noindex,nofollow' />这段代码,去掉之后google收录就正常了,希望广大站长遇到问题时不要到处责骂,找到问题的解决方法最关键,大家有什么问题可以到我博客(http://ourys.com)上留言,希望我可以尽自己的微薄之力为你分忧。
文章评论 本文章有个评论