网页信噪比是指一个网页上的文字内容与所有HTML代码的比率,这同样是我们所必须了解的SEO基础知识。从搜索引擎的原理来讲,其抓取系统首先是将整个 网页下载下来,然后将里面的文字内容提取出来,经过分析去除HTML格式,清除噪音,然后分词,最后存入索引库。在这个过程中,搜索引擎也会经过去噪的过 程,我们很明显地就能知道,网页信噪比越高,搜索引擎蜘蛛抓取的效率越高,搜索蜘蛛每天要处理的文档非常之多,如何能够快速的提取网页的主题信息是个重要任务。
其实不单单是指所有本文与代码的比率,还包括了当前页面文本内容中的有用信息与无用信息的比率。何谓有用信息,就比如我这篇文章的 主题是网页信噪比,整篇文章有1000个字,而当前页面所有的文字内容有2000个文字,而其他文字是与信噪比无关的,那这些无关的信息就是噪音了。所 以,提高网页信噪比分为两个方面:包括优化代码和优化内容。
一、去除噪音代码
我 们知道,搜索引擎去噪的第一步则是清除HTML格式,那么提高网页信噪比的第一步就是优化HTML代码。为什么我们常说,网页代码要符合W3C标准、代码要简洁、要用DIV+CSS,其实都是基于这个原理。实际上,很多朋友只是看到网上的文章说要这样去写代码,但却不知道为何要这么做,这也是我建议大家先 学习SEO原理的原因(我知道,实践大于理论,但如果理论都没有,怎么去实践,没有一个出发点)。去除噪音代码包括以下几个方面:
减少JS使用,必须要用的JS代码进行封装。
将CSS代码进行封装。
减少DIV层嵌套(很多朋友不知道原理的话,一味地追求DIV+CSS,却同样产生大量冗余的代码。)
减少图片、FLASH的使用
二、去除噪音内容
同样的,搜索引擎提取网页文本内容后,还要进行分析二次去噪,也就是确定当前网页的主题。那么在这个过程中,我们如何让搜索引擎更精确地判断我们的网页主题(这也就是相关性的问题),如何提高网页的相关性?那么就是降低页面噪音内容。
我 们很常见的就是一些电子商务网站的商品详细页面,可能一部分做电子商务网站SEO的人员并未注意,在产品介绍内容下面有一些关于配送方式或者帮助信息的说 明,这些内容的存在,提高了各个产品页的相似度,同时也降低了信噪比。这些信息从用户体验的角度来讲是友好的,是提升网站的信任度,但从搜索引擎的角度来 讲是有一定不利的,所以我们可以将这些内容使用IFRAME或者JS来封装调用,这样双方都照顾到。主要也是有包括以下几个方面:
重复内容进行封装调用
导出不必要的链接列表进行封装调用
精简版权信息
增加相关内容的文本长度
方 法是以上几个,具体如何实现还要看自己对技术的了解或者掌握。虽然我们知道搜索引擎在索引预处理阶段会对网页进行去噪处理,但如果我们自己做好了网页信噪 比的提高,一方面减轻了搜索引擎的工作量,从而提升其在我们网站上抓取索引的效率,一方面提升了搜索引擎判断的准确度。那么,可想而知,我们的网页是更加 被信任的。
作者:萧涵,原文地址:http://www.xiaohan86.com/2011061188.html 转载请保留版权信息。
文章评论 本文章有个评论