对于大多数新建的站点,收录是很多人关心的一个话题,不管是首页收录还是内页收录都是需要去急迫解决和处理的一个过程。谈到网页收录,就必然联系到一个问题就是网页的抓取与爬行以及网页质量本身。有效的解决收录问题一般可以通过加速外部链接吸引蜘蛛的方式进行,同样,也可采用站内大量优质内容的更新提升搜索引擎蜘蛛的抓取频次。
往往收录高的站点,或者是页面质量高的站点,蜘蛛的抓取频次和访问频率是比较高的,如下图所示:
上述三个网站当中,不同的站点抓取频次不一,并且可以根据站点的数据表明,站点的抓取频次由页面质量和站点总页面数量决定。图三站点的频次高于图一,但是图三站点是由一个单页组成,而图一是由优质原创内容构建的新站。
下面我们在来看看,百度官方所提到的抓取是否包含其他的含义在里面。如下图所示:
根据百度官方文档所提到的抓取频次,频次的不同会影响页面的整体速度(访问快的站点更加吸引蜘蛛抓取)。并且抓取频次会影响收录,也可以理解为抓取频次的次数决定了你网页的收录速度以及收录文档的总数据情况。一个站点每个蜘蛛所分配的额度是有限的,优质的站点往往分配的额度更高,如下图所示:
上面三张图对应了最大的站点抓取频次数据,可以很明显的看出,站点的频次数据最高,www。bodajsj。com站点的抓取最大配额最低。不同的站点配额是不同的,但是影响配额的最大因素由两点来决定。
第一、网页质量与信任度
单页面的抓取频次要大于优质原创内容更新的站点,原因在于单页面站点的存活时间要高于www。bodajsj。com站点页面。因为不管是从建站年龄还是站点的信任度(外链)来分析,前者都要优于后者。从而就不难理解,为何新浪、搜狐这类站点即使是抄袭内容也会很快的建立有效的索引库。
第二、站点更新频率
除了网页质量影响站点的收录以外,我们还可以发现,站点的更新速度越高,那么页面的抓取频次也会增加。这个高的数据不仅仅是体现在页面的更新频率上,还包括了网站整体的网页数据,整体的数据最高,会增加站点的抓取频次的额度。是不是有点理解了为何站点的总收录影响网站的整体质量评分,其实严格来说,网站的整体网页评级都是围绕蜘蛛的抓取而展开的,收录,索引,排名都是后面的事情。爬行和抓取是搜索引擎建立数据的第一层要点。对于页面的收录问题,如果不能提升站点的信任度,不妨试试大量的更新内容来影响蜘蛛的抓取配额(蜘蛛池就是这么来操作的),从而提升网站的整体质量。
文章评论 本文章有个评论