7月份PageRank快要更新, 虽说PR值现在Google算法中占的比例越来越小,但是当PR值更新时,看到自己的网站PR又升了,对于站长来说,还是有那种满足感,自豪感的。
以下内容可能是比较旧点,就算是重新温故一下,风采依扬也会把自己的一些经验及看法写进里面。
PageRank,网页排名,又称网页级别、Google左侧排名或佩奇排名。PageRank™是以公司創辦人拉里·佩奇(Larry Page)命名。是一种由搜索引擎根据网页之间相互的超链接计算的网页排名。它经常和搜索引擎优化有关。 PageRank系统被Google用来体现网页的相关性和重要性。Google的创始人拉里·佩奇和谢尔盖·布林1998年在斯坦福大学发明了这项技术。
首先让我们看看Google官方网站是怎么介绍它们自己的技术的:
PageRank 技术:通过对由超过 50,000 万个变量和 20 亿个词汇组成的方程进行计算,PageRank 能够对网页的重要性做出客观的评价。PageRank 并不计算直接链接的数量,而是将从网页 A 指向网页 B 的链接解释为由网页 A 对网页 B 所投的一票。这样,PageRank 会根据网页 B 所收到的投票数量来评估该页的重要性。
此外,PageRank 还会评估每个投票网页的重要性,因为某些网页的投票被认为具有较高的价值,这样,它所链接的网页就能获得较高的价值。重要网页获得的 PageRank(网页排名)较高,从而显示在搜索结果的顶部。Google 技术使用网上反馈的综合信息来确定某个网页的重要性。搜索结果没有人工干预或操纵,这也是为什么 Google 会成为一个广受用户信赖、不受付费排名影响且公正客观的信息来源。
2005年初,Google 为网页链接推出一项新属性 nofollow,令网站管理员和SEOer可以做出一些 Google 不会計算為投票的链接;这些链接不算作”投票”。nofollow 的设置可以抵制评论垃圾。
风采依扬在网上收集了一些关于PageRanK的算法,整理了一下,PageRank大体可以分为二种:
一、简单算法:
例如一个由4个页面组成的小团体:A,B, C 和 D。如果所有页面都链向A,那么A的PR(PageRank)值将是B,C 及 D的和。
PR(A) = PR(B) + PR(C) + PR(D)
继续假设B也有链接到C,并且D也有链接到包括A的3个页面。一个页面不能投票2次。所以B给每个页面半票。以同样的逻辑,D投出的票只有三分之一算到了A的 PageRank 上。
风采依扬觉得,根据链处总数平分一个页面的PR值。
最后,所有这些被换算为一个百分比再乘上一个系数q。由于下面的算法,没有页面的PageRank会是0。所以,Google通过数学系统给了每个页面一个最小值1 − q。
所以一个页面的 PageRank 是由其他页面的PageRank计算得到。Google 不断的重复计算每个页面的 PageRank。如果您给每个页面一个随机 PageRank 值(非0),那么经过不断的重复计算,这些页面的 PR 值会趋向于正常和稳定。这就是搜索引擎使用它的原因。
二、完整的算法:
这个方程式引入了随机浏览的概念,即有人上网无聊随机打开一些页面,点一些链接。一个页面的PageRank值也影响了它被随机浏览的概率。为了便于理解,这里假设上网者不断点网页上的链接,最终到了一个没有任何链出页面的网页,这时候上网者会随机到另外的网页开始浏览。
为了对那些有链出的页面公平,q = 0.15(q的意义见上文)的算法被用到了所有页面上, 估算页面可能被上网者放入书签的概率。
所以,这个等式如下:
p1,p2,…,pN是被研究的页面,M(pi)是链入pi页面的数量,L(pj)是pj链出页面的数量,而N是所有页面的数量
PageRank值是一个特殊矩阵中的特征向量。这个特征向量为
R是等式的答案
如果pj不链向pi, 而且对每个j都成立时,等于 0
这项技术主要的弊端是,旧的页面等级会比新页面高,因为新页面,即使是非常好的页面,也不会有很多链接,除非他是一个站点的子站点。
这就是 PageRank 需要多项算法结合的原因。之前石头也说了wikipedia.com在google的一些关键词内表现很好整体的访问量超过一些门户网站,另一方面也是数万网民的共同努力。
Google对维基百科情有独钟之一,风采依扬想应该是:PageRank 似乎倾向于维基百科页面,在条目名称的搜索结果中总在大多数或者其他所有页面之前。原因主要是维基百科内相互的链接很多,并且有很多站点链入。
Google 经常处罚恶意提高 PageRank 的行为。Google 究竟怎样区分正常的链接交换和不正常的链接堆积仍然是商业机密。
相信看完以上内容后对PageRank了解更深入。
我们可以知道搜索引擎用来评估网页质量的一种方法,就是PageRank,它经常被用来当作对Google搜索引擎网页要素评分之一。
你可以找到任何网页的PageRank分数,通过使用你的浏览器去浏览网页,并下载GOOGLE工具栏。将你的鼠标放在绿色的PageRank栏上,马上就会显示出一个从0到10之间的数字,这就是PageRank值,是google对该页面的重要性的分配。工具栏按照PageRank比例范围显示出网页的PageRank,但是在现在的PageRank算法中就是不单单是0到10的数据了,在google的服务器中,PageRank的分配数有可能是0精确到100,甚至是到1000的数值。
PageRank是平均每三个月更新一次的,它不是按照一般的线性刻度计算,而是按照一种指数刻度。这是一种非常繁杂的数学术语(之前文章也有提到),意思是PageRank4不是比PageRank3好一级—而是会好6到7倍。因此一个PageRank5的网页和PageRank8的网页之间的差距会比你可能认为的要大很多。
PageRank值在这几天要更新了,我们谈谈现在PR的算法吧!当一个网页链接到你的网页时,搜索引擎是怎样转移这个网页的权威性到你的网站的(也就是PageRank的转移)。因此你希望从有最高PageRank得分的网页上获得链接,去不断的寻找高PR的站点,是不是呢?
这种方式在以前还管用,但是现在实际情况比这复杂了很多,一个权威性的转移与网页上存在的链接数量有关—链接越少,每个链接所转移的权威性就越高,因些,通常PageRank5网页上唯一的链接要比PageRank7上一百个链接中的一个要有价值。当然这也是有前提的,就是站于站之间的链接内容相似度要高一些。
如:A(SEO资料站)站同时链向B(SEO服务网站)、C(企业服装网站)
那么A站的PageRank转移到B、C那个站所得的分高呢,在众多的实验证明B站获得A站的PR转移得分比C站高,原因很简单:A、B二站的相似度很高,所得的得分也自然高。
之前所讲的大家都知道PR值的重要性,但是真的一提的是,不要落入PageRank的诱惑陷阱中。对于你的网页来说,最重要的是被链接到那些能为你的站点带来流量的站点,而不是见到PageRank就链。要将PageRank作为工具来验证你自己对一个潜在链接来源质量判断,而不要在做你的链接来源列表时盲目跟从PageRank。
PR值在这几天更新,祝SEOer好运!
文章评论 本文章有个评论