关于百度的算法大家的观念层出不穷,这是我之前发现的一篇文章,来学习学习。
一、百度基础算法分析:链接流行度核心算法+百度推广+框计算+开放平台1.【链接流行度】和大多数关键词搜索引擎一样,页面URL地址链接的流行程度为核心的基础核心算法;2.【百度推广】起先叫做百度竞价,后改为百度推广,包括关键词竞价算法和网盟推广算法两部分;3.【框计算】语义分析、行为分析、智能人机交互、海量基础算法等。
二、百度收录流程
1.【页面的收录】搜索蜘蛛程序》已收录的页面链接》发现新的链接并爬行》新的页面及内容合格》收录快照并分类存储》建立页面基本数据(页面URL、页面关键词、页面标题描述、收录来源、收录时间、内容简述、页面权重、更新周期);2.【百度免费产品】百度百科、百度文库、百度贴吧、百度知道、百度空间等百度自身免费产品的页面收录;3.【百度开放平台】主要是站长提供的结构化数据(网站与百度的深度合作,如汽车网站的参数数据、百度知道接口等)和开发者提交的各种应用(开发者加入百度开发者中心并提交相关应用通过审核);4.【百度竞价推广】网站主开通百度推广账户》预付费并通过网站审核》编辑关键词广告及推广计划》提交百度推广后台;5.【百度网盟推广】网站主开通百度推广账户》预付费并通过网站审核》编辑网盟广告及推广计划》提交百度推广后台;百度联盟广告合作伙伴站长参与网盟推广并审核通过》预留广告位并做好网盟接口。
三、百度检索流程
搜索需求》语义分析》数据库检索》排名显示反馈1.【百度搜索页面的检索】用户输入关键词并检索》框架算(语义分析及分词判断、行为分析、智能人机交互、海量基础算法)》框计算结果(开放平台的数据、传统搜索结果、百度推广结果、百度自身产品结果)》框计算结果排名。
2.【百度网盟页面的推荐】用户访问百度网盟某合作网站页面》网盟算法根据用户浏览器大量有价值的搜索Cookis计算并推荐广告》用户被有质量的广告吸引并点击》网盟推广后台引导用户进入参与网盟推广的网站相应页面。
四、百度指数权重考核因素
1.传统搜索的权重考核
A.【网站访问量】网站访问流量(IP、PV、独立访客)决定网站权重基数;B.【关键词流量】关键词搜索访问流量是百度权重指数的基本考核数据;C.【关键词质量】关键词搜索访问质量(人均页面访问数量、人均页面停留时间)是百度权重指数的重要考核数据;D.【关键词文字链】高质量的关键词文字外链是百度权重指数的重要补充考核数据;E.【多种外链来源】多元化的外链来源是提高权重的良好方式;F.【关键词匹配度】关键词与页面内容的匹配度(关键词所占比例、关键词位置)是百度权重站内考核的基本参数;G.【站点内容质量】网站内容质量(原创度、可读性、丰富性)是百度权重指数站内考核的重要数据;H.【站点链接结构】站点链接结构也是百度权重指数站内考核的重要参数;I.【域名年龄】域名年龄长的页面权重较高;
J.【网站年龄】网站年龄也是影响权重的重要的因素,没有明显的大面积改版且页面标签属性变化不大的页面容易获得稳定的权重;K.【服务器稳定性】服务器稳定性、包括IP使用的年龄也会影响站点权重;L.【百度推广指数】购买百度广告的站点会直接获得权重赠分;这点已经在很多操作实例中得以证明;M.【百度体系指数】网站与百度体系的合作深度是权重参考的又一个重要依据,如是否加入网盟、是否加入开放平台,是否使用百度相关产品(如百度统计、百度分享、百度Hi等)2.百度自身产品的页面
根据网星网的搜索观察经验判断,百度自身产品权重顺序一般为:百度百科、百度文库、百度贴吧、百度知道、百度空间,百度自身产品本身因为主站权重高而获利,其次百度算法中对以上自身产品本身的排名权重较高。以上所列的百度产品对应的关键词搜索内容页面是否在搜索结果展示,主要取决于用户浏览质量及参与互动程度。
3.百度开放平台的页面
百度开放平台与百度自身产品类似,是否获得好的排名,主要看页面本身的流量及用户参与程度,而开放平台合作站点本身的权重决定排名次序的基本参数。
4.百度推广的页面
百度付费推广的页面排名主要是百度竞价机制决定,按照参与竞价的相应关键词出价高低决定排名次序;百度网盟推广的排名优先程度与竞价机制类似,取决于网盟广告出价高低。
5.百度网盟合作网站
网盟合作网站的权重会获得一定的赠分。因为这个给百度推广获得收益作了重要贡献。
五、百度快照收录的考核因素
(以下只针对传统关键词搜索的自然排名)
1.【百度快照的收录影响因素】
(1)原创内容:原创内容是快照收录考核的首要因素;(2)链接引导:链入新页面的外链及内链质量越高越容易被收录;(3)页面访问质量:包括页面的访问数量、访问时间等因素;(4)站点质量:如果站点本身的权重太低,快照收录会受到负面影响;(5)页面可读性:如果文字过少,又缺少必要的图表配合,也会影响快照的收录;(6)作弊:头部标签关键词连续堆叠、页面内容中关键词堆叠过多、出现暗链接、等作弊因素也可能影响快照收录。
2.【关于与快照更新的影响因素】
(1)页面的权重:页面权重是蜘蛛程序造访频率的核心因素;(2)页面更新周期:已被收录的快照在搜索数据库中会有一个更新周期参数,更新周期首该页面更新历史记录的影响;(3)链接质量:链入的外链所在页面权重是快照跟新周期的重要补充,外链质量越高,快照更新越频繁;(4)内容跟新的幅度:内容更新幅度过小的页面容易被忽略(一般指重要的导航页面及站点主页);(5)静态化页面影响快照更新:这是蒋鑫鹏在SEO实例操作中发现的,静态化页面易被搜索程序判定为“死”页面而影响更新周期;(6)域名及网站年龄:老网站更容易获得较频繁的快照更新周期;(7)网站收录页面数量:收录页面越多,主页快照更新越频繁。
六、页面排名分析
1.【关于头部标签】
(1)头部比重是分词匹配的关键,主要的算法是:1.中文分词、2.语义连贯、3.分词所占比重(2)头部标签说明:
title:关键词在title中的算法:1.连贯、2.靠前、3.比重keywords:keywords一定不能包含页面没有的关键词,keywords必须在内容中有所体现描述:描述是页面基本的参考,包含的关键词权重仅次于title(3)头部标签修改后,页面快照收录会暂缓进入观察期,一般为一周左右,稳定后恢复新快照。
头部标签一定要与页面内容匹配,在限定字数内,页面头部标签修改频繁,会导致搜索程序直接抓取页面内容作为描述。
2.【关于外部链接】
1.链出链接指向的页面权重要高;
2.链入外链所在页面权重高,关键词及内容相关性匹配要高;3.多样化的外链链入更有效;
4.社会化分享外链链入越来越被重视;
5.购物及电子商务类的外链越来越有价值;
3.【关于页面内容】
1.关键词匹配级别:位置明显的带链接的锚文本,如导航条、快速通道、底部导航、H标签;2.主页权重最高、其次为主页直接链接指向的页面;3.页面内容要丰富,图表搭配得当,访问量高有助于排名;4.空页面或者信息简陋的页面直接影响收录与排名;5.页面访问数量及质量是排名的重要因素。
6.多媒体多文件性质的页面会被受到重视:如视频、音乐、文档、图表、对话框、互动按钮等。
文章评论 本文章有个评论