前几天我们研究了搜索引擎是如何判断文章的相似度的。搜素引擎通过余弦相似度和最长公共字符串,来计算两篇文章的相似度。那在一篇文章中,搜索引擎如何判断关键词的权重呢?今天SEO培训网就来和大家分析下这个问题!
1、通过TF-IDF算法,计算每个可能关键词的TF-IDF值
通过统计词频和文章数量,来计算关键词权重的TF-IDF算法是搜索引擎经常使用的一种算法。TF代表词频,指的是一篇文章中某个关键词出现的次数;IDF称为逆文本频率,代表文本频率的倒数。例如:“百度SEO培训”在黄雀SEO的一篇文章中出现了10次,那TF值就是10;“百度SEO培训”在百度搜索结果中出现124W次,那IDF值就为1/1240000。“百度SEO培训”这个关键词的TF-IDF值为10*1/1240000=1/124000;而在同样的一篇文章中,“百度SEO公司”也出现10次,“百度SEO公司”在百度搜索结果中出现170W次,那“百度SEO公司”这个关键词的TF-IDF值就为:10*1/17000000=1/1700000。结果就是“百度SEO培训”TF-IDF值>“百度SEO公司”TF-IDF值。百度SEO培训在这篇文章中的重要性同样大于百度SEO公司的重要性!
2、通过位置信息判断重要性
一般我们写文章的时候,在第一段往往是对文章进行概述,在最后一段需要对文章进行总结。所以在首段和末段中出现的关键词,搜索引擎会给予更高的权重。这一点相信很多SEO都有共识,一般都会在第一段中加重点关键词,但很多人都忽视了末段的重要性。其实末段的关键词权重也是非常大的!
3、标题中的关键词
我们曾无数次的提起文章标题的写法,强调标题的作用。是因为搜索引擎给予了标题特别高的权重,标题中出现的关键词,权重要远远大于内容中出现的关键词。所以我们在写文章的时候,一定要在标题中出现我们的核心关键词!
4、利用词性信息判断重要性
什么是词性信息?这个我们在小学的时候应该都学过,就是“名词、动词、形容词、介词、代词”等等。一般来说比较重要的词多为名词或者名词结尾的词,所以搜索引擎在对文章进行分词之后,紧接着就是对词性进行划分,找出文章中的重点词。
5、用符号强调过的关键词
一般使用“”和《》之间的文字更可能是关键词,比如“冯提莫床照”是真的吗?这类词虽然可能不是文章最核心的关键词,但一般在文章中属于重点关键词。
6、被改变颜色、加粗、倾斜设置的关键词
一般我们写文章想要强调某个关键词,最习惯的做法就是对关键词进行加粗。也就是利用一些排版的方法,将某一个关键词变的和其他的关键词不同,搜索引擎检索到这种不同之后,会将这个关键词设为重点词,提升关键词的权重。
其他的还有构建文本词网络、将词进行语义聚类等判断关键词的方法,搜索引擎肯定不会单单使用一个方法或者一种指标来判断关键词权重的,应该罗列了至少十几甚至是几十种方法来判断关键词权重。其实你也没必要非要去研究如何去做,只需要按照正常的方法去写文章即可。只要你是围绕着一个核心点来写的,没有跑题,搜索引擎绝对可以判断出文章的核心和各个关键词的权重!
文章评论 本文章有个评论