声明:本文来自于微信公众号蝙蝠侠IT(ID:batmanit),作者:蝙蝠侠IT,授权tag知识库转载发布。
早前,我们写了一篇关于《今日头条SEO研究:值得深思的 5 个问题》的文章,由于头条算法是基于兴趣标签,进行推荐。
因此,在考量站内搜索排序的时候,我们更多的认为:页面的相关性与原创度,在搜索排序中,会赋予较高的权重,顾才提出这个话题,供大家一起讨论与研究。
比如:
它可能基于页面分析,在分词后,借助TF-IDF等算法,判断页面的核心关键词,并且计算其相关关键词的匹配程度,与原创性,在站内搜索结果中,给予理想的排名。
它可能结合前者基于用户行为指标,在站内搜索结果中输出合理的排序。
但在实际少量样本的测试中,我们得出初期如下小结:
相关性
在搜索结果展现中,我们利用中文分词,拆分大量文档,并赋予每一个关键词一定的权重,但是实际操作中,我并没有发现,它对站内搜索结果具有明显且直观的影响。
原创度
所谓的原创度,我们这里认为,它是一个相对概念,并且在特定情况下,会计算去重,当然,有一种特殊情况,除外:
站外合作媒体,所展现的内容,并没有在搜索结果中进行去重,比如:某百科与某问答的内容。
同时:
① 站内文章原创度,有一个相对的时间节点,它同样会得到合理的推荐与站内搜索结果的展现。
② 站外文章的原创度,对搜索结果并没有明显的作用。
时效性
时效性相当于头条搜索结果而言,是一个十分重要的指标,对于站内文章,无论你的内容质量如何,当天发布与搜索词“相关”内容,都会得到合理的展现。
相对于站外内容,时效性,并没有一个明确的衡量指标,其主要的原因我们猜想是头条蜘蛛抓取与收录的时间节点问题。
权威度
① 站内文章
一般来讲,在搜索结果排序中,时效性>权威度>用户行为指标,对目标搜索结果的影响相对较大,值得一提的是,其中,权威度相对较高的账号,搜索结果中排序周期稳定性相对较高。
而权威度相对一般的账号,时效性排序,持续的周期较弱。
② 站外文章
从目前来看,站外账号的权威度对站内搜索结果的影响,主要包括如下两个方面:
1)首页、栏目页、TAG页
从目前来看,对于站外搜索结果,头条目前更多在参考PR值的排序规则,也就是基于链接计算的权威,你的页面权重越高,在头条搜索结果中的排序越高。
当然,你会看到在百度搜索结果排名相对较高的页面,在头条搜索结果中,同样重要,顾我们猜测,它更多的是基于链接计算。
当然,深度分析,你可以针对每一个页面计算页面“权威度”,这里由于外链工具API更新的问题,你可能需要参考多个工具的数据指标,然后取相对平均值。
2)内容资讯页
而相当于站外的内容资讯页面,在头条的搜索结果中的排序,我们认为页面标题中关键词具有重要的作用。
页面标题
页面标题中包含关键词无论对于站内与站外,都是一个非常重要的参考指标,我们认为,它主要包括如下几个影响因子:
1)关键词拆分后,页面标题关键词包含的先后顺序。
2)页面标题中,关键词的相间距离。
3)描述内容中,覆盖关键词的个数。
其中,值得提醒的是:
1)站外的搜索结果中,标题是核心,并没有过多计算内容质量。
2)短标题貌似搜索排序,相对靠前。
站内与站外
当站内与站外内容,同时出现在搜索结果中,相对于站外内容之间的排名比对,更多的是参考页面权重。
而相对于站内之间内容的比对,则更倾向于时效性>权威度。
而基于《站内与站外》文章比对的时候,排除标题的影响,它则重点考量如下几个指标:
① 内容质量度(粗略统计为页面字数)
② 权威度(站内优先站外)
③ 时效性(站内时效性,长周期内会计算用户行为指标,包括:评论、点击率、个性偏好)
④ 社会热点(高考成绩查询)
付费推广与战略合作
目前来讲,头条开放DSP形式的站内付费推广,同时,头条也与一些资源机构,建立战略合作伙伴,比如:某百科,进行商业性的合作,相关,搜索排序,都是具有特定的随机性。
总结:上述内容,只是利用非工作时间与小伙伴@柯靓,粗略的统计结果,仅供大家参考与讨论。
文章评论 本文章有个评论