当前位置:首页 > 计算机算法 > 计算机排名:搜索引擎聚类算法讨论与实战运用(百度内部算法分析)

计算机排名:搜索引擎聚类算法讨论与实战运用(百度内部算法分析)

九零头像
创始人 九零
2018-02-07 阅读 1168 专题:

      从目前来说,我们很难在网上的一些计算机培训机构当中找到一些比较新鲜度较高的百度算法文章来提供给自己做计算机能力提升。比如我们学习计算机排名的过程当中会提到的一个知识点叫做相关需求,但是真正去讨论所谓的相关需求的时候似乎不知道如何在自己的网页内容里面给强调和体现出来。搜索引擎有自己独特的一些算法来进行结果与内容之间的聚类分析,比如我们搜索一个关键词搜索下方会有下拉框、相关搜索、右侧推荐,其实这些内容都是搜索结果的一种聚类表现。

      检索信息的结果如果在聚类的状态下,对于用户的查询query,可以帮助搜索引擎更加有效的识别查询词与网页文档集合里面的关系进行一对多的关系匹配,而这种关系匹配就会采用了这种聚类表现方式进行。比如,用户搜索小米,出现的首页10个结果聚类分别是小米官网(一个信息),小米的百度百科(一个信息),4条小米的新闻,以及一条中关村在线站点和其他三个小米站点内页计算机排名。聚合分析如下图所示:

计算机排名:搜索结果与内容聚类分析讨论(百度内部算法)

      我们通过上述的图片可以发现一个现象,不管这10个结果里面的哪一个结果,都没有脱离了小米这个query的需求点。当然,对于新闻排名的页面来说,可能包含的主体信息是小米的某一个时效性话题,而并非所有的搜索结果是直击用户的痛点(如购买手机、价格了解、各种小米商品等)。

      那么搜索引擎进行聚类这种行为可以帮助用户在某一个时间周期里找到所谓的需求点,包括我们经常使用的百度指数工具里面也有用户需求图谱。但是从用户视角来说,这种类聚行为会流失一部分的用户现象,也就是小米并不一定是手机,也是一种食物。我们通过一张图的用户聚类分析进行纬度拆解,如下图所示:

 聚类分析纬度拆解

      通过上图的比较,我们可以发现首页的搜索结果已经占据了用户需求的99%以上的份额,小米作为食物的话已经很难发现当前热度的一种变化。那么从搜索的角度来说,搜索引擎如何通过聚类的方式来进行一个词的重要程度排序呢?如果了解过知心算法的朋友其实就是知道,如下图所示:

搜索结果

      如上图,右侧搜索结果出现了金蝶ERP,这种其实就是搜索的知心算法所表现出来的效果,而这种效果正式因为聚类的方法来进行捕获用户的某一个查询词query所展示出来的方式。当一个查询词query在网页文档集合当中出现的频次非常高的时候,那么将通过时效性的积累方式进行聚类抽取,然后对比形成所谓的一个相关需求词。包括我们经常用到的这种计算机排名发外链的行为,如优化的词是计算机培训,发布的外链为九零计算机培训,这种方式也是在提升九零+计算机培训之间的关联度。会在一定程度上帮助用户需求的一种聚类集合和匹配。

      本文适用于有一定基础的计算机朋友阅读,如有疑问可以添加九零计算机微信号q1833332277进行交流!

      作者:九零计算机  未经允许,严禁转载!

预约计算机专家添加微信号:1833332277 领取免费VIP内部课程
© 著作权归作者所有
九零简介
九零 创始人
9年计算机实战经验,深度研究搜索引擎算法,熟悉大型网站计算机优化。
天降大任于斯人也,必先苦其心志,劳其筋骨,饿其体肤,计算机方可百战百胜。免费赠送九零计算机内部VIP课程,2018年新版实战课程介绍:查看详情
网友评论
 昵称:
 验证码:
2  条评论
上海律师事务所头像
上海律师事务所
2018-02-07

感觉好深奥,小白一枚貌似没有看懂这种计算机排名的逻辑关系。

北园可头像
北园可
2018-02-07

这文章分析的有点水平,最近用python写大数据抓取的时候这种用的到!

相关计算机方法推荐 >