眼镜片厂家
免费服务热线

Free service

hotline

010-00000000
眼镜片厂家
热门搜索:
行业资讯
当前位置:首页 > 行业资讯

小彭简单的Hits算法理解

发布时间:2020-07-24 11:16:34 阅读: 来源:眼镜片厂家

搜索引擎算法介绍之HITS算法。HITS算法是Web结构发掘中最具有权威性和使用最广泛的算法。Hits算法由乔恩克莱因伯格(Jon Kleinberg)于1998年设计提出,该算法的研究工作启发了PageRank算法的诞生。HITS算法的主要思想是:网页的重要程度是与所查询的主题相干的。

我们可以这样理解:HITS算法是基于主题来衡量网页的重要程度,相对不同主题,同一网页的重要程度也是不同的。例如,百度对主题搜索引擎和主题湖南SEO的重要程度是不同的。

HITS算法使用了两个重要的概念:权威网页(authority)和中心网页(hub)。

例如:Google、Baidu、Yahoo!、bing、sogou、soso等这些搜索引擎相对主题搜索引擎来讲就是权威网页(authority),由于这些网页会被大量的超链接指向。

pyy1990/post/Hits-Algorithm这个页面链接了这些权威网页(authority),则这个页面可以称为主题搜索引擎的中心网页(hub)。

HITS算法发现,在很多情况下,同一主题下的权威网页(authority)之间其实不存在相互的链接。所以,权威网页(authority)通常都是通过中心网页(hub)产生关联的。

HITS算法描写了权威网页(authority)和中心网页(hub)之间的一种依赖关系:一个好的中心网页(hub)应当指向很多好的权威性网页(authority),而一个好的权威性网页(authority)应当被很多好的中心性网页(hub)所指向。

同时产生的两个问题是:

HITS算法将链接与内容分开来斟酌,仅斟酌网页之间的链接结构来分析页面的权威性一个页面与另外一页面的援用有多种情况,如为了导航或为了付费广告。

第一个问题提出的解决方法是:利用超链文字及其周围文字与关键字相匹配而计算超链权值,并引入系数对周围文字和超链文字进行权值的相对控制。

第二个问题的解决方法是:HITS算法引入了时间参数,即利用对1链接援用的时问长短来评价是不是为正常援用。

关于HITS算法的原理,前面已有一篇文章进行简单的介绍了。其实HITS算法相当的复杂,并不是几句话所能概括。本文是搜集整理而成,旨在让和小彭一样的新手朋友能更好的理解简单的Hits算法。

原文:小彭@长沙SEO pyy1990/ 转载请保存。

四川癫痫病医院

癫痫治疗

成都治疗癫痫病哪家好

相关阅读