甚么是HITS算法?

甚么是HITS算法?
作者:超越 发布时间:2019-07-08 04:55

HITS是英文Hyperlink-Induced Topic Search 的缩写,意译为“超链诱导主题搜索"。HITS算法由Jon Kleinberg于1九九七年提出,并申请了专利。

 

遵照HITS算法,用户输进闭键词后,算法对返回的匹配页面计算两种值,一种是关节值(Hub Scores),另一种是权威值(Authority Scores),这两个值是相互依存、相互影响的。所谓关节值,指的是页面上扫数导出链接指向页面的权威值之以及。权威值指的是扫数导进链接所在页面的关节值之以及。

 

下面的定义比较拗口,我们可以简单地说,HITS算法会提炼出两种比较首要的页面,,也便是关节页面以及权威页面。关节页面本身可能未几少导进链接,可是有不少导出链接指向权威页面。权威页面本身可能导出链接没有多,可是有不少来自关节页面的导进链接。

 

典型的关节页面便是如俗虎目录、开放目录或好12三这样的网站目录。这种高质量的网站目录做用就在于指向另外权威网站,以是称为关节。而权威页面有不少导进链接,此中包含不少来自关节页面的链接。权威页面一般为提供伪正相闭内容的页面。
 

典型的关节页面开放目录

 

HITS算法是针对特定查询词的,以是称为主题搜索。

 

HITS算法的最大缺点是,它在查询阶段举行计算,而没有是在抓与或预处理阶段。以是HITS算法是以牺牲查询排名响应时间为代价的。也正因为云云,原始HITS算法在搜索引擎中并没有常用。没有过HITS算法的思想很可能融进到搜索引擎的索引阶段,也便是依据链接闭系找出具备关节特征或权威特征的页面。

 

成为权威页面是第一劣先,没有过难度比较大,仅有的方法便是获得高质量链接。当您的网站没有能成为权威页面时,就让它成为关节页面。以是导出链接也是以后搜索引擎排名因素之一。绝没有链接到另外网站的作法,并没有是好的SEO方法。
 

电话
020-66888888