一、Hilltop算法的由来
Hilltop算法同PageRank算法同样是搜索引擎结果排序的一项专利。
PageRank页面级别系统单纯根据网页上的外部链接站点的数量,质量及页面等级决定该网页的“重要性”,但却忽略了链接页面对查询条件的主题相关性,导致一些网页即使主题与该查询条件并无关系,但也由于偶而提及该查询关键词而在搜索结果中得到很好的排名。从而影响了搜索结果的相关性与精准性。 早在2000年,美国加州多伦多大学计算机系的Krishna Bharat意识到基于页面等级的PR排名系统中存在瑕玼,于是提出了“Hilltop”新算法,并于次年1月份申请了Hilltop专利权,Google成为受让方。
谨慎的火龙果有一篇关于Google基于HillTop算法更新的中文翻译,不过车东谈到其和Bharat写的关于HillTop算法的论文原文相比,还是有些出入,建议阅读“HILLTOP: A search engine based on expert documents” ,大家也可以看SEO研究院为大家整理的Hilltop文档打包下载,如果您只需要简单了解这一算法,那么只要参阅以下文字即可。
SEO Rank公司的CEOAtul Gupta在文章中说,“Hilltop算法在11月16号的更新号称佛罗里达更新)中起到了不可轻视的作用。”在Google后来的更新中,不但运用了Google自身的页面等级和相关性算法,而且还结合使用了Hilltop算法用于精工调整页面等级的效果。
二、HillTop算法是什么?
Hilltop 算法的定义到底是什么?
简单的来说,来自描述相同主题的相关文档(专家文档)的链接对于搜索者的价值会更大,即相同主题网站之间的链接比不相关网站的链接价值要更大,这样的算法叫Hilltop算法。
三、HillTop算法的工作原理
Goole在最初使用PageRank算法来决定一个网站的重要程度及排名,一定程度上,反向链接越多,排名越好;或者说,高质量的反向链接导入越多,排名越好。这里的高质量链接指的是对方站点的质量,并没有考虑其和自身站点的相关性。
HillTop算法的指导思想和PageRank是一致的,也都是通过反向链接的数量和质量来确定搜索结果的排序权重,不过HillTop算法认为来自相同主题的相关文档链接对于搜索者的价值会更大。
与PageRank结合HillTop算法确定网页与搜索关键词的匹配程度的基本排序过程取代了过分依靠PageRank的值去寻找那些权威页面的方法。这对于两个具有同样主题而且PR相近的网页排序过程中:HillTop算法就显得非常的重要了。
Google不但要考虑满足查询结果的网页上的外部链接页的重要性页面等级),还要考虑这些链接页对查询主题的相关性,HillTop算法要求如果有两个以上相关主题的网站链接到你的网站,那么你的网站在搜索结果中出现的机会会更大,如果HillTop算法不查找到最少两个相关性的网站,那么搜索返回的结果的机会绝对是0。Hilltop算法实际上是拒绝那些通过任意链接的方法来扰乱Google的排名规则而得到较好排名的做法,一定程度上避免了非相关主题的、高PR值的站点的反向链接对排名造成的巨大影响,使排名更趋向搜索关键词的匹配。
四、Hilltop新算法的意义
Hilltop新算法加大了offline优化的分数比值,更好地避免了作弊,毕竟来自相关网站的高质量链接并非那么容易,不可能唾手可得。
直接对页面进行的SEO优化很容易作弊,比如早期的Meta标签作弊,关键词堆砌作弊等等,而在新算法中,根据资料,各排名因素所占权重分别如下:
总“排名”得分由三部分组成:页面相关性得分 RelevancyScore,页面因素),页面等级得分非页面因素)和行业得分非页面因素),其中相关性得分RS)= 20%,页面等级值PR) = 40%,行业得分HillTop得分,LS) = 40%。
我们知道,RS 相关性得分:页面相关度),这是通过SEO内部优化能够得到的效果;PR 页面等级得分:外部链接度),通过不断地建立高质量的反向链接也能得到这个效果;而LS 行业得分:专家文件链接度)则需要来自专家文件的链接的转换结果;这一点更难获取。
而作为优化专家,对于排名的控制权将渐渐减弱,页面内部优化的得分只占到了20%,外部的优化则占据了80%这样高的比重,这样将加大作弊的难度。因此Hilltop算法的运用,提高了搜索结果的相关性和质量,有效降低了人工操纵排名的可能性。不过,由于Hilltop算法需要提取“专家文档”,但是这些“专家文档”的公正性,质量性无法得到完全保证,而且为了保证Hilltop算法所需的处理能力,该算法只能周期性运行,从而无法保证随时向用户提供“最新、最好”的查询结果,新站点对热门查询词的排名的难度也将加剧。
五、Hilltop算法对SEO的指导意义
1,我们知道来自相关主题的链接的权重加大,那么在建立链接的时候就必须注意网页的相关性,不能单纯考虑对方PR,而是应该注意对方站点或页面是否和自己的站点或页面主题相关,相同主题的网站链接较之非相关网站具有更高价值,要尽可能避免低质量的链接,尤其是Spam性质的链接。
2,在建立链接时,应该加强与“专家站点”的链接。比如一些相关网上目录(Dmoz等),黄页;以及相关主题站点的链接等。
3,根据独孤天骄的理解,Google首先给予edu、gov类站点于很高的优先级,甚至将它们视为“专家文档”,如果这些站点或页面的主题跟你的站点或页面的主题相关,那么两个以上来自这样站点的链接,将会带给你极大的权重。其次,来自热门词,也就是网友高频率搜索的关键词,包括突然间爆发的关键词,这样的站点会得到Google较快的、优先的更新频率,因为在“爆发”的过程中,这些关键词的主题网站有一部分将被Google列为“专家文档”,与类似主题的网站交换链接会临时获得较高的权重。