在浮躁的互聯網時代,五花八門的網站為爭奪網上排名,經常會采用惡意點擊和輸入關鍵字垃圾的手段來搶奪網民的眼球,搞得網民們的網絡體驗日益混亂。有沒有一種方法可以撥亂反正呢?
Google創始人之一拉里·佩奇(LarryPage)發明了一種算法PageRank,是由搜索引擎根據網頁之間相互的超鏈接計算的網頁排名,這也和搜索引擎優化有關,PageRank系統被Google用來體現網頁的相關性和重要性,以便科學排名,遏止關鍵字垃圾。
巧妙的PageRank算法
PageRank通過對由超過5億個變量和20億個詞匯組成的方程進行計算,能科學公正地標識網頁的等級或重要性。級別從1到10級,10級為滿分。PR值越高說明該網頁越重要。例如;一個PR值為1的網站表明這個網站不太具有流行度,而PR值為7到10則表明這個網站極其重要。
PageRank級別不是一般的算術級數,而是按照一種幾何級數來劃分的。這是一種奇特的數字景觀,PageRank3不是比PageRank2好一級,而可能會好到數倍。因此,一個PageRank6的網頁和PageRank9的網頁之間的差距會比你可能想象的要大得多。
PageRank根據網站的外部鏈接和內部鏈接的數量和質量來衡量網站的價值,PageRank的概念是,每個到頁面的鏈接都是對該頁面的一次投票,被鏈接的越多,就意味著被其他網站投票越多。Google有一套奇妙的自動化方法來計算這些投票。
用PageRank合理排名
PageRank這個概念引自學術中一篇論文被媒體轉載的頻度,轉載的次數越多,一般判斷這篇論文的權威性就越高,價值性也就越高。
但Google的排名算法不完全基于外部鏈接,或者說,PageRank不是單純以鏈接多少來論英雄、排座次的。PageRank對來自不同網頁的鏈接區別對待,不是簡單地算為一票。鑒于本身網頁排名高的鏈接更受青睞,因此Google會給這些鏈接較大的權重。
Google不只是看一個網站的投票數量,或者這個網站的外部鏈接數量,它還會對那些投票的網站進行分析。如果這些網站的PR值比較高,則其投票的網站可從中受益。打一個形象的比方,微軟總裁對雅虎的高度評價與另外一個不入流的網站CEO對雅虎的好感是不可同等而語的,因為一個是一言九鼎,一個是人微言輕,雅虎從他們對其的贊譽中獲取的身價資本是有很大差別的。
因此,Google的技術專家提醒人們,在建設網站的外部鏈接時,應盡可能瞄準那些PR值高且外部鏈接數又少的網站。這樣的外部鏈接站點越多,你的PR值就會越高,從而使得你的Google排名得到顯著提升。
遏制字垃圾
PageRank的另一神奇妙用是對關鍵字垃圾起到巨大的遏制作用。眼下,一些“下三爛”網站為了提高點擊率,用一些與站點內容無關的關鍵字垃圾壯聲威,比如用明星的名字,用公共突發事件稱謂等,只要搜索者輸入這些關鍵字,這些不入流的網站便呼嘯而來,目的僅僅是使網站從搜索引擎獲得更高的流量。這些網頁的目的或是為了騙取廣告點擊,或是為了傳播病毒,讓你特別心煩。
還有一些無賴式的博客評論也從中攪局,在網上招搖過市,騙取網民的注意力,亦被網絡技術人員視為垃圾。
Google的PageRank使用一種基于信任和名譽的算法幫助遏止關鍵字垃圾,它藐視這些關鍵字垃圾的存在,以網頁相互鏈接評級別,論高低。
PageRank改變搜索排名
Google排名之所以大受追捧,是由于它并非只使用關鍵字或代理搜索技術,而是將自身建立在高級的網頁級別技術基礎之上。別的搜索引擎提供給搜索者的是多種渠道得來的一個粗略的搜索結果,而Google提供給它的搜索者的則是它自己產生的高度精確的搜索結果。這就是為什么網站管理員會千方百計去提高自己網站在Google的排名。
網頁排名的高明之處在于它把整個互聯網當作了一個整體對待。它無意識中符合了系統論的觀點。相比之下,以前的信息檢索大多把每一個網頁當作獨立的個體對待,很多人當初只注意了網頁內容和查詢語句的相關性,忽略了網頁之間的關系。
PageRank一般一年更新四次,所以剛上線的新網站不可能獲得PR值。PR值暫時沒有,這不是什么不好的事情,耐心等待就能受到的Google青睞。
PageRank是1998年在斯坦福大學問世的,2001年9月被授予美國專利。如今它在Googl~所有算法中起著至關重要的作用。在學術界,這個算法被公認為是文獻檢索中最大的貢獻之一,并且被很多大學引入了信息檢索課程(Inforrnation Retrieval)的教程。