
1994年1月,世界上總共只有700個網站。這個數字在同年年底,變成了1萬,在次年年底更是增長至10萬。
要利用好這個正在迅速膨脹的宇宙,需要找到一個簡單的方法,來幫助人們找到所需的東西——一個將人、計算機和網絡三者連接起來的簡單接口。
斯坦福在讀的楊致遠和同伴費羅,開始親手編纂一份不斷擴展的網站目錄。1994 年底,他們將萬維網指南更名為“雅虎”(Yahoo!)。但這個網站目錄存在一個顯而易見的問題——每年網站的數量都會呈現 10 倍的增長,因此他們不可能人工持續更新這個目錄。
幸好,當時出現一種用于搜索站點信息的工具——爬蟲(Crawler)。它會一個接一個地“爬進”互聯網的服務器,根據自身搜索到的信息建立索引。費羅和楊致遠沒有開發自己的網絡爬蟲,繼續強調人工編纂網站目錄的重要性。
然而,人工團隊不可能追趕上網頁數量增長的速度。自動化搜索引擎,將會成為萬維網內容查找的主要方式,這個潮流,將由另外兩位斯坦福大學研究生引領。
拉里·佩奇(Larry Page)生長于一個計算機技術家庭。他的父親是密歇根大學的計算機科學和人工智能教授,他的母親也是那里的編程講師。
1979年,拉里6歲的時候,他的父親買了一臺叫作 Exidy Sorcerer 的家用電腦回家。
“我還記得家里剛買電腦的時候,我感到非常興奮,因為這可是一件大事,而且它的價格應該不便宜,就像是買一輛車一樣。”拉里很快就學會了如何操作這臺電腦。
佩奇也上了密歇根大學,他堅持要同時主修商科和計算機科學專業。
而后,在申請研究生院的時候,佩奇被麻省理工學院拒絕了,斯坦福大學錄取了他。這其實是一件好事,對于那些有志于同時涉足技術和商業的人來說,斯坦福大學是一個理想的去處。
佩奇在1995年秋季正式入讀斯坦福大學研究生院,在開學之前還參加了一個新生培訓項目,其中有一天的培訓活動設在舊金山進行。當時的領隊,是一位善于交際的二年級研究生謝爾蓋·布林(Sergey Brin)。
佩奇天生沉靜,布林卻是那種能連珠炮似的向他講述自己想法的人,他們很快就進入關于各種話題的爭論當中,從計算機到城市功能分區,無所不談,兩人一拍即合。
他們又是一對冤家。“我們都覺得對方很討厭,”布林坦承,“不過我們只是開玩笑而已。當然,我們進行了很長時間的交流,所以我們之間肯定有合得來的地方。我們喜歡互相取笑。”
謝爾蓋·布林的父母也是學者,都是數學家,他的童年跟佩奇的非常不一樣。布林出生于莫斯科,他的父親是莫斯科國立大學的教授,他的母親是蘇聯石油與天然氣研究所的研究工程師。因為他們都是猶太人,所以事業受到諸多制約。
當他的父親提交了移民美國申請之后,夫妻兩人同時失業了。一家的出境簽證在1979年5月獲批,當時謝爾蓋只有5歲。
他的父親在附近的馬里蘭大學找到了一份數學教授的工作,他的母親也成為美國國家航空航天局的研究員。
謝爾蓋入讀的是一所采用蒙臺梭利教育法的學校,他在那里培養出了獨立思考的能力。這是他和佩奇之間的一個共同點。
另一個共同點是,兩人在小時候都收到過父母送的電腦,布林在9 歲的時候,收到了一臺Commodore 64電腦作為生日禮物。
布林在獲得國家科學基金會的獎學金之后,進入了斯坦福大學,他在那里的研究重點是數據挖掘。同樣,麻省理工學院也拒絕了布林的研究生申請。
佩奇加入了斯坦福大學的人機交互小組,這個團隊的工作,是探索改善人機共生關系的方法。
人機交互是佩奇在密歇根大學最喜歡的課程,他成為以用戶為中心的設計概念的支持者,這種概念強調的是軟件和計算機的界面必須直觀,而且用戶永遠都是正確的。
布林的學術研究重點是數據挖掘。他和莫特瓦尼教授一起成立了一個小組,叫作斯坦福數據挖掘(Mining Data at Stanford,MIDAS)。
他們共同發表的論文當中,有兩篇是關于購物籃分析。購物籃分析是對顧客購買商品種類的關聯性的分析。寫作過程中,布林開始對萬維網數據模式的分析方法產生了興趣。
佩奇則開始思考自己的博士論文題目。他最終選定了一個自己比較熟悉的題目——如何評估不同網站之間的相對重要性。
他采用的研究方法來自他所處的家庭學術環境。如果要知道一篇學術論文的價值,其中一個判斷標準是,它在其他論文的注解和參考文獻部分被引用的次數。按照同樣的理論,如果要判斷某個網頁的價值,一種方法是了解鏈接到該網頁的其他網頁的數量。
這種方法存在一個問題。
蒂姆·伯納斯-李在設計萬維網的時候,他的理念是,任何人都可以在未經允許的情況下建立指向其他網頁的鏈接,將網頁鏈接保存在數據庫中,或者雙向使用鏈接。
這個理念讓萬維網得以迅速擴張,也意味著人們將無法輕易得知指向某個網頁的鏈接數量或者來源。你可以在一個網頁上看到所有向外的鏈接,但你無法看到指向這個網頁的鏈接的數量和質量。
“在我見過的協作系統當中,萬維網的協作功能是相對較弱的,因為它的超文本存在一個缺陷:它沒有雙向鏈接。”佩奇說道,他開始嘗試建立一個含有大量鏈接的數據庫,這樣他就可以反向追蹤這些鏈接,找出每個網頁的鏈接會通向什么網站。
這項工作的其中一個目的是促進協作。他打算讓人們在自己的網頁上為其他網頁添加注釋。佩奇用于實現反向鏈接的方式,來自一個大膽的想法——這是他在一天半夜醒來之后突然想到的。“我當時在想:如果把整個萬維網下載下來,然后只將其中的鏈接保存下來,那會怎樣呢?”
要把整個萬維網記錄下來可不是一件易事。即使是在1996年1月,全世界也已經有10萬個網站,這些網站總共含有1000萬個文檔,它們之間的鏈接有近10億條,這些數字每年都會呈現指數級增長。
當年初夏,佩奇設計了一個網絡爬蟲工具,它會從佩奇的個人主頁出發,一直跟蹤它遇到的所有鏈接。這只在萬維網上迅速移動的蜘蛛,會保存每條超鏈接的文本和來源,以及它們對應網頁的標題。他將這個項目命名為“BackRub”。
這個項目很快就占用了斯坦福大學幾乎一半的互聯網帶寬,而且它至少造成了一次全校范圍內的網絡中斷。
“我的磁盤空間幾乎已經用完了。”佩奇在1996年7月向威諾格拉德發了一封郵件,他當時收集了2400萬條網址和超過1億條鏈接。“我當時只保存大概15%的網頁,不過情況看起來非常樂觀。”
佩奇這個大膽而復雜的項目,吸引了擁有數學頭腦的謝爾蓋·布林的注意,后者正在尋找一個合適的博士論文題目。他興致勃勃地加入自己好友的工作當中。
BackRub起初的目標,仍是收集萬維網的反向鏈接,為將來可能實現的注釋系統和引用分析功能打下基礎。
隨著項目的逐步推進,他和布林想出了更為復雜的網頁價值分析方法,這些方法采用的依據是指向每個網頁的鏈接的數量和質量。這時候,他們逐漸認識到,按照重要性排名的網頁索引,可以成為一個高質量搜索引擎的基礎。
這就是谷歌誕生的由來。“當一個偉大的夢想出現的時候,”佩奇后來說道,“你要馬上抓住它!”這個經過改進的項目,最初被稱為“PageRank”,因為它會對BackRub 索引收集到的每個網頁進行排名。
佩奇和布林意識到,除了對指向網頁的鏈接數量匯總以外,他們還可以嘗試確定每條進入鏈接的價值。例如,來自《紐約時報》的鏈接,應該要比賈斯汀·霍爾在斯沃斯摩爾學院宿舍發出的鏈接有更高的價值。
這樣,就建立了一個由多個反饋循環形成的遞歸過程:每個頁面的排名依據是進入鏈接的數量和質量,這些鏈接的質量是由生成它們的頁面的數量和質量來決定的,以此類推。
“整個過程都是遞歸的。”佩奇解釋道,“這是一個巨大的循環。不過數學的力量是很強大的,它可以幫助我們解決這個問題。”
布林能夠充分理解這種類型的數學難題。“事實上我們想出了很多數學方法來解決這個問題。”他回憶道,“我們將整個萬維網,轉換成一組含有數億個變量的龐大方程,這些變量就是所有網頁的排名。”
在各自導師的指導之下,他們合著了一篇論文。“如果一個網頁的反向鏈接的整體排名越高,那么網頁本身的排名就越高;同時考慮到了頁面擁有大量反向鏈接和少量高排名鏈接的情況。”
那么,PageRank真的可以生成更好的搜索結果嗎?這是一個價值 10億美元的問題。他們為此進行了一項對比測試。
他們用到的測試關鍵詞之一是“大學”(University)。如果在AltaVista 和其他引擎搜索這個關鍵詞,它們只會列出在標題中含有該關鍵詞的隨機頁面。
在PageRank中,以“大學”為關鍵詞的最優先搜索結果,分別為斯坦福大學、哈佛大學、麻省理工學院和密歇根大學,他們對這個結果感到十分滿意。
為了繼續完善 PageRank 的搜索結果,佩奇和布林加入了更多的參考因素,例如關鍵字在網頁上出現的頻率、字號和位置。
他們會對比采用不同參數組合的搜索結果,不斷調整和改進算法。他們發現,應該對錨文本給予較高的權重,錨文本指的是作為超鏈接的下劃線文本。
例如,“比爾·克林頓”是許多指向美國白宮網站(Whitehouse.gov)的鏈接的錨文本,當用戶搜索“比爾.克林頓”的時候,白宮網站應該出現在最優先的搜索結果,盡管網站的主頁中沒有明顯地出現比爾·克林頓這個名字。
這個搜索引擎需要處理海量的頁面和鏈接,所以佩奇和布林把它命名為谷歌(Google),名字來源于古戈爾(Googol)——是指1后有100個0。
他們在瀏覽器中輸入“Google”,發現這個域名仍然可用,于是佩奇把它搶注了下來。
“之前已經有人注冊了‘Googol. com,我試過向那個人提出購買域名的請求,對方非常喜歡這個域名,不愿意出售。我們還是選擇了‘Google。”
這是一個很好玩的單詞——簡單易記,輸入方便,還可以轉換成動詞來使用。
佩奇和布林從兩個方面,繼續改進谷歌的使用體驗。首先,他們建立了比任何競爭對手都高出許多的網絡帶寬、處理能力和儲存容量,從而將其網絡爬蟲的處理速度,提升至每秒索引100個網頁。
他們還非常熱衷于研究用戶行為,這點有助于持續改進他們的算法。
如果用戶在點擊了最優先的搜索結果之后,沒有返回搜索結果列表,這就意味著他們已經找到了自己想要的東西;如果完成搜索之后立刻修改自己的關鍵詞,就說明他們對搜索結果不滿意,這時候工程師們就需要查看用戶修改過的搜索關鍵詞,從而了解他們最初想要查找的東西。
用戶每次跳轉到第二頁或第三頁搜索結果的時候,都表明他們對搜索結果的排序不滿意。這個反饋循環可幫助谷歌學習到用戶的真正意圖。
另外一個人也想到了跟PageRank相似的網頁排名機制:一位來自中國的計算機工程師李彥宏。1998年初,佩奇和布林的數據庫收錄了5.18 億條超鏈接,當時萬維網的鏈接總數約為30億條。
“如果你有一個自認為不錯的發明,你想讓它盡快被多數人用上。”
佩奇不希望谷歌僅僅停留在學術項目的層面,他想盡快把它打造成為一款熱門產品。
兩人想將自己的博士論文付諸實踐變成一家公司,他們不愿意對已有的工作成果進行發表或者正式展示。他們的目標,顯然是成立一家商業公司。
如果在那些主要以學術為目的而進行研究的大學里面,他們的做法也許是有問題。但是,斯坦福大學不僅允許學生參與商業項目,而且會為他們提供鼓勵和幫助,學院甚至有專門幫助學生完成專利申請和授權事宜的辦公室。
佩奇和布林嘗試商業化的第一步,是向其他公司授權使用他們的軟件,他們會見了雅虎、Excite和AltaVista等公司的首席執行官。這些公司的出價是100萬美元,這不算是一個天文數字,因為除了專利授權的費用以外,這筆資金還包含了他們兩人提供服務的酬勞。
“這些企業的市值已經達到數億美元甚至更高。”佩奇后來說,“所以這對于他們來說只是一個小數目。他們的領導層缺乏足夠的遠見,他們有很多人都跟我們說:‘搜索其實沒有那么重要。”
佩奇和布林決定成立他們自己的公司。
他們所在的地理位置是一個適合創業的地方,在距離斯坦福校園幾英里之外,就有一些愿意成為天使投資人的成功企業家,而且不遠的沙丘路上都是雄心勃勃的風險投資人,都可以為創業公司提供啟動資金。
斯坦福大學有一位叫戴維·切里頓(David Cheriton)的教授,他曾經和安迪·貝希托爾斯海姆(Andy Bechtolsheim)共同創辦過一家銷售以太網產品的公司,這家公司后來被思科系統公司收購了。
1998年8月,切里頓建議佩奇和布林與貝希托爾斯海姆進行一次會面,后者還是太陽計算機系統公司的聯合創始人之一。
在一天深夜,布林向貝希托爾斯海姆發了一封郵件,對方立刻回復了布林。第二天早上,他們齊聚在位于帕洛阿爾托的切里頓家中會面。
即便是在青澀的學生時代,佩奇和布林也能為搜索引擎做出激動人心的演示。他們展示了自己可以在一組小型計算機上對萬維網的大部分內容進行下載、索引和網頁排名的操作。
貝希托爾斯海姆很欣賞兩人,他們知道谷歌是一個足夠優秀的產品,可以通過用戶之間的口碑來傳播,籌集到的每一分錢都會花在組裝服務器所需的零件上。
布林和佩奇都不太愿意接受廣告,但是貝希托爾斯海姆知道,在搜索結果頁面加入清晰標注的廣告,是很容易做到的,且不會影響用戶體驗。這就意味著,他們擁有了一個等待挖掘的巨大收入來源。
“我給你們寫一張支票,我想它肯定可以幫到你們。”他從自己的車上拿出了一個支票本,向谷歌公司開出了一張10萬美元的支票。
“我們現在還沒有銀行賬戶呢。”布林告訴他。“那等你們開了賬戶之后再存進去吧。”貝希托爾斯海姆回應道。之后,布林和佩奇一起去了漢堡王餐廳慶祝。
由于貝希托爾斯海姆的聲譽(以及谷歌的產品本身足夠優秀),這個項目吸引了其他投資人的加入,其中包括亞馬遜網站的杰夫·貝佐斯。“我真的愛上了拉里和謝爾蓋,”貝佐斯表示,“他們具有以用戶為中心的遠見。”
一心準備創業的佩奇和布林,決定擱置他們的論文計劃并離開斯坦福大學的象牙塔。他們以每月1700美元的租金,租下了一個雙車位車庫,連同一個浴缸和幾間空置的房間。
1998年9月,就在和貝希托爾斯海姆見面的一個月之后,佩奇和布林開設了一個銀行賬戶,把那張支票兌現了。他們在車庫的墻上掛了一塊白板,上面寫著“谷歌全球總部”。
除了將整個萬維網的信息囊括其中,谷歌也代表了人機關系領域的一項重大飛躍。
乍看之下,佩奇和布林所使用的方法是將人工的操作排除在外,完全使用網絡爬蟲和計算機算法來進行搜索。如果對其進行深入思考的話,我們會發現,他們的方法實際上是機器和人類智慧的結合。他們的算法依賴于人們在自己的網站上創建鏈接時做出的數十億次判斷。
這是一種自動利用人類智慧的方式,換句話說,這是一種更高層次的人機共生關系。
“過程看起來似乎是完全自動化的,”布林解釋道,“事實上最終的成果是由數百萬人共同打造出來的。”
谷歌也由此創造了一個人類、計算機和網絡緊密鏈接的世界,實現這一成就用了60年的時間。任何人都可以向世界各地的人們分享任何信息,就像是那本來自維多利亞時代的年鑒所承諾的一樣——“包羅萬象”。

本文選編自《創新者——一群技術狂人和鬼才程序員如何改變世界》,沃爾特·艾薩克著,關嘉偉、牛小婧譯,中信出版社授權刊載,2017 年4 月印制。