我們生活在一個“信息時代”,而且“信息”正在“爆炸”。談到信息爆炸的程度,美國人多愛引用西奧多·羅斯扎克(Theodore Roszak)《信息崇拜》(TheCult of Information)一書里的例子。羅斯扎克說,現在,一份《紐約時報》所含的信息量比17世紀一個普通英國人一生當中所接觸的信息還要多。
2009年12月9日,加州大學圣地亞哥分校的“全球信息產業研究中心”(Global Information Industry Center)發布了一份研究報告《信息2009》(HowMuch Information2009),統計2008年美國家庭的信息消費。這份研究報告所說的信息,是指“傳送給個人、供個人使用的信息”,不包括人們上班時消費的信息。研究的數據取自20種不同的渠道,從傳統的書籍報刊到新興的手機游戲到衛星廣播和網絡視頻。研究人員用三個標準來衡量大眾的信息消費:小時、字數和字節。
2008年,按消費時間算,美國家庭消費信息的時間總數為1.3兆小時,平均每人每天消費信息12個小時(這里說的信息消費包括讀書、上網、玩手機游戲、聽收音機、看網絡視頻等)。若按字節和字數算,2008年美國家庭總共消費了3.6個皆字節(Zettabyte)的信息,10845萬億個字,平均下來。每人每天消費34個吉字節,10萬個字(列夫·托爾斯泰的《戰爭與和平》英文版有46萬字)。
在二進制里,數字信息的傳輸和存儲的基本單位是比特(bit)和字節(byte)。一個比特的信息是0或1,一個英文字母大約是5個比特,一個字節是8個比特。衡量數字信息的其他單位還有: 千字節(Kilobyte,KB),一個千字節=1024個字節。一頁打印紙的內容相當于2個千字節,一幅低清晰度照片有100個千字節。
兆字節(Megabyte,MB),一個兆字節=106字節。通常,一本書數字化以后,容量是一個兆字節,一幅高清晰度照片有2個兆字節,一部英文版莎士比亞全集有5個兆字節,一張光盤有500個兆字節。
吉字節(Gigabyte,GB),一個吉字節109字節。一個吉字節的圖書可以裝滿一部小型卡車,100個吉字節的學術期刊可以裝滿一層圖書館。
太字節(Terabyte,TB),一個太字節:1012字節。5萬棵樹制成紙,印上字,是一個太字節。一個學術圖書館的全部館藏相當于2個太字節。世界最大的圖書館是美國國會圖書館,那兒所有的印刷品達10個太字節。
拍字節(Petabyte,PB),一個拍字節=1015字節。美國所有學術圖書館館藏的總和是2個拍字節。
艾字節(Exabyte,EB),一個艾字節=1018字節。人類有史以來說出的全部口頭語言為5個艾字節。世界所有人的基因是6個艾字節。
皆字節(Zettabyte,ZB),一個皆字節=1021字節。
2002年,全球一共生產了5個艾字節的信息,比1999年增加了一倍。如果通過電視來播放5個艾字節的信息,一個人要坐在屏幕前觀看40700年。
那么3.6個皆字節有多大呢?根據《信息2009》,如果將3.6個皆字節的文字印成圖書,像磚一樣壘起來,它們將覆蓋全美國(包括阿拉斯加),書堆的高度達7英尺。
全球有多少信息呢?2005年10月8日,在美國全國廣告商協會年會上,谷歌總裁埃里克·施密特(Eric Schmidt)說,根據一項研究報告,世界上的信息總量是500萬個太字節(Terabyte),但是,其中已經被編好索引、可供網絡搜索的信息僅有170個太字節。有人問,谷歌以提供信息搜索為己任,那么要多長時間,谷歌才能為全球500萬太字節的信息編完索引,供人搜索?施密特回答,根據谷歌內部的估計,大約要花300年的時間。
2007年2月7日,在凱洛格技術大會(KeUogg Technology Conference)上,有人問谷歌負責產品搜索的副總裁瑪麗莎·梅耶(Marissa Mayer),谷歌已經為多少信息編制了索引?梅耶說大約已經完成了500個太字節。也就是說,谷歌已經為全球0.01%的信息編制了索引。這個數字與16個月前施密特所說的170個太字節相比,多了330個太字節,增幅為194%。有人計算,如果谷歌能一直保持這個增速,那么只需28年,谷歌即可為全球500萬太字節的信息編制索引。
說到信息,離不開圖書。世上圖書又有多少?谷歌“圖書原數據小組”(Google Books metadata team)負責人喬恩·沃萬特(Jon Orwant)透露,根據谷歌的統計,截至2009年8月28日,世界上的圖書一共有1.68億種(精確地說,有168178719種)。
中文信息有多少呢?筆者還未看到有關的統計,但是,2009年10月21日,在高德納咨詢公司(Gartner)主辦的一次電子技術研討會上,谷歌總裁施密特預計,5年后,中文的內容將在互聯網上占統治地位。
(本文作者系紐約佩斯大學出版系兼職教授,本刊特約撰稿人)