王畫虎
據不完全統計,過去一年內,有10萬微信用戶和30萬Facebook用戶死去,令微信這類社交平臺成為一個巨大的數據墓地,巨量的數據石沉大海。
人類難以想象,互聯網在短短二十幾年內,累積的信息量已經遠超之前幾十萬年在石頭、竹簡、銘文和各種書籍中的信息量總和。
信息爆炸的時代里,許多有價值的事情容易被人們忽視進而忘去。我們討論起幾百年前的事情就像昨天一樣,而我們聊起20年前蘋果發布第一臺Mac則恍若隔世。
現在的考古學家都開始做直播了,網絡卻向著考古的方向發展。到2024年,每年產生的數據轉換成紙張將有4.37萬光年長。現代人每天要產生數以萬計的數字節點,你的cookie就是你使用過的石器,你一覺醒來給朋友發了一個表情包,上網看了一篇網絡漫畫,發一條不知道多少KB的朋友圈。對于你來說,這就是稀松平常的一天——但對于研究網絡文化的考古學者來說,這都是未來參考現代人生活習性的寶貴用戶畫像組成。
網絡考古還是一個新的概念,目前并未像傳統考古形成細致的分類和體系,但已經有一些民間組織在從事相關的資料整理記錄工作,網上關于它的討論和猜想也越來越多。
搜索就是最簡單的網絡考古,不是拿著一根鐵鍬就能去掘墓,也不是有一臺電腦就能進行網絡考古。要從海量的數據中抽絲剝繭,去偽求真,你得掌握網絡考古的盜墓神器、互聯網界的洛陽鏟——InternetArchive網站。
InternetArchive是一個非營利性的互聯網檔案館,成立于1996年,由Alexa創始人布魯斯特·卡利創辦。互聯網檔案館匯聚了過去20年的網站、音樂、動態圖像和數百萬本書籍的數字數據,跟維基百科一樣永久性免費存儲及獲取。
InternetArchive是目前世界上最大的網絡考古工具,你可以通過它的“Waybackmachine”厘清一個網站的發展脈絡。通過這把鐵鍬,我們挖到淘寶、新浪、百度等網站最初拓荒的樣子。
當年資費高網絡慢,訪問網頁惜流量如金,很多時候都是一個人看完其他人用緩存看。那時候的網頁設計都很簡單,為了節省流量,文字遠多于圖片。
要想自己的數據遺產在死后得到妥當處理,用戶必須在生前就做好相應的準備,把所有網絡賬號密碼寫進遺書。
“InternetArchive保存的也僅僅是互聯網的冰山一角,作為第一代在虛擬空間留下大量痕跡的人類,當我們離開后,留在網絡世界里的痕跡會慢慢消失。”InternetArchive的創始人卡利指出,“現在的數據看似無處不在,卻出人意料地脆弱。”
“在21世紀,個人數據可能是大多數人最寶貴的資源。我們把信息交給科技巨擘,讓他們代為傳遞郵件和貓咪的視頻。”《人類簡史》作者對此表示過擔憂,“假設這些科技巨擘的服務器崩了,那你所有的數據也就蕩然無存。”
如果整個互聯網人間蒸發,我們將不只是倒退幾十年那么簡單,不計其數的人將驟然失去某種生活必需的東西。這就是InternetArchive存在的意義,它會將人類的互聯網上古遺跡保存下來,供后代追根溯源。
當你還在QQ空間懷念青春的時候,已經有人注意到,互聯網早已形成了不少上古遺跡,去瀏覽這些網站或帖子就像去西安看兵馬俑。
2005年2月22日,兩個分別叫“北緯67度3分”和“易燁卿”的主角在天涯社區進行了一場關于財富、服裝、賽馬的“上流社會”的大辯論,吸引了22.3萬多人次圍觀。后來通過網友人肉,這兩人誰也不是真正的“上流社會”。
10年之后再回頭看這帖子,我們能看到那個時候的中國人對于“上流社會”的想象。我們在瀏覽這些互聯網上古遺跡的同時,那時人們的想法和精神面貌躍然網上。
考古學者會通過古代皇帝的詩句和畫作來揣測他當時的情感和社會危機,未來的網絡考古學家要研究2017年發生了什么,一定會去翻川普的推特。