周文泓 許強寧 高振華 張曉宇/四川大學公共管理學院
網絡為新冠肺炎疫情這一全球性重大突發事件提供了關鍵的信息即時發布、交流、集成空間,也從歷史敘事和信息資源產業角度提出海量信息在傳播過后如何存續的問題。檔案館、圖書館、博物館等記憶機構正在全球范圍內發起戰“疫”材料征集以留存對國家與社會有價值的記錄,網絡信息涵蓋其中。從網上紀念館、戰“疫”記憶庫到GitHub上一度登上趨勢榜第一的各類存檔項目,均反映出網絡信息存檔是不可或缺的行動。那么目前實踐進展如何,已形成哪些實質成果且面臨哪些問題,對我國新冠肺炎疫情以及更廣泛的重大社會事件網絡信息存檔,具有哪些啟示和可供參照之處?
理論層面在疫情之初就倡導建立針對新冠肺炎疫情的專題檔案庫[1],作為代表性類型的網絡信息如社交媒體存檔也得到相應探討,從為什么與如何做等方面提供了一定見解[2]。此外,以往的重大社會事件網絡信息存檔以實踐案例(如倫敦奧運會)分析實踐挑戰與策略[3][4]。由此,這些研究幫助明確網絡信息的龐大數量、復雜特性與存檔價值,并從主體協同、善用技術、制度保障等方面提供了方向。然而,研究對具體進展缺乏行動層的實證支撐,有待形成更具啟示性的策略。
因此,本文將對面向新冠肺炎疫情的網絡信息存檔行動進行全球范圍的線上調查,從代表性實踐發現行動進展與特征,由此為新冠肺炎疫情網絡檔案庫的全景建設乃至重大社會事件網絡信息存檔提供啟發式策略。
2020年2月13日,國際互聯網保存聯盟(International Internet Preservation Consortium,IIPC)下設的內容開發小組(Content Development Group,CDG)開展面向各個國家、地區新冠疫情的網頁存檔項目[5],旨在存取與新型冠狀病毒有關的網絡內容,包括與新冠病毒感染傳播信息、各地為遏制病毒所做的努力以及和疫情有關的醫療、科學、社會、經濟、政治等各個方面的信息。項目進程中,可由作為成員的來自世界各地的各類記憶機構提名應存檔的網址,感興趣的群體或公眾亦可參與;需在線填寫信息并提交表格,包括網址、域名、標題、語言、描述/關鍵詞(選填)、范圍、參與者姓名或機構(選填)、主題,通過CDG審核后確定應捕獲目標,通過參與者提交與網絡爬取獲得信息。
截至目前,IIPC已借助Internet Archive提供的工具 Archive-It形成了可在線檢索的獲得網站訪問許可的5000條存檔網頁資源,具體信息涵蓋標題、網址、內容描述、捕獲實踐、國家、域名等類別。這些資源包含15種語言如英文、葡萄牙文、德文的網絡信息,中文信息亦得到一定的捕獲,總數排名第13位,如我國應急管理部的疫情專題首頁自2020年3月20日以來被存檔3次[6]。
以傳承國家信息資源與文化遺產為重要職責的檔案館、圖書館、博物館等記憶機構正在全球范圍內面向國家層級從官方視角發起戰“疫”材料征集,網絡信息成為重要組成。以我國為例,國家圖書館在2020年4月22日發起聯合全國各級各類圖書館的中國戰“疫”記憶庫建設項目,通過面向社會公眾的廣泛征集活動,完整記錄全國人民抗“疫”的真實情境,包括疫情防控中運用的新技術和社會管理形態的變化,如數字化生活、網上辦公、線上學習等都被設置在捕獲范疇之中。
項目的參與者極為開放,包括全國黨政機關、企事業單位、社會團體和社會各界人士,資源類型涵蓋文字、圖片、音頻、視頻等多媒體資源以及實物。當前,項目尚處在征集階段,將成為常態化工作;征集方式包括網絡資源采集、多渠道征集、交換及購買,并依據著作權、復制權、信息網絡傳播權明確征集和使用事項。根據報道,預計年底形成原型系統,滿足以互動問答形式在線調取文獻的需求。
新冠肺炎疫情作為重大社會事件,其存檔情況無疑得到了社會各方關注,不同組織、機構、群體或個人基于各自的存檔取向、資源或能力發起多樣化的項目。一方面,主流機構如新聞媒介、學術團體、行業協會等有一定行動。如,華中科技大學出版社聯合參戰醫院和海內外傳媒機構共同打造武漢戰“疫”數字博物館,向海內外公眾征集戰“疫”過程中的各類資料,形成在線可用的檔案庫[8]。項目保存對象是抗“疫”過程中的個人故事與生活,強調真實原創,鼓勵醫務工作者、患者、各方志愿者、“疫區”群眾等作為主要參與者,貢獻音視頻、文字、圖片;內容應描述標題、創作人、聯系方式、發生地點。一經錄用,提供完整規范的版權保護。
另一方面,擁有不同專長的群體和個人亦參與其中。截至2020年5月,79個項目借助技術開源社區Github平臺廣泛參與新冠肺炎疫情存檔,收集、保存包括數據、新聞、微博、文章等多種類型的資源。其中,以個人為主體構建的新冠肺炎疫情存檔項目占比高達84.81%。此類實踐一般選擇開源軟件與服務平臺進行分布式共建的網絡收集、上傳與發布,由社群成員自主選擇、收集、保存內容。以“2020新冠肺炎疫情個人故事”項目為例,項目旨在保存我國普通公眾在疫情期間的個人生活記錄,選擇豆瓣網絡日志為存檔來源,大部分記錄來自湖北武漢,反映了戰“疫”期間武漢普通市民的真實生活。
實踐顯示,網絡信息存檔漸成規模且已有多方成果的直接原因,在于前瞻性的存檔布局和行動設計。新冠肺炎疫情這樣的重大社會事件有著難以完全管控的隨機性,面向各類平臺各類主體不同視角和事件角色或過程中存在于復雜傳播網絡的龐雜信息,需要存檔主體有充分的重大社會事件存檔嗅覺,從而及時啟動存檔項目且付諸具體行動。IIPC能成為較早啟動項目并已有可供利用的存檔結果,原因就在于其本身具有面向國際性事件的存檔機制,從設置的內容開發小組到具體的流程都較為成熟。再以我國為例,前期各地方圖書館、檔案館或博物館征集的資料并沒有明確指出包括網絡信息,而國家圖書館的戰“疫”記憶庫項目能將網絡信息納入,很大程度在于它是我國互聯網信息社會化保存項目主導方。
在事件維度的牽引下,跨平臺、跨主體、跨過程、跨內容的信息存檔需要的是多方協同。一方面,多元發起主體立足不同的目標與對象展開多樣化行動,不同項目的成果,在信息來源、記錄對象、記錄視角上相互交叉、疊加、互補,形成還原度更高的檔案結果。如,Github平臺的多個項目在2月初就著手對國內疫情信息進行存檔,以期補足國家圖書館缺失的部分網絡信息。另一方面,即使是單個項目,也需要不同主體形成協作網絡,從而獲得多維度多層級的資源與方法支持。如,國家圖書館主導的戰“疫”記憶庫已明確指出合作方是各級圖書館與網絡平臺。同時,這些或大或小的項目無一例外地倡導社會參與。
實體與數字空間的深度融合趨勢意味著網絡信息存檔同其他空間的檔案工作在方法、經驗、資源上須強化協作,這在新冠肺炎疫情中尤為顯著。新冠肺炎疫情除網絡信息外形成了大量離線信息或其他形式的記錄,共同形成更全面完整的記錄結果,且隨著線上利用需求的倒逼,這些信息也將進入網絡檔案庫。因此,新冠肺炎疫情的網絡信息存檔在具體實踐中并不只是獨立行動,而是作為整個事件檔案化體系的有機組成。以國家圖書館的戰“疫”記憶庫為例,它的提出更具整體視角,在信息對象上涵蓋各種空間中形成的各類形式的記錄,關鍵點不僅在于存檔范疇的開放性與包容性,也在于它以“庫”的形式將存檔結果設定為不同形式對象的融合。
縱觀新冠肺炎疫情網絡信息存檔實踐,其進展為我國更加系統的存檔規劃與行動乃至未來更多的重大社會事件網絡信息存檔,提供了值得深入思考的策略。
網絡信息的形成與傳播是即時、非線性和碎片化的,面臨失真失存的風險,且重大社會事件在記錄主體、數量、內容、平臺等方面更加復雜,不是短期內可完成的存檔任務。因而,存檔的及時性體現于盡早展開綜合性部署規劃,在疫情尚未完全解決、信息將持續增長的情況下就體現為需要在當下制定存檔框架與方案。同時,行動層的落實要在疫情后期緊湊展開,可以試點的方式依據存檔框架與方案實施更具針對性的行動。
由此,一方面要明確存檔目標,以我國可以構建全景映射重大社會事件多方面與持續性過程的網絡信息資源完整體系為最終的整體目標,這是驅動記憶領域與社會多元參與的重要力量。另一方面要設定適用不同階段不同存檔條件與要求的過程性方案,循序漸進地落實存檔行動。如,在不能一次性捕獲所有信息的前提下,依據同重大社會事件的密切度與價值來確定信息捕獲的優先級。再如,在無法捕獲部分平臺完整信息及其元數據的情況下,可暫時“妥協性”地簡化格式與元數據要求,既可為后續形成完善信息提供線索,也可在原生信息丟失的情況下保存具有一定價值的不完整樣本。
記憶領域從意識、戰略、能力、行動等方面,對引領新冠肺炎疫情這一對我國與我國人民而言有著重要分量的社會事件的網絡信息存檔有著“天然”使命。記憶機構除檔案館外,還包括同樣以構建國家記憶為目標的圖書館與博物館等相關機構,可從專業上提供針對可信檔案信息資源建設更加專業的方法與制度指導,且可作為資源基地提供保管和后續的開發利用功能。同時,網絡信息的復雜性也意味著應發揮群體力量,實現更具體系與規模的存檔,這包括檔案的高校學術團體與學者、提供技術和資源支持的社會組織等。其中,可發揮更具龐大基數的網絡信息的形成者、傳播者和利用者的行動力,通過建立眾包型的平臺,由網民提供信息、幫助鑒別信息、組織和描述信息、開發信息產品等。
重大社會事件的網絡信息存檔在我國還處于初步進程中。為實現最優目標,一方面,在我國記憶機構包括檔案館、圖書館、博物館等具備的館網跨層級、跨地區、跨系統的連接優勢下,將線下征集的規模化行動拓展至網絡空間。盡管目前網絡信息存檔相比發達國家有一定差距,但此前面向社會的征集經驗和方法都可立足網絡空間進行適應性調整以形成我國模式獨具的全國廣泛力量的集聚。如,目前在征集宣傳上,官方網站、社交媒體、電視媒介等都包含在內。
另一方面,國際上已有實踐可從經驗與問題的正反兩大方面提供借鑒,涉及存檔主體、存檔范圍、存檔方法、存檔成果的資源化、存檔成果的利用等。如,IIPC的內容征集機制與流程以及存檔各環節已提供的數十種數字工具,都是可供使用或改良的基礎。
本文為國家社會科學基金項目“基于多元數字技術的網絡空間參與式歸檔研究”(項目號:18CTQ037)的研究成果。