互聯網信息社會化保存的冷思考與熱展望*

2020-01-09 10:51:38周文泓

圖書館論壇 2020年1期

周文泓

0 引言

2019年4月19日，以新浪為首個基地的國家圖書館互聯網信息戰略保存項目開啟圍繞國家數字記憶話題的討論，尤其是把新浪微博2，000多億公開博文與相應的5，000億評論互動納入其中，引發熱搜熱議。這意味著網絡歸檔在我國從分散的局部實踐走向建設覆蓋全國的分級分布式中文互聯網信息資源采集、保存與服務體系的新階段，有利于記錄多主體多時空的文明脈絡，更助力國家信息安全與社會信息化建設。其中，項目提出的社會化保存彰顯了我國信息管理主體從國家戰略層提出的宏大命題，它面向不同網絡層、服務平臺、應用工具、信息形成傳輸與利用主體等，但同時從內容、形式、背景等方面呈現社會、文化、技術、司法、管理挑戰。識別其中的重點難點并探索出相應對策是互聯網信息保存項目得以連續的要義所在，限于互聯網包含眾多門類，而社交媒體作為代表性的網絡應用，亦是此項目的首個試點基地，從其入手有助于一窺全景。

社交媒體保存檔實踐早已顯示互聯網信息社會化保存絕非一蹴而就的命題。政務社交媒體信息的檔案化管理通過近10 年的實踐，在美國、澳大利亞、英國等形成政務社交媒體文件全流程管理以及與之相應的檔案庫；同國家圖書館互聯網信息戰略保存項目性質類似的涵蓋范圍更廣的社交媒體保存2010年已體現于美國國會圖書館Twitter 檔案項目中；其他實踐均體現出各國與地區多元主體的參與和協作。然而，具體進展頻頻陷入瓶頸，法規政策、收集方案、長久保存策略、技術工具、利益機制等均存難解之題。在展望通過互聯網信息社會化保存拓展數字記憶建構的同時亦需考慮到互聯網記憶稍縱即逝的風險。

理論層面，社交媒體保存已不是檔案領域新論題，國內外一系列研究對社交媒體信息保存的必要性、挑戰、模式、優化策略等展開探索。首先，社交媒體信息保存的必要性獲認可，證據、信息、資產、資源、記憶等多維度價值得到明晰[1]；其次，圍繞社交媒體信息的背景、形式與內容特征基于已有實踐分析保存對象特點以及相應的管理挑戰，如制度不充分、信息量大、多形成主體、技術環境復雜等得到明確[2-3]；再次，機制、技術、政策等方面的對策都在研究中有所提及，多元主體參與的社會化模式得到倡導，提倡建立政府機構、記憶機構以及社交媒體平臺的協作機制[4]；最后，探討了組織架構、制度規范、技術工具等具體支撐，各方面策略得以提出，如建立社會化記憶機構聯盟、優化歸檔政策、API或爬蟲工具的開發[5-6]。然而，在研究成果凸顯社會化這一要義的同時，這些研究偏重于社交媒體信息保存的必要性、價值、方向以及宏觀模式，對于如何實現社交媒體信息社會化保存的具體問題與策略則缺乏充分設計和說明。

本文立足于社交媒體信息存檔的代表性實踐，解析其共同呈現出的問題以明確社交媒體信息所顯示的互聯網信息社會化保存的復雜性，然后基于對策的角度設計應對策略并展望保存成效。

1 多元社交媒體信息存檔實踐概覽

1.1 外包式的政務社交媒體信息管理

由于信息形成于獨立于政府之外的商業平臺，政務社交媒體信息的檔案化管理體現出對社會力量的依賴，正逐步實現不同層面的社會化參與，尤其表現為銜接自商業性文件中心的外包特色。目前的實踐主要體現為：

(1)平臺契約類。即由政務社交媒體信息形成主體，在政策法規、檔案機構規章制度、機構內部管理規范的合規框架內，同社交媒體平臺達成平臺使用協議，對信息實現全流程管理。社交媒體信息形成主體以合約方式將信息管理一定程度上免費外包于平臺。美國與澳大利亞從聯邦到多個地方州均有采用這類管理模式[7-8]。以美國聯邦政府機構為例，隨著總統換屆，奧巴馬2008年競選后在社交媒體平臺形成的白宮Twitter信息、視頻記錄等社交媒體信息，依據《聯邦文件法》與相關法規，應被及時移交、處置與保存，由此啟動針對奧巴馬及其團隊的社交媒體檔案項目。依據NARA《公告2014-02》，一旦聯邦機構在社交媒體上的信息被識別為聯邦文件，聯邦機構需按照《聯邦文件法》等規定捕獲、管理、保存、利用好這些文件。在美國總統預算辦公室的推動下、國家檔案與文件署的專業指導下、各社交媒體平臺依據協議以及法律法規的配合下，社交媒體信息得以在線捕獲和移交保存。以Twitter為例，在Twitter的技術和開放接口支持下，奧巴馬的@POTUS賬戶在2017年1月20日由第45任總統啟用的同時，奧巴馬總統原有的Twitter信息一方面線上遷移至由NARA維護的新創立賬戶@POTUS44，同時在線下保存至國家檔案館[9]。

(2)商業托管類。即在當前文件管理系統和網絡歸檔專業能力有限的情況下有償使用第三方商業機構的服務，由第三方商業機構根據文件檔案管理相關法律法規以及機構的特定需求開展服務。目前Archive Social、Archive it等機構均對各國與地區的政府提供定制化服務[10]。以美國聯邦與地方政府較常使用的Archive Social 為例，它是政府社交媒體文件托管公司，有超過1，800個政府機構客戶。它能做到嚴謹的合規性，遵從聯邦層面的《信息自由法》《總統文件法案》等以及每個州的法律法規，在文件必要捕獲、優質維護、提供利用如信息公開、回應公眾請求等方面均有相應產品。Archive Social能全天24小時自動持續捕獲Twitter、Facebook等8類社交媒體平臺信息，不同配置中形成的原始格式信息及其相應元數據均能得以捕獲，從捕獲到保存都能實現其真實、完整、安全、可用；還能面向利用整合信息，以多元方式如關鍵詞、日期、內容、標簽等組織所捕獲信息。同時，Archive Social還提供個性化服務，信息的鑒定、審核、保存、處置等均能根據各機構的規則設置[11]。

1.2 協同式的社交媒體信息資源庫建設

對應于由形成者分散式地對社交媒體信息進行前期獨立的檔案化管理，由記憶機構如檔案館、圖書館集中統籌建成長久的資源庫亦是較為普及的模式，這有賴多方支持：平臺的配合，保證開放技術接口與捕獲前、捕獲時的質量；第三方機構的工具、技術支持；信息形成者，確認和許可捕獲范圍與處置方案。較典型的案例為：

(1)檔案館主導的社交媒體信息資源庫。英國、加拿大的檔案機構均有相關實踐[12]。以英國國家檔案館為例，其依據《公共文件法》在2013年正式收集中央政府Twitter或YouTube賬戶發布的內容。英國國家檔案館統籌整個項目規則制定和落實，是信息資源最終的保存者和提供利用者；MirrorWeb公司有償提供技術服務，按照一定頻次爬取和捕獲相應社交媒體上的內容；英國中央政府各部門按照法律，許可其所發布的內容被捕獲，且提供應有支持，例如社交媒體上存在無法網頁爬取的內容時，該部門應主動報告部門文件管理官和國家檔案館，以評估是否應以其他方法保存，從而確保歸檔的完整性；社會組織——互聯網記憶基金會對該歸檔項目提供資金支持[13]。

(2)圖書館主導的社交媒體信息資源庫。美國、中國、荷蘭均有相應實踐，規模上更具代表性的則是美國與中國[14]。美國國會圖書館的Twitter檔案項目，2010年4月，美國國會圖書館與Twitter簽訂協議，協議規定Twitter公司將為國會圖書館提供公司從成立開始的tweets文本。項目主要開展如下方面的工作：①接收數據。2010年Twitter指定名為Gnip的公司來完成數據移交事務，之后國會圖書館和Gnip 在移交“現行”tweets 的具體要求和流程上達成共識，移交工作于2011年開始。②建立穩定與持續的Twitter 檔案館，這是指形成穩定和可持續的方式獲取、保存與組織Twitter不斷增長的信息流。③探索實現Twitter收藏利用的方法，Twitter信息在數量、增速、內容和形式等方面都對管理與技術提出了挑戰，如何將這些海量信息整合成可供方便利用的資源需要研究[10]。項目把Twitter的收集對象主要分為3個階段：①對2006-2010年12月的Twitter文本進行全部收集，這是簽訂合約時明確規定的；②以更加同步的時間接收Twitter 在2011 年之后形成的全部文本類信息；③2017年12月31日起，基于國會圖書館的收集政策有選擇地收集Twitter信息，形式上不再僅限于文本，而是包括視頻、圖片、音頻、鏈接等其他形式[15]。

中國國家圖書館“互聯網信息戰略保存項目”尚處于啟動期，在實踐數據上顯示有限。經由網絡調研所收集的國家圖書館與新浪網對外公布的信息，項目亦有較充分的內容：根據雙方在2019年4月19日簽署的合作協議，為實現對網絡時代社會記憶、人類文明的協同保存，中國國家圖書館將會統籌建設覆蓋全國的分級分布式中文互聯網信息資源采集與保存體系，并提供信息數據保存規范、遴選機制、服務需求及利用需求；新浪將會全力發揮自身技術優勢與平臺優勢，與中國國家圖書館加強數據對接，提供信息數據采集、保存、檢索、提取和挖掘等方面的技術支持；此外，國內其他互聯網企業和機構都可申請參與該戰略保存基地的共建中。在新浪微博上形成信息的各類主體所有已經公開發布的博文，都將被該戰略保存基地采集和保存。據新浪統計，截至2018年12月，微博全站公開發布博文超過2，000 億條，圖片和視頻量超過500 億條，評論互動總量近5，000億，且新發布的內容也會持續被保存[16]。

1.3 共筑式的服務型社交媒體信息保存

同互聯網的高度自組織特點相關，網絡歸檔主體亦有大量的非政府組織與個人，其依賴社會贊助與各類專家獲得持續運營的資源提供兩類服務：以第三方的名義捕獲各類社交媒體信息且提供信息利用服務；在為機構與個人自主收集提供工具的同時將這些機構與個人轉換為公共資源貢獻方。全球最大的互聯網檔案館Internet archive和Andrew W.Mellon基金會資助的由美國馬里蘭大學、弗吉尼亞大學、Shift Design公司合作創建的DocNow項目是其中兩個代表性實踐[17]。

以Internet Archive 為例，作為全球最大的網絡信息保存服務型平臺，它的運營支持來自自身提供服務的收入、基金會和公眾捐贈。它所保存的社交媒體信息主要來自4方面。(1)Internet Archive每隔一段時間通過網頁快照存檔許可被抓取的信息，其中包括部分社交媒體網頁，部分以專題整合為“檔案集”，如“占領華爾街Flickr照片檔案集”存有15，103 張在Flickr 社交平臺上公開發布的照片。(2)Internet Archive 增值服務工具Archive it 幫助各類用戶依照需求捕獲、維護和利用自身的社交媒體信息，可共享至Internet Archive，截至目前Archive it已經為16個國家共694個組織服務，社交媒體信息是歸檔信息中的重要組成部分。(3)社交媒體平臺自主提供合作資源，如YouTube就貢獻了部分視頻；(4)公眾個人通過Archive-it和Wayback Machine保存自己或者他人的當時的社交媒體信息，還可上傳自己已有的數字資源到“檔案集”中，如在美國國會圖書館的個人存檔項目中得到推薦使用。在技術開發過程中，圖書館提供了協助，如北歐五國圖書館同其合作研發信息采集軟件Heritrix[10，18]。公眾作為用戶利用其所保存資源的同時可通過打分、信息補充等方式完善資源，且可申請刪除已捕獲信息維護自身權益以及幫助平臺減少倫理與法理風險。

2 冷思考：存檔實踐映射的社會化保存多重挑戰

縱觀國內外現有的社交媒體信息保存實踐，均處于不完備的狀態中。政務社交媒體文件遲遲未有完整的政策規范明確其捕獲、鑒定、分類、長期保存的要求；社交媒體信息保存法律與標準尚未面向長期保存與即時處置的平衡予以制定；已經得到捕獲的信息未能被有效整合與提供利用；社交媒體平臺與第三方保存機構提供的只是暫存以及有限的保存功能，信息質量維護力度不足。這很大程度在于社交媒體信息存檔是復雜的系統性事務，更突顯出互聯網信息社會化保存需關注的多方挑戰。

2.1 龐雜的保存資源需求

社會化保存需應對跨平臺、跨主體、跨時空的復雜信息，社交媒體僅受其傳播特性、用戶基數大、覆蓋領域廣泛、形式多樣以及平臺多元的影響都形成了大量復雜內容與多種形式的信息。因而，就某個平臺的社交媒體信息而言，若要面向社會化保存匹配多元需求的信息：一方面，需大量齊全和動態升級的軟硬件基礎設施，包括存儲與運行設備、管理系統、網絡配置等，這要求大量的管理資源與經費投入。另一方面，社會化保存的整體規劃、統籌和落實，需要不同層級人員，如高級主管和基層人員以及有著各類業務專長(包括信息、技術、法務、人文、管理等領域)的人才組成的團隊，由此滿足整體項目的運行和保存這一專業事項從收集到提供利用的全流程要求。因而，社交媒體信息，尤其是在以構筑整體網絡資源為目標的情況下，絕非某類機構可提供完整的保存資源。以美國國會圖書館為例，其項目公告中提及的一個重要挑戰就是難以配備充足的基礎設施，依據其自我評估，完成一個檢索任務需要24個小時才能完成，除非能投入成千上萬臺服務器[15]。更需說明的是，對我國而言，當前僅是新浪一個平臺，首期要收集的新浪微博在2018年12月前就包括2，000多億公開博文與5，000億評論互動，之后還將隨著3億多用戶對平臺的持續使用不斷擴充[16]。而微信、百度貼吧、豆瓣、知乎等社交媒體平臺尚未納入，且其他類型的互聯網應用更不在其中。相比此后將隨著互聯網信息保存項目拓展的其他平臺，這僅是一小部分，所需資源更要通盤考慮和計算。

2.2 信息邊界難分的主體矛盾

社交媒體被視作由多元主體共同生產與消費機制支撐的平臺，其信息的形成者、傳播者、利用者相互轉換和融合。一方面，內容生產者與消費者互通互換，并同提供網絡服務的平臺形成多邊信息消費場景，平臺用戶通過平臺獲取信息的同時也貢獻信息于整體的資源建設。另一方面，不同主體形成的信息需融合才能組成某個主題或活動的完整記錄。例如，用戶發布的信息之下往往有其他用戶的評論、轉發和點贊信息，更依賴于平臺為信息提供的半結構化形式配置。因而，在保證完整性立足關聯收集和提供利用信息的同時，社會化保存中不同主體之間的價值取向和利益沖突是需要克服的挑戰。一方面，形成者、保存者和利用者的立場與要求不同，信息權屬與隱私需界定和保障。已有實踐將用戶發布的公開信息納入保存的潛在范疇，那么法理上將個人或私人機構所形成信息捕獲至公共機構并提供利用是否侵犯其信息資產，且一旦提供利用是否會違反形成者的意愿或造成倫理風險，形成者為現行活動創建與公開信息是否就意味著允許面向未來的長久開放利用？另一方面，平衡共同形成者機制下不同形成者的權益與取向需從倫理上明晰人與信息的利益邊界，更要從法理層確定形成者與信息的權屬規則。例如，美國聯邦政府捕獲社交媒體信息時明確為保障13周歲以下兒童權益不公開與收集其評論[19]；英國國家檔案館和美國國會圖書館認為提供利用網絡信息的挑戰是如何識別和處置已收集但在平臺端被用戶刪除的信息[20]。

2.3 難以保存社交媒體作為信息庫的整體關聯

社交媒體信息保存是對信息內容、背景、形式、有機聯系等要素的整體行動，它從整體到微觀都是以疊加和關聯形態呈現。微觀層，即使一條記錄，也有很大可能圍繞某個主體、某類事件同其他信息產生關系。宏觀層面，社會組織、機構、群體以及個人在社交媒體平臺開展社會活動開展信息行為時也依托社會網絡產生互動，因而圍繞主體或活動產生整個社會的關聯，這也是互聯網信息保存項目被視作構建國家數字記憶的緣由所在。社交媒體平臺要作為整體關聯的資源庫得以持續運行且納入保存項目也需維護此特質，以幫助最大程度還原社交媒體信息所記錄下的多元場景、主體、活動以及相互之間的關聯。然而，上文所述關聯往往隱性嵌入信息對象及其元數據中。一方面，在捕獲的前端就需收集平臺主要信息關聯機制及其要素，如主體類型、社交網絡、內容、時間、地點、活動，明確有哪些關聯且能夠與應當先捕獲哪些關聯；另一方面，面向利用的整合過程中進一步補全與提煉關聯，通過技術與人工分析共同將其完整顯性化，從而將充斥碎片化信息的社交媒體信息庫轉化為有序化資源體系。然而，這些關聯的數量、類型、向度與深度的復雜使得難以被直接捕獲與整合，要求制定與動態升級相應規則與技術方案。例如，Internet Archive 只能依據平臺或時間提供檢索結果，未能充分展示某個主體或某個事件的全貌，這在于信息之間的關聯在捕獲與整合時暫時難以整體構建[18]。

2.4 多元保存方式的沖突

社會化保存意味著不同保存力量的參與，它被視作由大眾書寫國家記憶的重要途徑。各類協作式實踐顯示多元力量參與的必然趨勢，社交媒體網絡服務提供商、形成者、記憶機構、第三方社會機構等涉及其中，但不同保存方存在立場、目標、意識、能力、方法、資源的差異，協作是對各方記憶與遺忘的平衡，即使是同樣作為記憶機構的圖書館和檔案館，都有不同之處。在這其中，保存什么、誰來保存、如何保存、保存的信息如何利用等都需要統籌與設計。當下實踐中挑戰源于各方參與的過程缺乏協同或統一的框架。以Facebook 為例，保存由3 條主線組成：一是由平臺自主保存，采用了冷保存與共享式開發的策略；二是為用戶提供“檔案管理”功能，為形成的不同類別信息配備信息下載功能[21]；三是Internet Archive會抓取部分網頁，Facebook已是其每年捕獲數量最多的15個網站之一。然而，三方各自展開保存行動，并未協同甚至形成了沖突。前二者同Internet Archive 基本相互獨立，沒有在方法、資源與平臺上協作，而Facebook同用戶作為保存者的矛盾更甚，引起平臺信任危機，最典型的是Facebook向社會開放部分信息供開發使用，導致技術公司劍橋分析通過10多萬用戶信息關聯捕獲到8，000多萬相關用戶的信息用于美國總統競選，引發關于信息權和隱私的恐慌[22]。以英國國家檔案館的社交媒體檔案庫為例，在為2012年倫敦奧運會展開專項行動的過程中，由于Facebook沒有開放接口導致整個項目缺失了存有大量奧運會信息的記錄[5]。

3 熱展望：面向信息管理理論、方法、能力升級的社會化保存策略建構

由多主體形成的涵蓋社會多方面甚至跨平臺的全方位社交媒體信息向圖書館、檔案館、博物館、信息部門等提出多重復雜挑戰，在以“全體”保存數字記憶的目標下，面臨權益與義務、法理與倫理、技術應用與開發等有待周全的事宜，互聯網信息社會化保存項目作為分支分階段項目的集成群將迎來更復雜的挑戰。同時，當前實踐困境亦為制定對策提供方向，更是為記憶與信息機構在數字轉型中立足網絡空間升級理論、方法、實踐能力顯示空間。

3.1 參與式管理框架下組建完備資源

為匹配信息保存所需的軟硬件、文化、智力、財力等資源，社會化協同是必要途徑，即多元主體參與信息保存，依據各主體的特質相應定位，為不同方面的貢獻提供協同機制。當前，我國基本形成了以圖書館、檔案館等記憶機構領銜的互聯網信息保存機制，立法機構、政府、網絡服務提供商、個人與機構形成者、第三方服務機構都有參與空間。

(1)信息與記憶機構成為關鍵輔助者。在國家圖書館作為領導機構的當下，還應納入其他圖書館、檔案館、博物館、信息部門等信息與記憶機構形成記憶聯盟，以形成更加充分的資源推動互聯網信息保存項目的開展。不僅要做保存者，而且要通過全局性的頂層設計和行動計劃做統籌者、主動的收集者與指導員。

(2)形成者尤其是大眾是絕對參與主體，如果實現人人參與，那么人人都成為信息的記錄者、搬運工與管控人，他們不僅是信息的利用者或有限的參與者，而是成為一定程度或情境中的主導者，以眾包等形式分解復雜任務。

(3)立法與政府機構，可通過網絡空間的法律法規與規章制度來確定信息保存與處置要求，明確信息與數據權屬，確認有哪些利益相關者及其相應的權利與義務，由此幫助互聯網信息保存項目確認法理與倫理規則。

(4)網絡服務提供商作為信息的形成、傳播、存儲與暫時性保存平臺，應在管理與技術上配合互聯網信息保存項目，既要保證信息真實、完整、安全、可用等可信屬性，亦要依據權屬完成信息的遷移、保存以及提供利用。

(5)第三方記憶機構，可為互聯網信息保存項目提供資源與技術支持，如可同Internet archive交流合作使用相關技術實現對信息的捕獲、整合以及提供利用。

3.2 主體協同機制下強化制度建設

為保障多元主體參與，多層級多類型的制度幫助明確利益機制與規則是要務。當前我國圍繞網絡空間信息形成《中華人民共和國網絡安全法》《互聯網個人信息安全保護指南》《全國人民代表大會常務委員會關于加強網絡信息保護的決定》《互聯網信息內容管理行政執法程序規定》GB/T 35273-2017《信息安全技術個人信息安全規范》《微博客信息服務管理規定》《即時通信工具公眾信息服務發展管理暫行規定》等政策法規。基于現有制度，兩大方面的補足是當下互聯網信息保存項目可獲得實質性持續推進的重中之重。

一方面，政策法規的內容覆蓋面應持續拓展。首先，信息管理流程上應從形成與傳播層面拓展至更加全面深入的保存段，當前政策法規主要是規范信息與傳播環節，但信息形成與傳播之后的捕獲、遷移、處置、維護、保存等一系列跟保存相關的事宜除了在安全維護上有一定涉及外基本無相關內容，這是政策法規應拓展的部分。其次，從個人信息擴充至體量更大的內容信息，即用戶開展社會活動在社交媒體所形成的各類記錄，內容信息的價值是作為用戶證據、記憶、資產、資源所必要管理的一方面，而內容信息的失真失存失當利用給利益相關者帶來的損失亦是內容信息保存應得到規范的原因。最后，社交媒體信息保存利益相關者應當在政策法規層面得到確認，即保存相關方如記憶機構、形成者、第三方機構、網絡服務提供商等應予以識別并從權利與義務上明晰邊界與具體內容。

另一方面，以政策法規為中間層進行層級拓展。首先，在頂層設計上實現國家級的戰略導引與部署，國家數字記憶的提法呈現了一定的頂層戰略性，但互聯網信息的證據、資產、資源價值應當同樣體現，并同網絡空間治理、安全以及網絡命運共同體等進一步關聯，且與人工智能、智慧城市等規劃連接，由此從國家層面倡導互聯網信息的社會化保存，并實現階段性目標設置與具體規劃。其次，豐富規范與指南制定，幫助不同主體在有意識參與的前提下明確可以提供何種貢獻以及如何行動以貢獻于互聯網信息的社會化保存，從目標、原則、方法、流程、保障等多方面明晰具體要求。最后，增加不同主體圍繞互聯網信息保存的協議建設。例如，平臺提供的服務協議要加強信息保存的內容且要符合專業管理要求，而機構形成者更要同社交媒體平臺達成合約確定信息歸屬，社交媒體平臺、用戶、記憶機構亦要通過協議確認保存以及利用社交媒體信息的權責等，由此能夠將不同主體的保存需求與所能提供的貢獻精準融合于協同機制中以落實到具體實踐層，從而確保互聯網信息保存項目有“契約”依據。

3.3 整體關聯前提下構建保存能力

依據我國網絡歸檔現狀以及互聯網信息保存項目的基本路徑，保存能力在整體關聯的前提下表現為：一方面，在能力建設上顯示為互聯網信息保存各利益相關者的識別、關聯與協作，這包括信息的形成者與傳播者、提供服務的互聯網平臺、具有專業能力的信息與記憶機構、有意參與的具有資源的第三方社會機構等。互聯網信息保存絕非一方可獨立完成的任務，他們既要形成面向整體的多元協作主體群，亦要明確信息與記憶機構在專業前沿和使命擔當上的示范性。另一方面，這些主體要共同構建出的能力在內容上表現為兼具信息管理、技術應用、人文素養的系統整體。信息管理是互聯網信息社會化保存的核心，即保存哪些信息、具體流程與環節、相應規范和標準等都在互聯網文化與技術情境中得到細化與建構，以此解決如何做的問題；技術應用是強化實踐技能，將互聯網信息保存如何做的問題通過開發和應用各類技術予以輔助乃至落實；人文素養則是幫助明確互聯網信息保存的方向，在協作中明晰相互邊界，在信息內容與信息管理分工上協調好法理和倫理沖突。具體能力建設將分成通用與專業能力建設兩大層面。

(1)作為形成協同的主體群，文化培育與素養建構是重點。文化培育上，要確保各主體參與信息保存且發揮主觀能動性以落實于合規有效的行動，這為互聯網信息保存項目提供認識基礎。一方面，信息文化應得到貫徹，即在國家層面完成自上而下的信息作為證據、記憶、資產、資源的認知構建，推動各類主體將信息保存作為必要的社會活動進行開展。另一方面，參與文化需得以培育，即各主體能認識到互聯網信息保存是社會共建的事務，不僅能夠主動參與，而且能知道在協同框架內各有分工，積極和有效的參與是重點。素養建構是信息保存從意識落實于有效行動的關鍵，即各主體能夠理解信息保存的內涵、要求、自身定位以及實踐要領，這就更加要求圖書館等信息與記憶機構作為推動者組織形成互聯網信息保存框架，包括滿足不同需求的法律、政策、標準、原則與方案等。

(2)作為互聯網信息保存項目的領導者，國家圖書館及其組織的記憶聯盟更應加強能力建設。兩大方面尤其要得到強化：一方面，信息保存專業能力。當前信息管理理論與方法已不完全適用于互聯網信息的整體關聯保存。可針對不同應用如社交媒體試點多元方案，根據互聯網信息的特質、保存目標、保存要求等形成相適應的模式，由此需要的是在專業能力上重構信息管理理論與方法，并完成流程再造。另一方面，技術應用與開發能力。互聯網信息保存依賴于技術支持，能夠識別技術需求并應用合適技術是信息與記憶機構不可或缺的能力，同時能夠將技術使用于互聯網信息保存的具體場景中，且必要時面向專業需求完成部分技術的自主升級甚至開發。

3.4 復雜任務認識下部署連續性行動

互聯網信息保存不是一蹴而就的命題，更非即時完成的任務，只有這樣的理解，才能將目標與規劃精準融合。因而，認識與行動都要有相應策略。

(1)理解互聯網信息保存是復雜任務的內涵。它的復雜性在于：一方面，互聯網信息保存是跨網絡場景與應用的，即面向不同功能的網絡平臺以及利用主體，其信息背景、內容與形式均各有特點，實現全體或大部分保存是極為艱巨的任務。例如，即使是新浪微博這一單獨的社交媒體信息保存已呈現各種挑戰，而新浪微博只是眾多平臺的一個，充分的資源與能力有待長久的建構。另一方面，互聯網處于“生長”中，它并非固化于當下的形態，而是隨著社會與技術發展而變換，其形成的信息隨之在背景、內容、形式上發生變化，保存要求亦需要調整保存理論、方法與具體方案，這將隨著互聯網的發展而持續。

(2)有效規劃是應對關鍵。互聯網信息保存作為復雜任務絕非一個時間段與一個方案可簡單完成，而是需要精密部署形成有效規劃：一方面，確認保存目標以明晰方向、原則與方法，從而依據時空設定保存范圍與行動階段。例如，總體目標是哪類信息的保存、項目分為幾期、平臺選擇標準等都應納入頂層設計中。另一方面，面向未來的具體行動規劃亦是必要，即確認清楚每一階段的策略、維度與實施路徑。例如，在無法周全所有平臺的情況下可選定重點的網絡應用類型與相應的代表性平臺。

4 結語

互聯網信息社會化保存已是數字轉型背景下社會記憶建構的重要方面，是人類記憶由國家書寫走向社會書寫的關鍵方面，在當前社交媒體從官方組織、社會機構、群體以及個人相互協作又各有主導的多元實踐中呈現了探索進程、挑戰與發展方向。本文基于社交媒體存檔實踐從資源、主體、對象、方式等維度顯示了互聯網信息保存的復雜性，對應提出組建完備資源、強化制度建設、構建保存能力、部署連續性行動的具體策略。同時，限于互聯網信息社會化保存涉及信息、管理、司法、人文、技術等多方面的復雜性，既要求理論上深化跨學科的升級闡釋，又要求更多實踐數據的收集分析，有待更全面深入的研究。