鄭丹妮
摘 要:采用文獻分析法,以信息空間理論為切入點,從編碼、抽象和擴散三個維度解讀歷史檔案的數據化特征。文章提出突破歷史檔案生存危機的關鍵是歷史檔案知識社會化,強調對數字歷史檔案的數據化開發和利用。文章還根據信息空間中知識演化的過程特征,得出兩種歷史檔案生存模式。
關鍵詞:信息空間;歷史檔案;數據化
Abstract: The paper uses literature analysis method. this paper analyzes the data features of historical archives from the three dimensions of coding, abstraction and diffusion. The article points out that the key to breaking through the crisis of historical archives is the socialization of historical archives knowledge, emphasizing the digital development and utilization of digital historical archives. According to the process of knowledge evolution in the information space, the article draws two kinds of historical archives survival mode.
Keyword: Information Space;historical archives;Digitization
歷史檔案真實記錄和反映著中華民族的集體記憶,不僅是中華先民智慧的結晶,也是中華歷史文化遺產不可或缺的重要組成部分。關于歷史檔案的定義,馮惠玲、張輯哲認為:“歷史檔案是指形成時間較早、離現在較久遠且主要起歷史文化作用的檔案。”[1]李財富認為:“歷史檔案是指1949年中華人民共和國成立之前的檔案,這些檔案主要發揮的是非現行價值,面對的利用主體是社會的各個方面。”[2]楊珩、史江認為:“歷史檔案主要是指1949年10月中華人民共和國成立以前所形成的檔案,包括明代以前、明清檔案、民國檔案和革命歷史檔案等。”[3]從上述定義可以發現,學界主要是從時間角度界定歷史檔案,歷史檔案具有形成時間久遠、歷史文化作用明顯等特質。
信息革命之前,歷史檔案就已經出現生存危機,這種危機源于歷史檔案形成時間早的特征,體現在歷史檔案實體上。信息革命發生后,在數字化技術的幫助下,檔案的內容信息從載體上解放出來,在縮微技術、數字化技術的幫助下,得以以模擬形式、數字形式重現,這些技術從一定程度上緩解了歷史檔案長期保存危機,檔案館也因此有了更多的時間思考如何戰勝危機。然而,信息革命在挽救歷史檔案實體危機的同時也帶來了新的問題。信息革命后,信息成為與物質、能源同等重要的存在,共同構成起支撐社會發展的三大支柱,世界范圍內數據的數量激增,數據的豐富性阻礙了人們對有用信息的捕獲能力,成為歷史檔案生存危機新的源頭。如若歷史檔案利用無法打破時空界限被社會獲取發揮價值,則注定被海量數據掩埋,被迫處于社會邊緣狀態,為社會所淘汰。當前,已有學者意識到這一危機。理論層面,裴燕生提出通過因特網管理和數據庫管理提供利用文件是歷史檔案數字化管理的最終目的。[4]楊珩、史江提出要對歷史檔案的潛在信息進行挖掘,強化歷史檔案在編目、校勘、輯佚等方面的數字化工作,同時建立專題性強且具地方特色的歷史檔案數據庫,并允許用戶登錄互聯網進行目錄查詢。[5]實踐層面,中國第一歷史檔案館、中國第二歷史檔案館相繼開展歷史檔案的數字化項目并對其進行開發利用,為理論研究提供經驗參考。顯然,檔案界將實現歷史檔案數字化開發利用視為歷史檔案度過危機的突破口。立足已有的研究基礎,筆者嘗試將信息空間理論與歷史檔案數字時代的生存問題相結合,依托信息空間模型,從編碼、抽象和擴散三個維度分析數字時代歷史檔案的生存特征,繼續探索歷史檔案如何度過生存危機這一核心問題并思考突破策略,為歷史檔案在數字時代的生存提供新的思路。
1 信息空間理論與歷史檔案數字生存
信息空間(Iinformation space)是英國學者馬克斯·H·布瓦索(Max·H·boistz)提出的概念框架,用于研究信息空間框架中編碼、抽象和傳播三維上數據、信息和知識的轉化關系。布瓦索將數據定義為事物的一種屬性,如輕重、黑白等;而知識是行為主體的屬性,預先決定了行為主體在特定條件下的行為方式;信息則是事物與行為主體之間建立的一種聯系,其轉化關系如圖1所示[6]。
從圖1可以看出,行為主體通過感性或理性工具過濾得到對行為方式有意義的事物的數據子集(信息),這些信息會融入行為主體的知識儲備,成為其知識源,在特定條件下影響行為主體。布瓦索通過信息空間上編碼、抽象和擴散三個維度解釋了這個過程,信息空間的構成如圖2所示。其中,編碼是賦予現象或經驗以形式的過程,抽象是構成種種形式之基礎的結構的過程,擴散是經過編碼和抽象的信息傳播給受眾的過程[7]。
當前歷史檔案的生存危機除了實體保存之外,還有因數字時代到來而出現的新危機,即歷史檔案需要在海量數據環境中獲得競爭優勢,避免被其他數據掩埋。針對新的危機,我們需要對歷史檔案數據進行深入開發并將其轉化為易于大眾接受的知識為社會所用,換句話說就是實現歷史檔案知識社會化。這一點,恰好同信息空間上事物本身的數據通過編碼、抽象和擴散三個維度轉化為知識的運動過程相類似。從信息空間理論視角來看,對歷史檔案的開發合理利用實質上就是對歷史檔案進行原始數據編碼、抽象得到適合大面積擴散的信息集合的過程。需要強調的是,歷史檔案本身就是數據、信息和知識的集合體,在數字化的過程中,這種原有的集合體在技術的影響下發生變化,原先感官可捕捉的信息在數字化之后被隱藏,需要額外的描述將其表達出來。舉例來說,明清檔案原件字體的大小、字跡顏色、紙張材料及薄厚程度的不同等,如深紅色背景黑色字跡,淡黃色背景紅色字跡,顏色較淺字跡,以及紅、藍色字跡等因素,會對輸出到縮微膠片上信息的清晰度及完整性產生相當大程度的影響,從而造成檔案信息丟失。[8]這種丟失若不采取措施,會隨著“模轉數”技術被傳遞到數字形態的歷史檔案上,影響檔案的質量。因此,重新分析數字化后的歷史檔案在信息空間編碼、抽象、擴散三個維度的特征可以為歷史檔案生存問題提供更好的方法和思路。
2 基于信息空間三個維度的歷史檔案數據化解讀
2.1編碼維度。編碼的過程是以其最具一般性的表達方式,創造有助于對現象進行分類的感性的和理性的范疇[9]。具體來說,就是對事物的數據進行描述的數據處理過程,使其從模糊向清晰轉變,比如對于玻璃杯,從視覺角度來看是透明的、觸覺角度看是硬的。“透明”“硬的”這些形容就是對玻璃杯這個事物數據的最初的具體的描述,是個人所接收感官數據被外化和描述的結果。通過編碼這些具體的感官數據可以使用更高級的表達方式,比如語言和文字來建構起某個事物的整體性認識。對檔案來說也是一樣的,“文字記注的”“放在庫房里”這些是對檔案這一事物的直觀的描述,通過編碼,人們開始使用案牘、冊等概念來描述檔案這個事物。因此,編碼程度的高低影響著人們對其描述的事物識別的清楚程度。
就歷史檔案而言,編碼維度強調完整性。從內容上看歷史檔案本身已經是形成者對檔案所記述內容的編碼成果,并且這個編碼成果是已經經歷過抽象和擴散過程,以符合識別標準的結構的狀態被呈現出來。因此,當歷史檔案從物理形式向數字形式轉變時,需要注意歷史檔案原有的內容信息(編碼成功)的完整轉移,做到不遺漏,確保歷史檔案信息價值的發揮不會受到影響。然而,除了歷史檔案所記載的內容信息,歷史檔案的載體材質、記錄形式、裝具、紋飾等也是不可缺少的信息,這些信息側面反映了檔案形成和流轉的時空特質。當歷史檔案向數字形式轉變,從以原子和分子構成轉變為由0和1構成,時間和空間的距離阻斷了人們對歷史檔案這個事物的實體數據的直接捕獲,人們所接收的所有信息都依托于數字形式的歷史檔案,這時歷史檔案數字化表達的完整性直接影響這部分信息數據的隱現。若不對被隱藏的數據進行重新編碼,則這部分數據可能就此被忽略,造成檔案信息丟失。因此,數字形式的歷史檔案要想保證完整性,一方面需要保證歷史檔案從物理形式向數字形式轉變后,保有原先物理形式歷史檔案的全部編碼結果;另一方面,還需要在數字化過程中關注歷史檔案的物理形態信息,對轉碼過程中被隱藏的信息數據進行額外的編碼。編碼過程的完整是歷史檔案抽象和擴散的基礎。
2.2抽象維度。抽象是通過我們在完成某項特定任務時所需要的類別數最小化,從而實現數據處理上的節約[10]。簡單來說,抽象就是一個簡化過程,是一個用少表示多的過程,是對編碼后的數據集合進行分類、精簡和概括的過程。可以說編碼過程指向歷史檔案數據完整性,而抽象過程指向歷史檔案數據描述的可共享性。比如,關于玻璃杯的描述有玻璃杯大小、重量、顏色、手感、易碎度等多種,如果將所有的特征直接打包進入信息的擴散維度,會出現數據量大和數據冗余的情況,不適合信息(數據集合)的接收者接收和理解。“檔案”這一詞匯的產生實質上也是抽象過程發揮作用的結果。清軍入關前,滿漢兩族各自擁有對“檔案”這一事物的描述,比如檔子、案牘、冊等。清王朝成立后,在民族融合的推動下,“檔案”一詞開始逐漸普及開來。總之,抽象就是對描述進行篩選與合并,在這一過程中與信息的傳播最終意圖無關的數據的排除,并且以一個具有更高概括度和社會認可度的結構確定下來的過程。抽象的程度越高,則越容易被不同背景的用戶所共享[11]。
歷史檔案在抽象維度主要經歷兩個階段:第一個階段是對編碼的結果進行整理和歸納。也就是說,要形成具有一定概括性和普及度的類,方便歷史檔案編碼結果的分類和匯總。第二個階段是在第一個階段的基礎上,圍繞特定主題對結果進行數據過濾,對分類后的數據集合(信息)根據與核心意圖的因果關系進行類別的刪減,通過數據節約的方式保證數字呈現和傳播的結果最優化。
2.3擴散維度。擴散維度是構成信息空間的三個維度中的第三個維度,擴散維度可參照在不同編碼和抽象程度上運作的信息可以達到的特定數據處理的總體的比例來標度[12]。換句話說,擴散維度衡量的是經歷過編碼和抽象維度的信息在多大程度上能夠被社會各方面的利用者所接收和理解。就檔案而言,“檔案”一詞是清軍入關,滿族民族詞語逐漸同漢文化相結合的產物,擴散就是描述“檔案”這個詞匯在群體中的被接受和普及的程度。從某種意義上來說,擴散維度其實是對編碼和抽象維度得到的結果的顯示的檢驗,表示的是基于個體的私有知識向共享知識移動的區域,擴散值越大,則信息實現的共享程度就越高。
對歷史檔案而言,擴散維度上強調傳播的有效性,即歷史檔案信息的傳播速度、范圍和接收者的理解,這些首先受到技術的影響。歷史檔案信息從發送端傳送到接收端,首先受到信息傳遞技術的影響,要想保證內容信息在發送端和接收端具有一致性,必須選擇合適的技術。其次,傳播速度和范圍還會受到編碼和抽象結果表達方式的影響,采用更多人可以掌握的表達方式有利于信息的擴散。此外,傳播速度和范圍還需要結合宏觀的社會和文化環境,分析適合歷史檔案信息擴散的時機,合適的時機下,信息接收群體對歷史檔案信息的吸收和運用能力更高。
3 信息空間視角下歷史檔案生存模式
3.1知識演化與歷史檔案數據生存。知識是行為主體通過選擇和過濾,從數據中提煉出來的信息中,對特定行為方式產生決定作用的部分。歷史檔案數字化生存從實質上也可以理解為是數字化后的歷史檔案數據經過整合和提煉,以信息的形式被傳遞,追求知識化的結果。在信息空間中,知識的動態演化涉及四個區域。如圖3所示,在區域A中的是未被擴散的個體的知識。位于A區域的知識通過抽象和編碼,去除一些默會的細節可以獲得一般性,從而進入B區域。在B區域中,知識受到其創造者的控制變成專有的東西,這種控制表現為專利和著作權等形式。隨著時間的推移,專有的知識會進入公共領域得到進一步的擴散,成為公共知識。而當人們使用公共知識,并把它運用在不同情況之下,公共知識會發生內化,到達D區域,知識會從顯性轉化為隱性的默會知識,被整合到常識的范疇,從而達到普遍[13]。
就歷史檔案而言,檔案館藏歷史檔案同時分布在A區域和B區域之間,這兩個區域的共同特征是擴散性不高,但B區域比A區域的抽象編碼值更好,若A區域是經歷過整理環節的歷史檔案,則B區域則是經過檔案館編纂的檔案產品。A、B區域的歷史檔案要想進入C區域,知識性質的轉變是關鍵,而擴散是這種轉變的表征,擴散所具有的傳播特質,對于歷史檔案提高社會認知度,在數字時代繼續發揮價值有著積極作用。從知識演化過程可以看出,知識的最高形式是常識,常識通過知識的內在化達到,而知識內在化又以知識的運用為前提。前文已經提及知識實質上是信息集合,所以知識的運用即信息集合的運用,根據信息集合編碼抽象程度的差異,筆者認為當前檔案領域內通過知識運用以實現歷史檔案擴散的模式有兩個,區別在于進入知識運用環節時歷史檔案編碼抽象的程度:一是待數字形式的歷史檔案形成具有高編碼、高抽象特征的信息集合時,通過現代傳播技術,投入擴散維實現知識運用;二是直接將編碼、抽象程度不高的數字形式的歷史檔案投入擴散維,讓利用者成為編碼抽象的執行主體,在傳播同時繼續編碼、抽象工作。
3.2 基于高編碼抽象的歷史檔案。高編碼、高抽象形式的歷史檔案,其擴散維的主要目標在于歷史檔案知識的傳播,這需要耗費較大的人力和時間成本,所以一般是以檔案館為這些過程的執行主體,檔案館在這些過程中需要著重解決三方面問題:一是在抽象過程中,對于數字形式的歷史檔案數據應該遵循怎樣的標準和規范來保證歷史檔案的原生性,盡可能避免數字化過程對完整性的影響;二是在抽象過程中,要發掘歷史檔案之間的因果關系,形成特定主題歷史檔案信息的知識脈絡;三是擴散過程,確保歷史檔案信息傳播的準確性和有效性。
從編碼過程看,目前檔案館針對歷史檔案的數字化項目,以歷史檔案長期保存為目標,強調數字轉化成果與歷史檔案原件保持一致。實際操作過程中,有部分檔案館已經關注到轉碼后歷史檔案整體數據的變化,從而增加對技術性信息的額外描述,但從整體層面來看對歷史檔案整體數據化仍有不足。因此,歷史檔案的數據化應當立足歷史檔案長期保存的目標,以歷史檔案整體數據化為核心,重視修訂與之相關元數據標準和規范,將除歷史檔案內容之外的其他有價值的數據包含在內,積極吸納有利于歷史檔案完整轉化的新興數字技術,為后期的抽象和擴散打好基礎。
從抽象過程看,當前歷史檔案多采用先整理后數字化的模式,數字化后的歷史檔案直接將物理形式歷史檔案整理的結果轉移到數字環境[14]。知識脈絡也在此基礎上得以呈現。數字化經驗豐富,降低了數據化過程對歷史檔案進行抽象的難度,但也帶來了問題。經驗豐富意味著檔案館可以運用的分類法較多,在不同分類法上形成的歷史檔案元數據集合的語義關聯懸殊,主題法基礎上形成的元數據集合具有更高的語義關聯度,而組織機構法則較為薄弱。因此,檔案館應當明確歷史檔案原件分類法,建立符合要求的元數據標準,以保證知識脈絡的完整呈現。
從擴散過程看,當前對歷史檔案傳播效果的評價多是從檔案館角度展開的,忽視了利用者對傳播效果的評價功能,缺少在線服務溝通與反饋機制。因此,檔案館應當開辟有效的在線服務反饋平臺,積極與利用者進行溝通,保證歷史檔案信息在發送端和接收端的一致性,明確利用者對在線歷史檔案的理解程度,并以此評價歷史檔案傳播的有效性,根據獲得的指標及時調整編碼工作和抽象工作。
3.3 基于低編碼抽象的歷史檔案數據化。對于低編碼、低抽象形式的歷史檔案而言,將其置于擴散維度進行傳播目的不直接作用于歷史檔案知識的傳播和知識形態的轉變。低編碼、低抽象歷史檔案進入擴散維旨在通過誘發社會的好奇,吸引社會層面的關注,增加社會公眾的參與感與責任感,從而協助擴大高編碼、高抽象的歷史檔案的傳播范圍,提高高編碼、高抽象的歷史檔案的傳播有效性,從側面協助歷史檔案度過數據掩埋危機。類似項目有英國檔案志愿者項目、美國公民檔案工作者項目。這些項目的共通性在于檔案館秉持共同參與、協同合作理念,利用互聯網、社交媒體的力量建立與利用者之間的新型聯系。這種模式明顯區別于傳統的檔案館工作模式,傳統模式中檔案館是檔案管理工作的執行主體,職能囊括收集到利用的全過程,利用者是檔案館工作成果的享有者,直接享受和使用經過多道工序的檔案產品。筆者認為在這種模式中,檔案館需要處理的關鍵是找準定位。
低編碼、低抽象并不意味著不對歷史檔案進行任何處理,檔案館館藏的歷史檔案在進館時應當進行的常規性的檔案管理步驟不會因為低編碼、低抽象歷史檔案的進入傳播環節而被取締。上文也說過,將未完成高精度編碼、抽象過程的歷史檔案提前投入擴散維度進行傳播的目的是吸引社會層面的關注,從側面協助擴大高編碼、高抽象的歷史檔案的傳播范圍,提高高編碼、高抽象的歷史檔案的傳播有效性。基于這樣的目的,檔案館需要做的準備工作一是應關注建設支持公民參與編碼、抽象過程的數字平臺。數字平臺可以融入現有的檔案館館方網站之中,通過開辟獨立模塊的形式呈現,也可以依托更廣泛的共享平臺,實現各館歷史檔案資源的匯聚,如谷歌藝術項目。二是尋找具有更加有效傳播效應的、適合利用者參與編碼、抽象過程的時機。特定時間和事件節點,社會對于檔案相關訊息的關注度會出現爆發式的提高,比如釣魚島爭端凸顯的時候,社會對檔案的利用需求出現顯著提高。檔案館可以分析關注度爆發的規律,在社會關注度較高的時間段推出相應主體的檔案編碼、抽象互動項目,達到傳播目的。
參考文獻:
[1]馮惠玲,張輯哲.檔案學概論[M].中國人民大學出版社,2006:16.
[2]李財富,張驍勇.新時期歷史檔案開發利用研究[J].檔案學研究,2016(1):67-71.
[3][5]楊珩,史江.知識管理背景下歷史檔案數字化策略研究——從歷史文獻學視角出發[J].檔案學通訊,2009(1):50-53.
[4]裴燕生.歷史檔案數字化管理的基礎[J].檔案學通訊, 2004(5):46-49.
[6][9][11][12][13]馬克斯·H·博伊索特,張群群等.知識資產:在信息經濟中贏得競爭優勢[M].上海人民出版社,2005:12-77.
[7]馬克斯·H·布瓦索,王寅通.信息空間[M].上海譯文出版社,2000.
[8]王海歐.明清檔案“數轉模”問題的審視與思考[J]. 中國檔案,2017(6):64-66.
[10]馬振犢.中國第二歷史檔案館館藏檔案數字化及其開放利用[J].檔案學研究,2016(5):86-89.
[14]談國新,孫傳明.信息空間理論下的非物質文化遺產數字化保護與傳播[J].西南民族大學學報(人文社科版),2013(6):179-184.
(作者單位:上海大學圖書情報檔案系 來稿日期:2018-01-19)