檔案網站信息資源組織與利用項目組
(南京大學信息管理學院,江蘇南京,210093)
隨著我國檔案網站的體系和布局日趨合理,檔案網站信息資源的種類和數量急劇增長。 然而,檔案網站建設水平不同,提供的功能和服務質量參差不齊,檔案網站的優化問題日益突出。 國家社科基金項目“ 檔案網站信息資源組織與利用” 就是涉及檔案網站優化的重要課題。 作為研究的理論基礎,首先要對檔案網站信息資源的范圍及組織的概念進行界定,確定檔案信息資源組織的對象和組織活動的內容,并以此為基礎展開研究。
檔案網站信息資源有廣義和狹義之分: 廣義的檔案網站信息資源是指檔案網站提供的所有信息,不僅包括庫藏檔案實體數字化的信息,也包括檔案網站建設方面的技術信息。 總體上可以分為基本信息、形式信息、內容信息和功能信息四種類型;狹義的檔案網站信息資源是檔案實體數字化的產物,包括館藏數字化檔案、現行文件、特色檔案及編研成果。 廣義和狹義的檔案網站信息資源的關系如圖1 所示,本課題將以狹義的檔案網站信息資源為主要研究對象。
檔案網站信息資源組織,可以定義為:根據用戶的利用需求,結合檔案網站信息資源的特點,以檔案網站的各類信息資源為對象,利用先進的技術,按照一定的原則、規范及標準,優化檔案網站信息資源的分類、 檢索和揭示,提供有序的、動態的、實用的檔案信息資源利用方式的過程。 這一概念可以分為幾個層次:
檔案網站用戶的利用需求是檔案網站信息資源整合的依據。 用戶的需求既可以是特定的、 個體的利用需求,也可以是一般性的、群體的利用需求。 由于信息資源組織的本質是要更好地滿足用戶利用需要,因此用戶需求是檔案網站信息資源組織最重要的依據。
檔案網站信息資源的四個種類(館藏數字化檔案、現行文件、特色檔案及編研成果)有很明顯的特征,針對不同的檔案網站信息資源內容,應當選擇不同的方法和原則進行組織。

圖1 廣義和狹義的檔案網站信息資源
檔案網站信息資源組織的對象分為微觀、中觀和宏觀三個層次。 其中微觀層面的對象是單個檔案網站的信息資源;中觀層面的對象是兩個或兩個以上的檔案網站之間的信息資源;宏觀層面是一定行政區域或專業范圍內檔案網站之間的信息資源。
主要指技術方面的標準和規范,即檔案網站信息資源組織原則、方法以及所涉及的技術規范、標準等。
檔案網站信息資源組織的核心是解決分類問題,在資源分類組織上,提供更加多樣、滿足用戶需要的信息資源分類方式。 在優化信息資源分類的基礎上,通過先進的標引與檢索技術,提供方便快捷的檢索服務,將結果呈現在網站前臺,提供更加符合用戶需要的信息資源,提高利用效率。 組織的內容過程呈“ H 型”(如圖2 所示)。
有序化指信息的分類聚合符合一定的邏輯規律;動態指組織工作是一個完整的可循環的過程,組織的結果不是一成不變的;實用是指組織的結果應當滿足用戶的實際需要。 組織的結果既可以是一個提供檢索利用的平臺,也可以是對原有網站資源的優化,應當根據組織層次的不同,選擇相應的呈現方式。由于網絡環境下檔案資源不再受時間和空間的限制,其分類方式也更加靈活多樣,與以往一種資源只可以分到一個類別不同,網絡資源可以根據內容劃分到不同類別中,方便從不同角度進行檢索。 例如,根據歷史研究學者對檔案網站利用的需要,將使用頻率較高的資源整理分類,為資源添加更多的著錄標引字段。
要界定檔案網站信息資源組織的概念,必須將其與其他幾個相關概念進行辨析,劃分其與類似概念之間的區別。
有學者將網絡信息資源組織定義為對網上的各種概念、數據(包括聲音、圖像、軟件等)、事實、文獻等,通過分析、標引(分類的和語詞的)、著錄(信息特征的描述)、鏈接(把相關的信息加以聯系)、排序、存儲等手段,形成一個有序的、便于用戶理解和查詢的信息系統,這個系統揭示知識的整體聯系和相關知識間的聯系[1]。 因此,網絡信息資源組織的對象是以數字化形式記錄,以多媒體形式表達,分布式存儲在網絡計算機磁介質、光介質以及各類通信介質上,并通過計算機網絡通信方式進行傳遞和再現出來的檔案信息[2]。 而本課題組研究的對象——檔案網站信息資源是狹義上理解的檔案網絡信息資源,前者是后者的主要組成部分,兩者涵蓋的信息資源類型相同、 技術上相互借鑒,但范圍不同、呈現形式不同。
具體來說,在內容類型劃分上,檔案網站信息資源與網絡檔案信息資源均可分為館藏數字化檔案、 現行文件、特色檔案、編研成果四類,兩者有一定的共同之處;從技術上講,檔案網站信息組織所運用的分類組織法、主題組織法、 元數據組織法和知識本體組織法等,都是網絡信息組織所涉及的組織方法。 而在內容范圍和呈現形式上,網絡檔案信息資源除了包括檔案網站信息資源以外,還包括各種網絡數據庫、聯機目錄、超媒體等,范圍較檔案網站信息資源更廣,呈現形式更加多樣,而檔案網站信息資源主要指以網站形式呈現的庫藏實體檔案的數字化產物。

圖2 檔案網站信息資源組織的內容過程
在國家檔案局科技項目“ 檔案網站信息資源普查與整合研究” 成果報告中,將檔案信息資源整合的概念表述為:“ 根據檔案用戶的利用需求,結合檔案網站信息資源的特點,利用先進的技術,按照一定的原則、規范及標準,實現一定范圍內的檔案網站信息資源的抓取與優化,并組織成一個集關聯性、動態性和實用性于一體的有機整體或統一的利用平臺”[3]。 而本研究在“ 檔案網站信息資源組織” 與“ 檔案網站信息資源整合” 兩者的關系問題上,項目組成員經過多次討論,得到三種層面的結果。
3.2.1 相似關系,結果不同
認為組織和整合的區別主要體現在結果上。 檔案網站信息資源組織和整合在目的、 對象和依據上都是相同的,但是組織和整合的結果略有不同。 整合后的單位一定是一個更大的整體或者系統,組織后的單位可能比整合后的單位要小,但組織比整合的程序更復雜。
3.2.2 包含關系,層次不同
這一觀點認為“ 整合” 與“ 組織”的區別不僅限于結果,二者是屬于基礎層次與高級層次的關系,而在誰包含誰這一問題上,展開了分歧。
一方面,檔案網站信息資源整合就是把內部和外部所涉及的全部資源,利用各種信息處理技術、各種手段,為用戶組織內部和外部提供服務。 這就為檔案網站信息資源組織提供了一個基礎平臺。 檔案網站信息資源組織就是在整合的基礎上再進行二次處理,進一步向用戶提供更方便快捷的服務。 因此從這個角度來說,組織包含了整合,整合為組織提供了基礎。
另一方面,整合的結果更加具有外在展示性,更偏向前臺;而檔案網站信息資源組織的結果不是直接形成檢索利用的平臺,較于整合更具有基礎性和后臺性。 從這個角度看,組織為整合提供了基礎,整合包含了組織。
3.2.3 交叉關系,側重點不同
結合上述兩種觀點,再次深化討論,項目組趨向于用交叉關系來表述“ 組織” 和“ 整合” 兩個概念之間的關系,認為兩者有交叉部分,但側重點不同。
雖然信息整合和信息組織的目的、對象、依據是相同的,且都會涉及到事物要素之間的重組,但是整合偏重于信息外在形式的展示和集成,更多時候是將分散、獨立的信息集合成一個統一的系統或平臺;而組織偏重于打破信息內在各要素之間的結構,根據不同的需求進行分類組合,使之有序化。 基于不同的側重點,兩者的結果也會有所不同,整合的結果是一個集成系統或平臺,組織的結果是經過優化的分類重組。
檔案網站信息資源顯然是以檔案網站為對象的,檔案網站的信息資源相對于其他網站信息資源而言,具有明顯的特征:首先,內容的專業性更強。 檔案網站上的大部分資源是數字化的檔案、現行文件、特色檔案和編研成果,內容相對統一,可以進行明顯的分類。 其次,主體的區域性更明顯。 目前檔案網站的建設主體基本是各級各類檔案局(館),所以檔案網站也有很明顯的區域性。 最后,用戶群體的特殊性更突出。檔案網站不同于綜合性網站,它的用戶群體以檔案工作者、檔案學者、歷史學者為主,他們對檔案網站的利用需求有很明顯的區分。
因此,在定義檔案網站信息資源組織的概念時,需要考慮到檔案網站內容特征的特殊性,避免將廣義上的信息資源組織的概念與方法直接套用在本研究中。在描述概念時,應強調以檔案網站上的各類信息資源為對象,結合檔案網站的內容特征進行分析、選擇、處理、序化。
傳統檔案整理是指按照一定的原則對檔案實體進行系統分類、 組合、排列、編號和基本編目,使之有序化的過程。 在概念上與檔案網站信息資源組織非常相似。 對兩者進行比較,將其聯系和區別表現出來,有助于理解檔案網站信息資源組織的內涵。
4.1.1 目的相同。傳統檔案整理和檔案信息資源組織的目的都是為了實現檔案資源的有序化,提高檢索效率,更好地為用戶提供利用服務。
4.1.2 過程類似。傳統檔案整理包括了分類、組合、排架的過程,檔案網站信息資源組織的本質,就是把相互獨立的、 分散的檔案網站信息資源進行分類、組合,從無序到有序的過程。
4.2.1 對象不同。檔案整理以館藏檔案實體資源為對象,包括紙質檔案、光盤檔案、聲像檔案、照片檔案等;而檔案信息資源組織以數字化的館藏信息資源為組織對象。
4.2.2 原則不同。傳統整理工作基于來源原則,根據原有的整理基礎開展工作,以保持文件之間的歷史聯系,便于保管和利用;檔案網站信息資源組織以滿足用戶的利用需求為原則,利用現代技術挖掘檔案的價值。 結合數字資源的特色,一份文件不一定只能被歸為一類,可以被劃分到不同的類別當中,不受空間的限制,因此,網站信息資源可以形成以來源、事由、年代等多種維度的資源體系。
4.2.3 范圍不同。傳統檔案整理的對象范圍一般僅包括接收進館的檔案實體資源;而檔案網站信息資源組織的范圍包括微觀、中觀、宏觀三個層面,內容更加廣泛,層次更多。
4.2.4 技術條件不同。 傳統檔案整理一般都是人工操作;檔案網站信息資源組織則更加依賴現代技術,比如數據庫技術、數據存儲和壓縮技術、數據挖掘等。
4.2.5 結果不同。傳統檔案整理的直接結果是檔案排架,形成檔案庫;檔案網站信息資源組織的結果則更加多樣化,表現在檢索的智能化、檔案利用便利化、檔案服務的豐富等等。
如果說檔案網站信息資源整合是由傳統檔案編研工作發展而來,那么檔案網站信息資源組織則是由傳統檔案整理工作發展而來。
檔案網站信息資源組織以傳統整理工作為基礎。 組織的實質是檔案整理工作,庫藏資源是檔案網站信息資源的主要來源,檔案信息資源數字化需要依靠庫藏資源數字化前的基礎工作,這當中自然包括了檔案整理工作。 然而,檔案網站信息資源組織并不是簡單的整理工作,它結合了現代技術,更加注重實現檢索效率的提高和跨空間時間的共享利用。
檔案網站信息資源組織是傳統整理工作的升華發展。 檔案網站信息資源組織技術的提高,可以為傳統的檔整理案工作提供新的方法和技術,使整理工作得到進一步的發展和完善,檔案網站信息資源組織以用戶為中心的原則,也將轉變傳統整理工作線性化流程化的工作模式,為傳統檔案工作注入新的血液。
[1]王本欣.網絡信息資源組織研究[J].圖書館學研究,2004(5):48-50。
[2]曾娜.網絡檔案信息資源組織研究[J].檔案學通訊,2010(1):45-49。
[3]吳建華、方燕平.檔案網站信息資源及其整合概念的界定——“檔案網站信息資源普查與整合研究”系列論文之一[J].檔案學通訊,2009(5):52-55。