王大青
摘? 要:從計算機輔助檔案管理開始,就出現了取消立卷的聲音。然而,從檔案整理理論和實踐發展情況看,立卷以其獨特的優勢,依然占據著主流地位。在電子文件時代,案卷應被賦予新的生命和意義。文章從電子案卷的概念出發,分析了電子文件立卷的需求、立卷的原則、立卷的標準和程序,是對電子文件整理工作理論和實踐的再認識,對電子文件的科學管理具有一定借鑒意義。
關鍵詞:電子文件;立卷;電子案卷
Abstract: There has been a point of view of abolishing archival file, from the beginning of managing archives with the computer assistant. However, archival file still takes up dominating status in the practice and theory research because of its advantages. In the era of electronic records, the archival file should be endowed with new senses. This paper sets out from the concept of electronic volume. Then, it analyzes the requirements, principles, standards and processes of composing archival file for electronic records. It is the theoretic and practical cognizance for the electronic records organization under the new circumstance. It will be useful for the scientific management of electronic records.
Key Words: Electronic Records; Composing Archival File; Electronic Volume
案卷是文件保管的基本單位,立卷是紙質文件管理的重要環節,也是文件成為檔案的一個重要標志。立卷是實踐“遵循文件形成規律,保持文件之間的聯系,便于保管和利用”這一檔案整理原則的組織形式和具體措施[1]。伴隨著計算機輔助立卷的發展,出現了弱化甚至取消立卷的聲音。例如,有的單位或行業系統依據文件形成時間直接放盒歸檔;國家行業標準DA/T22-2000《歸檔文件整理規則》,也沒有明確提及立卷這一工作環節。在2015年發布的修訂版中,提出了立卷整理與以件為單位整理的并行做法。但是,從世界范圍來看,在檔案管理實踐和理論研究主流中,基本沿襲和強調了紙質檔案文件的立卷工作,認為“案卷作為檔案的典型微觀存在形態,具有不容置疑的理論依據和不可或缺的實踐意義”[2]。所謂取消或弱化立卷,其否定的并非案卷形態本身,而是要簡化檔案整理工作[3]。那么,從保管和利用角度看,電子案卷存在的意義究竟有多大?繼續保持還是取消立卷?電子案卷的形態是什么?如何科學地立卷?經過這些年的電子文件管理實踐,尤其是機器深度學習、人工智能大力發展的當下,十分有必要對電子文件立卷工作進行理論梳理和總結、創新。
“案卷是由互有聯系的若干文件組合而成的檔案保管單位?!盵4]電子案卷究竟是物理概念還是邏輯概念?對于這一問題,不必拘泥于紙質文件管理模式的機械對照,“在電子文件時代,不僅全宗形態將出現異化,案卷也將繼續存在并率先出現異化”[5],即應該在電子文件物理歸檔和邏輯歸檔的具體實踐中對電子案卷概念作出創新發展,針對電子文件管理需求,將其作為一個管理和利用單元來看待,可以是物理的,也可以是邏輯的形態。
由此,可將電子案卷定義為:在檔案全宗類目之內,為便于文件保管和利用而設置的電子文件集合。電子案卷是具有密切關聯的若干文件的組合體,是“檔案的保管單位,通常也是統計檔案數量和進行檢索的基本單位之一”[6]。
顯然,在電子文件管理中,從物理視角看,案卷存在形態發生了變化,不再是觸手可及的卷、冊、盒,而對應的是存儲介質(當前主要是光學或磁性存儲介質)中的某一區間,這一區間可以是物理上連續的,也可以是間斷的、由計算機操作系統或應用系統整合起來的“連續”空間。當前,其表現形式主要為文件夾;從邏輯視角看,電子案卷表現為一組標識,即通過分類標引、用一組相同標識將具有共同來源、關聯性較強的電子文件集中起來,組成邏輯案卷。電子案卷邏輯形態與物理形態可以是一致的,即同一案卷的電子文件存儲于同一存儲介質的同一文件夾之下;在某些情形下,電子案卷邏輯形態與物理形態是不一致的,電子文件組成“虛擬案卷”,而這些文件實體可暫時分布于不同的存儲介質乃至不同系統、不同地域,在云計算平臺上的表現尤為突出。
有人認為,“電子文件可取消立卷,因為計算機可以將電子文件任意組合成各種‘案卷”。實際上,當前的主流檔案信息管理系統是按照給定的檢索式進行匹配查詢的,機器不能準確理解檢索詞以及數據庫中檔案信息的語義,在小數據量時檢索結果的分類積聚是可以保證準確率的,而在大數據量時,往往會出現同一歷史活動中形成的、聯系緊密的文件分散排列乃至不能被同一個檢索式全部查詢到的現象。在這種情形下,設定電子案卷,不僅可以確保反映歷史面貌的全面性,還可以方便保管利用。
1.1 保持電子文件之間歷史聯系的需求。不可否認,在電子文件時代,更加依賴背景信息來保障電子文件的真實性、完整性和可用性,而案卷實際上就是提供檔案背景信息的一種形態。同一活動中所產生的電子文件,相互之間具有自然的歷史聯系。某一事件,某一會議,某一項目,某一案件等,這些主題活動所產生的文件,如若分散保管、不設置統一的邏輯標識符,則會弱化其應有聯系,對于不熟悉該活動的人來說,就會從一定程度上影響歷史面貌再現的全面性和準確性。
目前,通過檢索式查詢所得到的結果展現的是文件之間的人工聯系,而非文件形成之時的自然聯系,這兩種聯系并非完全對等,因為人工聯系是通過關鍵詞的匹配檢索展現的。許多文件之間存在的是隱性聯系,即文中關鍵詞、主題詞等并不能直接反映文件之間的密切相關性,再加上文件標引和著錄的主觀性、不規范性、計算機對自然語義理解的機械性,容易出現文件之間自然聯系反映不全面、不準確的現象,從而導致社會活動、歷史面貌呈現障礙。如何保持這種自然聯系呢?“立卷就是使文件之間的歷史聯系在微觀層次上得到保持的有效手段?!盵7]對于不同類型、不同記錄方式的電子文件,電子案卷更具生命力。例如,關于某一案件或建設項目的文字、照片、聲音和視頻,克服了物理形態的差異性,可以集合于同一案卷之下,實現信息和實體的統一組合,更為高效、系統而完整地展現其歷史聯系。
1.2 科學保管電子文件邏輯與物理形態的需求。與紙質文件相比,電子文件分卷管理的成本大大降低,省去了卷盒印制、填寫和文件裝訂裝盒等程序,不再輕易受案卷容量約束而強制分開關聯性較強的文件;由軟件系統進行統一立卷,克服了“因人而異”的分類“任意性”。同時,其分卷的優勢卻有所增加。電子案卷是電子文件保管物理和邏輯結構體系的重要構件,是實體分類的基本單位,是信息分類的基礎,可以恰如其分地“劃分”電子文件物理存放空間和控制信息集聚數量。
傳統文書檔案是以“全宗-類別-案卷-文件”的層級結構進行保管的。在檔案管理實踐中,全宗內部一般以年度作為分類的一級類目,如果從年度直接跨度到單份電子文件,文件較多時則會顯得雜亂無序,不便于人工干預和異常情形下的電子文件管理,這與大數據環境下電子文件管理實踐以及檔案管理理念是不相適應的。在年度類目之下設置電子案卷,則增加了電子文件實體與信息管理的可控性,具有信息量和專指性適度的優勢,便于人工識讀、信息存取和數據遷移,便于新發現或捕獲電子文件的增量管理,從總體上提升電子文件管理效益。比如,在一項職能活動中,不僅僅會產生文字圖表類文件,還可能會形成數碼照片等電子政務平臺外文件,此時就需要人工干預以建立對應關系,采取立卷模式后,則可方便地實現相關文件的集聚和關聯。
1.3 高效開發檔案資源的利用需求。通常,用戶不具備檔案所反映職能活動的完整知識,尤其是歷史久遠的活動,在數據量大、沒有檔案專業人員指導和檔案信息共享的情境下,很容易造成文件漏檢和誤檢等現象的發生。在檢索結果的排序上,沒有立卷卻聯系緊密的電子文件很可能會被其他無關卻符合檢索式匹配要求的檔案文件分隔開,極大地影響檢索方便性和查詢效率。將具有歷史聯系的文件放置在同一案卷,便于用戶檢索和發現目標電子文件,全面了解相關職能活動或事件的來龍去脈,衡量一份文件在工作查考、科研、編史修志和文化服務等方面的綜合價值。同時,在案卷題名、主題詞等著錄完整的前提下,還增加了檢索層次,為族性檢索提供方便,有利于用戶從案卷中發現相關文件的檢索信息,從而充實、豐富特定主題的內容信息。在大數據環境下,電子文件的立卷,也為數據自動分析和數據挖掘提供了分類和積聚的可靠途徑,奠定了數據智能化處理基礎。
此外,在“雙套制”保管時代,“要建立電子文件之間的關聯和它們與本單位產生的非電子文件之間的聯系,就必須對電子文件進行立卷”[8],以此高效地維持電子文件與紙質文件之間的對應關系,還有利于簡化紙質文件的整理。
綜上所述,在“人工智能”迅猛發展的時期,計算機在數據感知、語音和圖像識別、數據分析以及知識挖掘等方面,都取得了很大進展,但是,這其中的許多成果是建立在統計學基礎之上的,而對自然語言語義的綜合理解、判斷與處置依然是計算機面臨的挑戰,計算機在實現電子文件任意標準的自動分類組合、語義檢索等方面依然存在著差距,而這正是電子文件智能化管理和利用所需要的,即電子文件的管理和利用還脫離不了人工干預,在今后較長一段時間內尚不能達到“隨意”組合、完全智能化管理的理想狀態。也就是說,電子文件立卷依然有其自身與環境的強烈需求。
2.1 保持電子文件之間歷史聯系的原則。文件之間的歷史聯系包括背景聯系和內容聯系。背景聯系包括文件形成者、職能活動、形成時間和形式聯系等;內容聯系一般指文件主題、事由之間的聯系。這個原則要求:將形成時具有天然聯系的電子文件組成一個案卷??紤]到現代社會分工協作日益緊密的現實,不能將這個原則簡單地理解為“來源于共同的組織機構、部門或個人的電子文件”,不能囿于立檔單位之限而分割聯系緊密的電子文件,應將電子文件產生的源泉——社會職能活動作為立卷的核心原則。正如特里·庫克指出的那樣“電子時代,檔案來源概念需要重新定義,它不能僅僅局限于文件的形成機關,還應包含形成目標、形成活動和職能范圍等”[9],要從電子文件形成者和職能活動兩個視角考察電子文件之間的有機聯系,選擇適宜于計算機智能操作并能夠最大限度地維護歷史聯系的模式立卷。
保持電子文件之間歷史聯系,實際上也是電子文件高效保管和利用的重要基礎。
2.2 有利于電子文件保管和利用的原則。電子文件立卷的原則,其中很重要的一點就是將電子文件前端控制和全程管理思想貫穿其中。當前,在電子文件接收、檢查、遷移、維護、鑒定和管理等諸多環節中,需要適度的人工干預。因此,電子文件立卷時,不僅要考慮計算機自動管理的效益,還要考慮到人工干預的方便性、效率。一個電子案卷之下,文件數量應保持適宜。如若文件太多,則會影響數據遷移、再鑒定、檢查和維護效率。在移交電子文件,尤其是離線存儲時,應注意保持電子案卷邏輯與物理形態的一致性,即將同一案卷電子文件置于同一文件夾中?!半p套制”情形下,保持與紙質文件案卷的對應關系,即互相備注定位標識符。
從利用視角看,主要表現在電子文件檢索效率的控制上,考慮不同層次、不同類型用戶的需求,便于用戶使用最簡檢索式,準確、完整地查詢到所需的全部電子文件,這實際上也是從另一個角度對保持電子文件之間歷史聯系所提出的要求。同一職能活動中所產生的有保存價值文件,在從寬原則之下可以繼續區分保管期限,雖然這種做法可能會在短期內影響電子文件的利用效率,但相比而言,不同保管期限電子文件合庫后,其對檢索效率的影響,遠遠沒有電子文件永久保存效益重要。
無論是紙質文件還是電子文件的立卷,其實質就是依據一定標準劃分文件、組合成單元。電子文件的立卷,主要是依據電子文件的內容和背景特征上的某一或某幾個共同點開展的,將聯系緊密的電子文件組合在一起,形成電子案卷。
3.1 職能活動標準。電子文件立卷的核心標準就是共同的職能活動。在立檔單位之內,相對于各級組織機構或部門來說,職能更具穩定性;對于跨部門、跨立檔單位的協作,以職能活動為立卷標準更具優勢。對于電子文件管理系統或具備電子文件管理功能的業務系統來說,這個標準具有較好的自動操作性。同時,根據職能活動立卷,可將檔案管理的“專家思想”、法規標準集成至電子文件管理系統或業務系統,由機關業務部門工作人員根據自身所熟悉的職能活動進行簡單選擇操作,繼而實現電子文件自動捕獲、立卷。通常,一個年度或一個階段(可以跨年度)內,一項相對獨立的職能活動所形成的一組電子文件,即可組成一個電子案卷。
3.2 文件形成者標準。對于文件形成者來說,現有的著錄標準和檢索系統,可以高效、準確地實現具有共同責任者的電子文件聚合。因而,一般不將文件形成者作為電子文件的獨立立卷標準。當然,文件形成者亦可作為電子文件立卷的輔助標準使用。
3.3 其他標準。從文件形成時間角度看,電子文件通常是在年度類目之下實施立卷。對于跨年度的大型活動或項目,不應拘泥于時間的限制,可依據職能活動標準靈活立卷。在一個電子案卷內,時間可作為文件排序標準。
從存儲介質容量角度看,在當前的管理規定中,要求用離線載體檔案級光盤保存,并存儲3份以上[10]。對于文字圖表檔案來說,當前光盤的容量通常不會影響到電子案卷的劃分,而對于視頻、多媒體等檔案來說,光盤容量可以成為電子案卷劃分的輔助考量因素。
正如電子文件元數據通常由計算機應用系統捕獲和生成一樣,電子案卷也應由計算機應用系統自動、實時組建,以適應電子文件前端控制需求。對于文書部門來說,電子文件形成之初,根據一定規則,進行檔號標引即為邏輯立卷;電子文件實施在線移交、脫機保存或移交檔案館時,需要歸入存儲介質的相應文件夾,即為物理立卷。無論是邏輯立卷還是物理立卷,均是在制定電子文件分類方案的基礎上,按照對電子文件實施初步鑒定和自動處置、建立電子案卷、文件歸卷、審查電子案卷等程序開展的。
4.1制定電子文件分類方案。在對業務職能活動分析和分類的基礎上,分析歷年文件產生情況,并對電子文件發展趨勢進行預測,制定電子文件分類方案。對于文件較多的類目,可以根據“職能-活動-事務”的層級結構,細分至適宜程度,統一設置簡潔、可讀性好的類目標識。而后,用本體語言(OWL)或資源描述框架RDF描述電子文件分類方案,將電子文件分類方案植入電子文件管理系統,由電子文件管理系統進行應用。
4.2 電子案卷的建立與文件歸卷。電子案卷的設置與分類方案相互對應,通常在文件分類方案的最低層級設置案卷[11]。
根據職能活動實際情況,由業務工作人員根據其崗位職能進行控制選擇[12],在電子文件形成之時,電子文件管理系統根據電子文件分類方案所確定的歸檔范圍實施文件和元數據捕獲,按照保管期限表進行初步鑒定和處置,并根據需要持續地捕獲或生成元數據。捕獲文件后,軟件系統適時創建相應文件夾,文件夾以類目標識符即案卷檔號命名,自動將形成的電子文件(含元數據)歸至對應位置。亦可根據電子文件分類方案,按照“全宗-類別-職能-活動-事務”的層級,人工建立樹形結構的文件夾,將電子文件及其元數據歸入相應類目。在電子案卷內,要確保每一份文件被賦予唯一標識符即檔號,簡化卷內文件的排序,將以往的排序標準“事由結合時間、重要程度”變為“職能活動結合時間”。由計算機對電子文件實施智能化的前端管控后,可將節約出來的人力用于后期的深度標引著錄。
案卷題名可以視情由系統根據立檔單位名稱、類目(如年度)和職能活動名稱等要素自動生成。卷內文件目錄和卷內文件備考表,可以由機器根據預先定義的結構自動呈現,并建立卷內文件目錄與文件之間的超鏈接關系。
4.3 電子案卷的審查。電子案卷自動組建后,為確保立卷和鑒定的準確性,根據條件的動態變化和電子文件保管期限規定,需要對電子案卷實施審查。一是對捕獲的電子文件和納入銷毀范圍的電子文件進行處置操作確認、審計,查看有無處置不當的電子文件;二是針對特定時間或事件等觸發條件,查看電子文件保管期限有無變化,并進行相應處置。
[1]劉國能.卷論——卷、立卷、文書處理部門立卷[J].檔案學研究,2010(4):9-12.
[2]伍振華,關小川,郭鵬.案卷是檔案的典型微觀存在形態——檔案整理理論框架重構初探[J].檔案學通訊,2007(6):25-31.
[3]沈蕾,果有森.論歸檔文件整理工作的簡化[J].檔案學通訊, 2016(6):39-42.
[4]國家質量監督局,國家標準化管理委員會. GB/T 9705-2008《文書檔案案卷格式》[S].2008.
[5]何嘉蓀,楸峰.保存電子文件背景信息的重要手段——再論全宗、案卷形態的異化[J].檔案學通訊, 2001(5):43-47.
[6]陳兆祦,和寶榮.檔案管理學基礎[M].北京:中國人民大學出版社,1986:133.
[7]崔杰.電子文件立卷研究[J].檔案與建設, 2005(6):9-10.
[8]黃世喆,奚春玲.論電子文件立卷的必要性[J].檔案管理, 2000(5):17-18.
[9]特里·庫克.1898年荷蘭手冊出版以來檔案理論與實踐的相互影響[A].國家檔案局,中央檔案館.第十三屆國際檔案大會文件報告集[C].北京:中國檔案出版社,1997,143-176.
[10]國家檔案局. DA/T 38-2008電子文件歸檔光盤技術要求和應用規范[S]. 2008.
[11]國家質量監督檢驗檢疫總局,國家標準化管理委員會. GB/T29194-2012電子文件管理系統通用功能要求[S]. 2012.
[12]何嘉蓀.論來源原則在辦公自動化系統中的應用[J].浙江大學學報, 2002(5):110-116.