吳申艷
摘要:元數據與來源原則的變革擁有密不可分的關系。因此,進一步把握元數據與來源原則變革之間的聯系能夠對來源原則的內涵和實踐應用有更深刻的認識。本文從來源原則變革的產生、來源原則的發展、來源原則的成果三個方面探討元數據在其中的作用程度,提出元數據是來源原則變革的誘因、來源原則變革成果形成的助力者、來源原則變革成果與社會實踐的黏合劑。
關鍵詞:元數據來源原則變革
Abstract: Metadata has a close relationship with the change of the source principle. Therefore, fur? therunderstandingoftherelationshipbetween metadata and the change of the source principle can have a more profound understanding of the con? notation and practice of the source principle. This pa? per is doing research from three aspects: the princi? ple of change, the principle of development, the principle of source achievements to discuss the role of metadata in the metadata is proposed, the princi? ple of change adhesive inducement, source forma? tion, power source principle change source principle change and social practice.
Keywords: Metadata;Origin principle;Innovation
一、引言
來源原則從20世紀初起就被國際檔案界公認為檔案專業的基本原則,是當前各國公認的檔案整理理論。因此,來源原則的發展和變遷一直受到檔案學者的關注。不可否認的是,進入電子文件時代之后,來源原則出現了不適應性,傳統的“實體來源”概念受到了挑戰。為了讓來源原則在電子時代仍然具有生命力,檔案學者提出了“概念來源”,即電子時代檔案來源的概念不僅指文件的形成機關,而且還包括其形成目的、形成活動、過程、處理程序和職能范圍等。
但是“概念來源”的提出也帶來了新的難題——“概念來源”過于抽象并且難以現實操作。于是檔案學者將元數據引入了檔案領域,提出在電子文件生成、管理和利用的全過程中始終注重掌握元數據,并將其與文件的內容信息一同保留下來,從而成功地解決了“概念來源”如何施行的問題。
然而,筆者通過查閱來源原則變革的相關文獻發現檔案學者在論述來源原則的變革時,只是簡單提出元數據與來源原則的變革擁有密不可分的關系。但卻并沒有完整描述清楚元數據與這種變革到底有哪些深層次聯系,即元數據在來源原則變革的產生、來源原則的發展、來源原則變革成果及其應用等階段具體扮演著什么角色,以及在各個階段的作用程度如何。筆者認為,元數據與來源原則變革的深層次聯系的研究是非常必要的,不僅能夠促使檔案學界對來源原則變革過程和成果等方面有更深刻和清晰的認識,更能夠使檔案學者通過元數據概念更好地解釋“概念來源”的內涵以及通過元數據技術更好地推進“概念來源”的實際操作,增強來源原則在電子時代的生命力。
二、元數據是來源原則變革的誘因
(一)元數據概念在檔案領域的引用
元數據是信息技術領域的名詞,其在檔案領域的引用緣于檔案學者試圖通過元數據來解決概念來源的現實施行,檔案學界對元數據的定義有三個發展階段:元數據[1]首先由電子文件專家戴維比爾曼引進電子文件研究領域,這一階段檔案學者將元數據在信息技術領域的定義直接移植到檔案領域,即將其定義為描述數據的數據,即元數據的含義與計算機技術領域中的元數據的含義是一致的。第二階段檔案學者將其定義為著錄元數據,這一階段元數據在檔案領域有其更為專指的性質和含義,即元數據是關于單一電子文件和文件組合的背景及其相互關系的結構化著錄數據,這里的著錄元數據被檔案人員解釋為著錄信息。第三階段檔案學者將其定義為電子文件管理元數據,認為元數據是自始至終地描述文件的背景、內容、結構及其管理的數據。
從元數據定義在檔案領域的三個發展階段可以看出:一方面元數據本身與電子文件的背景、內容、結構等方面有著密不可分的關系,包括電子文件的格式、題名、關鍵詞、作者、版權信息等數據,這些涉及電子文件背景、內容、結構等信息的數據與文件的來源息息相關。另一方面,隨著元數據涵義在檔案領域的具體化和專指化,檔案學者對元數據的理解更加深刻、應用更加便利,從而滿足了來源原則需要很好地描述電子文件來源信息的要求。因此,筆者認為元數據在檔案領域的引用很好地促進了“實體來源”向“概念來源”的變革。
(二)元數據以電子文件為橋梁影響來源原則
電子文件時代,文件的來源聯系更為復雜,無法像紙質文件一樣具體到某一實實在在的機構、組織或個人。[2]大量的文件管理系統、各種各樣的文件載體以及多元的文件形成活動存在于眾多辦公點,分散在不同的地理空間,也跨越不同的時間、不再對應內部的基層組織機構。計算機和電信革命急劇加速了這種分散化和分離化,業務職能現已跨越所有形態的結構或組織界限。因此,來源原則在電子時代發生變革成為必然,從而有了“概念來源”的出現,既能使電子文件整理適合來源原則的“來源同一性”內涵,又能解決電子文件來源分散的矛盾。
但筆者認為,電子文件的出現雖然是來源原則變革的最顯而易見的緣由,但究其根本還是元數據在起決定性作用。相對于紙質文件,電子文件的形成與計算機密切相關,因此形成了數量龐大、內容復雜依賴機讀的元數據記錄。通過這些元數據記錄我們并不能輕易地識別出不同電子文件的傳統意義上的“來源”聯系,從而對傳統意義上的“實體來源”造成了沖擊。因此,正因為電子文件比紙質文件擁有復雜的背景、內容、結構及管理要求,“實體來源”才會顯得不適用,所以作為描述電子文件背景、內容、結構、管理要求等內容的元數據才是來源原則出現變革的真正誘因,是來源原則變革的本質所在。endprint
三、元數據是來源原則變革成果形成的助力者
(一)實體來源向概念來源的轉變需要利用元數據進行解釋
來源原則變革的一個顯著成果就是“實體來源”向“概念來源”的轉變?!案拍顏碓础笔菍Α皩嶓w來源”的繼承和發展。在保持“來源同一性”內涵的前提下將“來源”的定義進行新的闡釋以適應電子文件整理的需要。[3]馮惠玲教授認為“這個來源就是指文件的形成過程及背景,即文件是由誰,在什么條件下,運用哪些數據,為了什么目的,采用了何種結構形式的等方面的情況”。通過馮惠玲教授對“概念來源”的論述可以發現[4]“概念來源”的實際操作需要檔案工作者獲取與電子文件生成、保管、利用相關的各種數據,這也就是所謂的元數據。沒有元數據的出現,檔案工作者無法細節性地描述電子文件的來源信息,所以,元數據的出現為我們解釋何謂“概念來源”提供了便利,成功地使“概念來源”更加具體化。
(二)“概念來源”的應用對元數據的依賴性
1.元數據貫穿于電子文件全程管理的各個階段。電子文件的全程管理思想就是指,對電子文件從產生到永久保存或銷毀的整個生命周期進行全程管理。[5]從縱向來看,電子文件的整個生命周期可以劃分為電子文件管理的系統設計、電子文件形成、電子文件運行、電子文件維護四個階段。在電子文件管理系統設計階段需要設計出元數據模型,從而對系統捕捉哪些方面的文件信息做出規定。在電子文件形成階段和電子文件運行階段,文件的產生以及流轉會按照事先規定好的元數據模型產生一個與之相對應的不斷補充的元數據表,通過該元數據表可以對解讀該文件的內容、背景、結構信息、操作過程等。電子文件的維護階段是指對電子文件的原始記錄性進行維護,而元數據則是必不可少的依據,離開了元數據,電子文件的原始記錄性無法得到保障。因此,我們可以發現從電子文件管理的系統設計到電子文件的最終維護都少不了元數據的參與,它貫穿于電子文件全程管理的各個階段。
2.元數據技術能夠實現電子文件的全程管理。電子文件時代,適用于紙質文件全程管理的方法和手段已經無法有效解決電子文件這四個階段的全程管理,因此我們需要尋求創新和突破。基于元數據在電子文件全程管理中扮演著至關重要的角色,所以能夠實現電子文件全程管理的突破點就在于元數據技術的應用。
之所以說元數據技術是電子文件全程管理中的關鍵,是因為它能夠動態功能與靜態功能相結合全面監管電子文件的形成過程。[6]靜態功能是指元數據的靜態映射。元數據中的數據記錄與電子文件中的信息內容、背景、結構信息構成了一一對應的映射關系,因此,元數據就可以完整地記錄電子文件的原始狀態和生成環境。元數據的動態功能是指它可以動態地獲取電子文件管理的各項信息。[7]國際《都柏林核心研究項目》將元數據的研究作為解決網絡環境查找信息的重點,根據著錄信息的類型和范圍,將元數據分為三部分:與文件內容有關的數據、對文件負有責任有關的數據以及對文件說明的有關數據。通過這樣科學的分類,可以達到對電子文件全方位的描述和著錄,從而動態地獲取電子文件管理的各項信息。因此,沒有元數據技術在電子文件全程管理中的應用,來源原則變革成果的應用也就成為了紙上談兵。不可否認,不具有任何可操作性的理論成果注定會被世界淘汰。所以,筆者認為,將元數據和元數據技術稱為來源原則成果形成的有力助手完全不為過。
四、元數據是來源原則變革成果與檔案工作實踐的黏合劑
(一)增強了來源原則在電子文件時代的生命力
電子文件時代,一方面我們無法依據“傳統來源”原則去掌握電子文件的來源聯系,[8]另一方面“概念來源”雖然能通過重新定義來源解決“傳統來源”概念無法解決的矛盾,但其內涵又過于抽象和難以把握,電子文件之間的聯系更多是計算機之間的邏輯鏈接,因此“概念來源”在實際中的具體操作成為了難題。
而元數據的出現正好解決了這個難題。檔案界通過不斷努力推進檔案資料元數據的建設來獲取電子文件生成、保管、利用相關的數據。[9]例如,以權利元數據、重要屬性元數據、特殊類型數字資源等為代表的元數據元素的不斷擴展,為更全面地描述電子文件的來源及不同文件之間的聯系帶來了便利。再例如,元數據語義技術的發展能促進電子文件內容信息的識別、語法的匹配等等,幫助元數據更好地識別出不同電子文件的來源信息。
總之,元數據建設的不斷進步,包括元數據標準的規范化、元數據元素的不斷充實、元數據技術的不斷進步等等都間接地為增強來源原則在電子文件時代的生命力作出了貢獻。“概念來源”以元數據為媒介在堅持并發揚光大來源原則基本精神的同時更加靈活、巧妙地解釋來源概念。一方面能夠推動來源原則的理論發展,讓來源原則的內涵能夠被人們所理解和把握。另一方面在社會實踐中,也使來源原則獲得了更廣泛的適用范圍和更廣闊的理論指導空間,很好地適應了電子文件的新特點,使來源原則在實踐中的操作性更強。
(二)拓寬了來源原則在檔案工作各個環節的適用性
傳統來源概念主要適用于檔案整理環節,檔案工作者以文件的“來源”來對文件進行分類和組合。[10]而元數據支撐下的“概念來源”則不僅僅適用于檔案整理環節,還擴充到鑒定、檢索、利用等環節,甚至在這些環節的重要性已經超越了檔案整理環節。
之所以來源原則在除檔案整理環節之外的其它環節也能有所適用,是因為為了完整描述電子文件之間的虛擬化來源聯系,伴隨著文件整個生命周期的元數據都會被保存,而這些元數據正是使得來源原則在檔案工作的其他環節也發揮重要作用的關鍵所在。例如,與文件相關的描述型元數據集,如目錄記錄、專門索引、用戶注解等元數據集就可以在檔案檢索環節發揮重要作用。檔案界可以通過大量的描述型元數據集在檔案管理系統中實現來源檢索,缺乏了元數據,電子文件之間復雜的虛擬化聯系無法被描述,來源檢索也就沒法實現。除了檔案檢索環節,魏雁飛學者認為現代職能鑒定理論要求將鑒定的著眼點放在文件形成者的職能、任務和活動上,也就是把鑒定視角“置于一種以文件前后關系為基礎,以來源為中心的框架之中,而不是置于以內容為基礎的歷史文獻框架之中”,由上至下地判斷檔案的價值的這種思想實際是來源原則在檔案鑒定領域的應用。[11]在檔案利用環節,以檔案元數據核心集,即對檔案自身形成過程中“歷史聯系”信息的完整描述信息為依托,建立基于來源的用戶個性化服務。檔案元數據核心集便于檔案資源組織、便于檔案資源身份驗證,能夠將檢索到的同一來源文件與目標用戶自身屬性相結合,從而滿足檔案用戶個性化需求。
五、結語
元數據作為伴隨文件整個生命周期的數據信息,是對文件形成過程的完整描述。在電子文件時代,它極大地方便了檔案工作者對文件,特別是電子文件來源聯系的把握。在來源原則到新來源觀的整個創變過程中發揮著不可替代的作用。它是來源原則變革的誘因、是來源原則變革成果形成的助力者、也是來源原則變革成果與社會實踐的黏合劑。自元數據引入檔案領域以來,檔案學者一直在積極探索檔案領域的元數據建設與發展,形成了眾多技術成果和理論成果,這些理論和成果為更好地解釋和在實踐中應用來源原則發揮了極大地作用。沒有了元數據,來源原則的變革也就缺乏了動力,因此未來筆者也希望元數據能夠在檔案領域發揮著更為寶貴的作用,能夠推動檔案學走向更高的巔峰,成為檔案學科與其他學科融會貫通的典范。
注釋及參考文獻:
[1]于斌,周晶.淺析元數據概念在檔案領域中的發展[J].機電兵船檔案,2015(1):45-47.
[2]何嘉蓀,樓淑君.后保管時代基礎理論研究之三——新來源觀解析[J].浙江檔案,2013(3):9-14.
[3]于斌,周晶.淺析元數據概念在檔案領域中的發展[J].機電兵船檔案,2015(1):45-47
[4]特里·庫克,李音.對數字時代來源原則的反思[J].檔案學研究,2011(1):82-85.
[5]葉曉林.電子文件全程管理之思考[J].檔案學研究,2005(1):46-50.
[6]黃萃.基于元數據的電子文件全程管理[J].檔案管理,2003(4):16-18.
[7]徐維.元數據:電子文件管理的關鍵所在[J].山西檔案,2000(4):11-14.
[8]祭鴻雁.“新來源觀”:實質與意義探析[J].檔案學通訊,2003(1):21-25.
[9]劉建華,張智雄.保存元數據的發展趨勢研究[J].圖書館雜志,2016(6):10-16.
[10]魏雁飛.來源原則在電子信息化時代的傳承與創變[C]//2008年檔案工作者年會.2008.
[11]田偉,韓海濤.發揮檔案元數據核心集作用推進“互聯網+檔案”建設[J].檔案,2016(6):5-9.endprint