摘 要:以中國期刊全文數據庫為檢索數據庫,從年度、期刊、作者、基金和主題等方面對我國電子文件元數據研究的論文進行文獻計量學分析,旨在反映我國電子文件元數據研究的歷程和狀況,為我國電子文件元數據研究的進一步完善和發展提供參考。
關鍵詞:電子文件;元數據;文獻計量學
“元數據”,英文名為“Metadata”,意為關于數據的數據。最早這一概念出現于計算機信息技術領域,后來,在地理學、圖書館學、情報學、信息資源管理等多個領域中得到廣泛應用。1996年第十三屆國際檔案大會中,美國著名檔案學者戴維·比爾曼最早將元數據概念引入了檔案學領域。自此,元數據研究開始在檔案學界掀起一股熱潮,尤其關于電子文件元數據的研究。本文從中國期刊全文數據庫中所收錄的有關電子文件元數據研究的論文入手,對其展開文獻計量學分析,旨在對我國當前電子文件元數據研究狀況加以歸納總結,以為我國電子文件元數據的進一步研究提供參考。
1 文獻獲取
筆者于2013年1月1日借助中國人民大學圖書館收錄的數據庫電子資源,以中國期刊全文數據庫為檢索文獻來源庫。使用高級檢索,在“篇名”檢索項中輸入檢索詞“電子文件”,并使用邏輯“且”運算符,在“篇名”檢索項中輸入檢索詞“元數據”,最終獲得有關電子文件元數據研究的論文74篇。
2 分布情況
2.1 年份分布。通過對歷年電子文件元數據研究論文數量的統計分析,可以反映出一定時期內該研究的發展軌跡,從而揭示出該研究的發展狀況和總體趨勢。
由表1可以看出,2005年,電子文件元數據研究的論文量最多,有12篇,達到了一個頂峰時期。由表1可以明顯觀察出,2005年之前,論文數量處于不斷上升趨勢,電子文件元數據的研究開始引起學者們的關注。自2005年至2009年,論文數量都處于較高水平,說明該時期電子文件元數據研究是檔案學領域的熱點,學者們的研究熱情普遍較高。2009年之后,論文數量有降有升,存在波動性,說明電子文件元數據研究在學界已經有所共識,但仍然在某些方面熱情不減,保持穩定。我國電子文件元數據研究的論文數量大體上經歷了一個起步、上升、穩定、波動的發展趨勢,折射出我國檔案學界對于電子文件元數據的研究經歷了萌芽、發展、巔峰和穩定四個階段。
2.2 期刊分布。經統計,有23種學術期刊刊載過有關電子文件元數據研究的論文,其中,檔案學專業期刊有11種,圖書情報類期刊有3種,電子政務專業期刊1種,秘書專業期刊1種,其他計算機、科技類期刊7種。可見,關于電子文件元數據的研究分布廣泛,不僅檔案學專業領域關注,圖書情報、電子政務、計算機科技等領域也極為關注。其中,載文數量最多的是《浙江檔案》,共有15篇,占總數量的24%。其次,是《檔案學研究》、《中國圖書館學報》、《檔案學通訊》和《檔案與建設》,各有8篇、7篇、7篇和6篇,分別占總數的13%、11%、11%和10%。載文量兩篇以上的期刊多是核心期刊,說明電子文件元數據研究高質量論文相對較多,研究水平較高。其中,2008年版北京大學中文核心期刊目錄中所包含的檔案學專業核心期刊多達9種,這說明,檔案學專業領域是我國電子文件元數據研究的主要陣地。
2.3 作者分布。目前為止,共有40多位學者參與電子文件元數據研究的探討中,其中有檔案學領域的知名學者,也有高校、研究所的中青年教師、學者,還有檔案實體部門的工作者。可見,電子文件元數據研究者的范圍分布十分廣泛。表3顯示,我國電子文件元數據研究發文數量最多的是南京政治學院,共發表相關論文32篇,占總量的44%,其次是中國人民大學,共發表5篇,占總數的7%。據表4可知,共有9位學者發文數量超過2篇(包括2篇),其中發文數量居于前兩名的是南京政治學院的張正強和程妍妍,分別有15篇和6篇,占總數的37%和15%。
2.4 基金分布。由表5可見,我國電子文件元數據研究的成果多是作為基金項目的成果而發表,其中,國家社會科學基金數量最多,占總數的33%,其次,還有國家自然科學基金、國家科技基礎條件平臺建設計劃、國家重點基礎研究發展計劃。這說明,我國電子文件元數據的研究有國家在政策、資金上給予保障和支持,國家重視這一領域的研究進展,電子文件元數據研究是相當有理論價值和實踐意義的。此外,除了國家社會科學基金項目占大比例,還有國家自然科學基金和科技基礎平臺建設計劃等基金項目,說明電子文件元數據的研究呈現跨領域、交融性的特點,不僅檔案學領域關注,還需要引進計算機技術、科技領域等人士積極地合作交流。
2.5 主題分布。經統計分析,我國電子文件元數據研究的主題大致分布在電子文件元數據的基礎性研究、電子文件元數據的標準化研究、電子文件元數據的應用研究、電子文件元數據研究述評和其他相關主題。電子文件元數據的基礎性研究中包含電子文件元數據的概念、功能、結構體系和對電子文件元數據的管理維護(捕獲、封裝、存儲等)。電子文件元數據的標準化研究包括電子文件元數據的標準規范、標準框架設計和語義語法標準化等研究。電子文件元數據的應用研究涉及將電子文件元數據應用到全程管理、集成管理、文檔一體化、風險防范、電子文件的歸檔鑒定著錄標引和保證電子文件的真實性等方面。
由表6可知,電子文件元數據的標準化研究論文數量最多,共有26篇,占總數的35%。其次,是電子文件元數據的基礎性研究,論文數量共21篇,占總數的28%。其中,電子文件元數據的應用研究數量較少,共有14篇,占總數的19%。關于電子文件元數據研究的述評論文數量僅有3篇,僅占總數的4%。這說明,我國對于電子文件元數據的研究集中于基礎性和標準化方面,較為重視電子文件元數據的理論探討和構建,具體實踐應用的研究還略顯不足。
3 我國電子文件元數據研究的特點
3.1 研究起步較晚,時間不長,研究有待深入。自比爾曼在第十三屆國際檔案大會上將元數據的概念引入檔案學領域,檔案學界關于元數據的研究也不過十余年的時間。我國檔案界普遍認為關于元數據的研究始于本世紀初,2001年由國家檔案局邱曉威研究員主持的“電子文件和電子檔案的真實性完整性保證及其法律地位的認定”國家社科項目的正式啟動,標志著電子文件元數據研究開始成為我國檔案及電子文件研究領域的最前沿課題。[1]就本文的文獻檢索結果來看,我國電子文件元數據的研究開始于2000年徐維在《山西檔案》雜志上發表的《元數據:電子文件管理的關鍵所在》一文,至今也不過僅僅走過了短短十二年的光陰。所以,研究的積淀還不夠深厚,某些方面的認識在學界尚未達成共識,研究體系還未構建完整,研究有待進一步深入完善。例如,關于電子文件元數據功能的認識,目前學界就存在多種觀點。徐維將元數據功能分為總體功能和局部功能。張正強則從行為、能力、功效三個方面對元數據功能深入認識和理解,提出了基于行為功能、能力功能和功效功能的元數據功能模型及聯系模型。[2]
3.2 注重理論研究,實踐應用研究有所欠缺。電子文件元數據的基礎性研究和電子文件元數據的標準化研究在目前研究總數中占有很大的比重,二者所占比例之和達到63%,已然超過一半。然而,關于電子文件元數據在實際中的應用研究所占比例僅僅只有14%。實踐是檢驗真理的唯一標準,理論要與實踐相結合,接受實踐的檢驗,運用到實踐中去,檔案學領域也不例外。電子文件元數據的研究在注重理論研究的同時,需要密切聯系實踐,接受實踐的檢驗,在電子文件管理實踐中不斷升華和完善。當前,我國電子文件元數據的研究偏重于理論研究,實踐應用型研究稍顯不足的現狀值得我們深思和反省。
3.3 國外標準經驗介紹引進多,獨創性研究較少。經觀察分析發現,我國電子文件元數據研究的成果多是介紹引進國外的經驗和標準,自己獨創性研究的內容較少。如金更達簡介了國外電子文件元數據標準。[3]劉瓊瑤介紹了國際檔案界關于電子文件元數據的研究狀況。[4]程妍妍比較研究國際電子文件元數據封裝方法VEO和METS,介紹了國際圖像電子文件元數據發展的新趨勢——NISO Z39.87技術元數據標準。[5]電子文件元數據研究的高產作者張正強從電子文件元數據的概念國際標準化、需求國際標準化、建立原則國際標準化和體系框架國際標準化等角度對國際標準ISO15489作了介紹[6],對《文件管理——第1部分:原則與方法》和《文件管理——第2部分:元數據元素與信息參考模型》的介紹[7],提出可直接將ISO23081第2部分“元數據的頂層架構”作為中國電子文件管理元數據標準設計的頂層框架。[8]
3.4 研究跨領域,呈現交融性特征。前文統計數據顯示,不僅檔案學領域關注我國電子文件元數據研究,電子政務、圖書情報和計算機技術領域人士也十分關注電子文件元數據研究。這與電子文件元數據獨特的技術性特征密不可分,檔案學專家學者立足于檔案學專業視角,將元數據引入專業領域,以實現對電子文件的有效管理,維護其真實完整可靠。同時元數據起源于計算機技術領域,與計算機科學技術緊密結合,亦為圖書情報領域所引進應用。所以,對于電子文件元數據的研究需要多領域相互交流溝通,共同推動電子文件元數據研究的不斷進步。
4 結論
綜上所述,我國電子文件元數據的研究起步較晚,時間不長;偏重于電子文件元數據的基礎性研究、標準化研究等理論研究,電子文件元數據的應用研究略顯不足;注重國際標準的介紹和引進,獨創性研究較少;研究呈現跨領域、交融性的特征。在今后的研究過程中,我國電子文件元數據的研究應該更加深入挖掘,完善電子文件元數據研究體系的建立;理論研究和實踐應用相結合,更加注重理論研究成果在實踐中的應用和發展;國際化和本土化研究接軌,在國際標準經驗的引入借鑒基礎上強調電子文件元數據的獨創性研究;研究合作化程度進一步加深,多領域相互借鑒合作,突破檔案學科邊緣化境地。
參考文獻:
[1]金更達,潘燕軍,黃文峰.元數據設計應用相關研究綜述[J].浙江檔案,2005(8):6.
[2]徐維.對元數據功能與性質的深層解析[J].蘭臺世界,2005(7):20~22.
張正強.電子文件管理元數據的功能研究[J].浙江檔案,2008(8):38~41.
[3]金更達.國外電子文件元數據標準簡介[J].浙江檔案,2004(11):8~10.
[4]劉瓊瑤.國際檔案界關于電子文件元數據之研究[J].四川檔案,2003(2):34~35.
[5]程妍妍.國際電子文件元數據封裝方法VEO和METS的比較研究[J].現代圖書情報技術,2011(10):7~11.
程妍妍.基于METS的電子文件元數據封裝研究[J].湖北檔案,2011(7):11~14.
程妍妍.國際圖像電子文件元數據發展新趨勢——NISO Z39.87技術元數據標準的分析與研究[J].浙江檔案,2009(10):37~39.
[6]張正強.論電子文件管理元數據的國際標準化[J]. 檔案學研究,2007(5):37~39.
[7]張正強.論科技電子文件管理元數據的國際標準化[J].檔案學通訊,2007(3):46~49.
[8]張正強.論電子文件管理元數據頂層框架設計的標準化[J].中國圖書館學報,2009(2):80~88.
(作者單位:中國人民大學信息資源管理學院 來稿日期:2013-01-15)