李飛



摘 要:本文運用情報學中計量學的研究方法,使用文獻題錄信息統計分析工具(Statistical Analysis Toolkit for Informetrics, SATI)最新4.0網絡版,對《中國檔案》近20年刊載文獻進行可視化分析,以期探討我國檔案管理行政部門工作人員的研究熱點和方向,為今后其進一步研究提供參考和借鑒。
關鍵詞:檔案;行政管理部門;可視化;SATI
檔案是“真金白銀”, 檔案事業是關乎千秋的偉業。檔案行政管理部門是具有政府行政管理職能的檔案事業管理機構,主管全國及各級行政區域內的檔案事業,并對本行政區域內機關、團體、企業事業單位和其他組織的檔案工作實行監督和指導。其工作人員主要從事機關檔案的管理工作,加之其日積月累的實踐,會形成一批專業知識精通、實踐經驗豐富的研究學者,本文通過文獻計量學的方法,探討其研究熱點和主要學者所作的貢獻,為檔案行政管理部門研究學者的進一步研究提供參考。
一、數據選取與研究方法
1.數據來源
《中國檔案》自1951年創刊,前身為《材料工作通訊》,到上世紀80年代,隨著我國檔案學研究的全面繁榮,檔案期刊在這一時期也如雨后春筍般集中涌現。《中國檔案》雜志(月刊)系國家檔案局主辦的業務指導類期刊,是檔案界創刊最早的刊物,其發文作者主要來自檔案行政管理部門研究學者,研究的內容主要與行政管理部門檔案工作密切相關,因此以《中國檔案》刊載文獻作為數據基礎,對于我國檔案行政管理部門檔案研究現狀進行分析,具有可行性和可操作性。
本文以《中國檔案》近20年刊載文獻為研究對象,通過中國知網(CNKI)選取數據源,時間設定為“2000年1月1日至2020年1月1日”,文獻來源設定為《中國檔案》精確匹配,檢索去重后共5589篇,選擇EndNote格式,導出題錄信息。
2.分析工具
本文采用文獻題錄信息統計分析工具(Statistical Analysis Toolkit for Informetrics, SATI),結合文獻計量學、科學計量學等方法,來處理分析所搜集到的數據。SATI作者劉啟元,最初設計并發表于2012年,旨在通過對期刊全文數據庫題錄信息的處理,利用一般計量分析、共現分析、聚類分析、多維尺度分析、社會網絡分析等數據分析方法,挖掘和呈現出美妙的可視化數據結果。如今一個新的Web版SATI 4.0被作者設計開發,放于網絡共研究學者免費使用,它不僅保有舊版SATI的全部功能,還將跨平臺使用,支持幾乎所有操作系統和瀏覽器;異步處理數據,讓服務器資源分配得到優化,可處理極大數據量,軟件界面清晰,操作簡單,利用云服務無需安裝任何編程方面的專業工具就可以輕松使用。
二、關鍵詞分析
關鍵詞是反映論文主題概念的詞或詞組,由論文作者根據論文研究主題以及運用的核心方法自行標引。如果在多篇文章當中,同一關鍵詞出現多次,在一定程度上說明此主題是本學科領域的研究熱點。關鍵詞共現分析指的是,兩個或者多個關鍵詞,同時在一篇文章中出現,出現的頻率越高,說明兩個關鍵詞之間的聯系越密切,主題概念之間的關聯性越高。
表1為《中國檔案》近20年刊載文獻統計出現頻次超過100以上的關鍵詞,共計29個。由表1可以看出,排除出現頻次最高的檔案一詞,排名前三位的關鍵詞為“檔案局”“國家檔案局”“檔案館”,說明來自《中國檔案》的作者主要研究對象以檔案行政管理部門為主,因此以《中國檔案》期刊刊載文獻為研究對象,對檔案行政管理部門研究學者的檔案研究工作開展研究是十分有針對性的。值得注意的是排在第3位的“國家檔案局”一詞,其發文作者基本都來自國家檔案局,作為國家檔案局主辦的刊物,其研究學者在研究發文上十分積極且具有一定的優勢和權威。
由表1可以看出檔案行政管理部門研究學者關注重點為檔案局(館)、檔案工作、檔案管理等主題,主要涉及機構自身建設和與其主營業務范圍有關的主題為對象,側重于實踐性研究。還可以看出近年來,對于各級檔案局(館)建立綜合檔案館、數字檔案館,如何實現紙質檔案的數字化、檔案信息化建設等也是研究的熱點之一。同時結合圖1,關鍵詞共現網絡圖譜可以看出,高頻關鍵詞節點相互之間緊密的連接在一起,兩兩之間都有線連接,說明這些高頻關鍵詞兩兩都曾出現過且頻率相當,沒有形成明顯的不同聚類,說明檔案行政管理部門研究學者研究熱點集中,研究方向較為一致。
三、高產作者及其合作網絡分析
對檢索到的5589篇文獻進行統計,作者總數6723位,獨立作者數3655位,平均每篇文章1.2位作者,表2列出發文量前10位高產作者及其發文量。來自中國檔案雜志社劉守華發文超過100篇,占比超過總量的1%。其研究方向主要為中國近現代史、考古和人物傳記。
利用SATI4.0網絡版,運行得到作者合作網,除去噪點(獨立作者)后,得到如圖4所示高頻作者合作圖譜,圖中用不同顏色區分了作者間的合作關系,聚合形成了7類,如表3。可以看出每一類別都只有2~3名作者,且產生合作關系的作者只占作者總數的0.25%。結合表2發現,前10位的高產作者中有6位屬于高頻合作作者,占比60%。
綜上所述,高產作者即為高頻合作作者,也說明高產作者在學術研究、學術交流上擁有較大權威、掌握更多學術資源,對檔案的發展有一定的推動作用,形成了作者核心區。但從整體上看作者間合作網,合作作者占總體人數小,網絡密度低,說明作者之間的交流合作較少,獨立發文為主要形式,這樣既不利于知識的傳播,也不利于檔案工作的發展與創新。
四、高產機構及其共現分析
對于發表于《中國檔案》的相關研究機構的分布情況進行統計,其中發文量前20名的高產研究機構及其發文量和占比如表4所示。其中,發文在50篇以上的前8個高產機構,均集中在北京和上海,形成了研究機構核心區,也體現了我國檔案機關管理部門檔案研究能力從中央到地方,從經濟相對發達地區向相對落后地區層級遞減趨勢。
利用SATI4.0網絡版,導入檢索出的題錄信息,生成作者機構合作網絡,如圖5。從作者機構合作網絡圖譜中顯示,有合作關系的機構聚合為三類,通過文獻分析,匯總各省檔案局(館)的資訊等信息類文章不算做作者間合作關系,從而修正合作作者機構圖,國家檔案局則占據了核心,其作為高頻合作機構,其中國家檔案局技術部主任、評議委員會副主任委員黃麗華與浙江省檔案局、中國人民大學信息資源管理學院、國家博物館等機構作者均有合作。但從整個合作作者機構圖譜和高頻合作機構合作列表,表5中反映,作者跨機構、跨區域合作相對較少,信息溝通、知識交流及合作研究欠缺, 合作主要集中于單位內部,再大一點的涉及到省內部分檔案管理機構,跨省合作則成為主要的壁壘。
五、結論
本文基于計量學方法,對《中國檔案》發表于2000年至2020間的文獻進行統計分析,使用SATI網絡版處理數據,進行可視化分析,可以發現:
第一,通過高頻關鍵詞及共現分析,以“檔案局(館)”“檔案事業”“檔案工作”可知我國檔案行政管理部門檔案研究工作熱點主要集中在檔案管理部門自身發展建設上,近些年及今后研究熱點還在于如何利用信息化手段,建立完善行政管理部門綜合檔案館、數字檔案館等業務上。
第二,通過高產作者及其合作網絡分析,可知高產作者大多來自中國檔案雜志社和國家檔案局,發文量大,對本領域發展貢獻較大,形成了作者核心區,但從整體合作上看,作者之間的合作網絡密度低,研究較為獨立,相對于高校從事檔案專業教學研究工作的學者,在學科交流和創新能力上還有欠缺,不利于檔案行政管理部門檔案研究工作的交流與發展。
第三,通過高產機構及其共現分析,可知我國檔案行政管理部門已經形成核心研究機構,且研究能力從中央到地方逐級遞減。跨機構、跨地區之間的交流合作較低,不利于檔案工作的發展和創新。
最后,值得注意的是本文僅從關鍵詞、作者和機構形成的網絡進行可視化,而在計量學統計分析中,引文分析對研究重點和熱點探討也是十分重要的,因此,被引和共被引網絡分析也是后續研究的主要內容。
參考文獻:
[1]鄧小軍.大檔案? 大服務? 大安全[J].中國檔案,2011
[2]劉啟元,葉 鷹.文獻題錄信息挖掘技術方法及其軟件SATI的實現——以中外圖書情報學為例[J].信息資源管理學報,2012
[3]楊來青.智慧檔案館是信息化發展的必然產物[J].中國檔案,2014
[4]楊來青,李大鵬.智慧檔案館功能及體系結構[J].中國檔案,2015
[5]楊來青.智慧檔案館建設關鍵技術研究與應用[J].中國檔案,2016
[6]劉守華.用文化遺產鎖住人類記憶[J].中國檔案,2003
(作者單位:淄博市技師學院)