董守霞



摘?要:文章簡述了檔案界新一代信息技術應用研究概況,分析了檔案界新一代信息技術研究中大數據、區塊鏈、云計算、物聯網、人工智能等單項研究的情況,以期為檔案界更好地進行新一代信息技術研究提供借鑒。
中圖分類號:G250文獻標識碼:A文章編號:1003-1588(2020)08-0082-03
關鍵詞:數字信息;信息技術;檔案;應用研究;趨勢
新一代信息技術是國務院確定的七個戰略性新興產業之一。以移動互聯網、云計算、物聯網、大數據等為代表的新一代信息技術,正在推動全社會各領域的深刻變革[1]。新一代信息技術的發展使檔案形態在數字化基礎上進一步實現了智能互聯[2]。近年來,檔案界在大數據、區塊鏈、云計算、物聯網、人工智能等領域的研究日漸升溫。
1?檔案界新一代信息技術應用研究概況
筆者以中國知網為數據樣本來源,以“檔案”“大數據”“區塊鏈”“云計算”“物聯網”“人工智能”等為檢索詞進行精確匹配,檢索時間為2020年5月20日,時間跨度為18年,共獲得相關文獻2,888篇。2003—2020年檔案界新一代信息技術研究的發文趨勢詳見圖1,其中2020年的發文數量僅統計到5月20日。
圖1顯示,檔案界新一代信息技術應用研究始于2003年,截至目前大致經歷了三個階段,總體呈前慢后快的態勢。2003—2009年為第一階段,該階段每年發表的相關文獻為一位數,共發文16篇,年均2篇;2010—2013年為第二階段,該階段每年發表的相關文獻從一位數上升到兩位數,數量增長明顯,共發表文獻138篇,是第一階段的8.6倍,年均35篇;2014年至2020年5月20日為第三階段,該階段每年發表的相關文獻從兩位數上升到了三位數,發文數量大幅增加,持續高速增長,共發表文獻2,734篇,年均420篇(2020年按6個月算)。
2?檔案界新一代信息技術研究各單項情況分析
大數據、區塊鏈、云計算、物聯網、人工智能等是檔案界新一代信息技術研究文獻中的五大內容,各內容在整體研究中所占的比重,以及研究起步時間、研究規模、發文數量等都存在較大差異。
2.1?各項研究內容占比情況
筆者將大數據、區塊鏈、云計算、物聯網、人工智能等關鍵詞分別與檔案組成檢索詞組進行檢索,共獲得2,913篇相關文獻,與前文的2,888篇文獻相差25篇,因為文章題目同時涉及兩個檢索詞,考慮到研究的交叉性,因此沒有進行剔除。筆者對2,913篇文獻進行分析整理后發現,大數據的研究規模最大,共發表相關文獻2,300篇,占比78.96%,排第一位;云計算研究共發文315篇,占比10.81%,排第二位;區塊鏈研究共發文121篇,占比4.15%,排第三位;物聯網研究發表108篇,占比3.70%,排第四位;人工智能研究發文69篇,占比2.37%,排在最后,詳見下頁圖2。
2.2?各項研究內容年度分布情況
筆者按文獻發表時間、文獻總量大小以及文獻發表的持續性等對2003—2020年檔案界新一代信息技術單項研究文獻的年度分布進行了統計,見表1。表1顯示,大數據研究的相關文獻發表時間最早,數量最多,持續性較好;人工智能研究文獻的發表時間與大數據研究文獻相同,但其發文總量和持續性與大數據研究文獻相比存在較大差距;云計算研究和物聯網研究同時起步于2009年,持續性好,但云計算研究文獻的發文總量比物聯網研究文獻高出近三倍;區塊鏈研究雖然起步晚、總量小,但持續性好。
在5個單項研究內容中,大數據、人工智能、云計算、物聯網等4項研究均起步于2010年前,起步階段研究規模較小,增速緩慢。自2010年起,大數據、人工智能、云計算、物聯網等4項研究出現起伏變化,其中大數據研究自2013年開始明顯高于其他3項研究的增速發展,其中云計算研究呈快速平穩發展,人工智能研究和物聯網研究雖然有所上升,但幅度和規模始終有限。2016年開始的區塊鏈研究起步晚,增速快,但與大數據相比不在一個數量級上。由此可見,大數據研究在檔案界新一代信息技術應用研究中居首要位置。
2.3?各項研究內容交叉研究情況
在本次研究的2,913篇樣本文獻中,有25篇文獻的研究主題涉及兩項研究內容,屬于新一代信息技術應用研究中的交叉研究,占全部樣本文獻的0.85%。其中,大數據研究與云計算研究交叉的文獻有14篇,大數據研究與物聯網研究交叉的有6篇,大數據研究與區塊鏈研究交叉的有1篇,大數據研究與人工智能研究交叉的有1篇,云計算研究與物聯網研究交叉的有2篇,區塊鏈研究與物聯網研究交叉的有1篇。大數據與其他4項內容均有交叉研究,交叉率最高;物聯網與云計算、區塊鏈有交叉研究,交叉率排第二。由此可見,檔案界新一代技術研究內容主要集中在大數據和物聯網領域。
3?基于網絡的檔案界新一代信息技術應用研究重點分析
當前,檔案界新一代信息技術應用研究以“大數據”為核心群組,包括“大數據時代”“區塊鏈技術”“大數據環境”“大數據背景”“物聯網”等在內的高頻關鍵詞網絡,網絡構成緊密、向心性強。在“大數據”主群組中共涉及14個主要關鍵詞,其中使用頻率高的有“云計算”“管理”“檔案”“高校”“信息化”“信息化建設”等關鍵詞,距離近的有“創新”“管理”“檔案”“信息化”等關鍵詞,聯系密切的有“管理”“檔案”“人事檔案”“高校”“信息化”等關鍵詞,詳見下頁圖3。在“大數據”核心聚類群組中,“大數據”的中心度最大,是整個群組的核心。中心度的大小是指在共現網絡中通過該節點的任意最短路徑的條數,是網絡中心節點在整體網絡中所起鏈接作用大小的度量,中心度越大,節點越能成為網絡的中心關鍵節點[3]。此外,“管理”“云計算”“檔案”“高校”“信息化”等關鍵詞都處在相對中間的節點位置,并通過與群組中其他關鍵詞的聯系與其他非核心群組的關鍵詞保持聯系,起著中心單點的作用。
在“大數據時代”“大數據環境”“物聯網”“大數據背景”“區塊鏈技術”等5個關鍵詞群組中,“大數據時代”“大數據環境”“物聯網”處于“大數據”主群組的中間位置,雖然與主群組其他關鍵詞有多頭聯系,但3個關鍵詞之間并沒有任何關聯,這與上文所述的單項文獻交叉研究占比情況相對應。此外,“大數據背景”“區塊鏈技術”2個關鍵詞雖然與主群組有聯系,但遠離主群組,與核心關鍵詞“大數據”沒有直接關聯,雖然不是當前研究的重點,但日后有可能成為研究熱點。
4?檔案界新一代數字信息技術應用研究方向分析
綜上所述,當前檔案界新一代數字信息技術應用研究呈現大數據一枝獨秀的趨勢,無論是與之同時起步的人工智能研究,還是后來的云計算研究、物聯網研究、區塊鏈研究等的體量規模和增速都無法與其相比,從這個意義上講,檔案界新一代信息技術應用研究就是大數據研究。因此,大數據是檔案界新一代信息技術產業的強勁推動力[4]。此外,筆者還發現,檔案界新一代信息技術應用研究中的人工智能研究雖然起步較早,但并沒有出現在關鍵詞共現網絡圖中,究其原因是其研究體量偏小,在檔案界新一代信息技術的整體應用研究中占比較小。由此可見,檔案界在進行新一代信息技術應用研究時應向綜合性及復合性方向發展,避免偏重單一技術應用,可在檔案工作全流程信息化過程中綜合應用新一代信息技術,將不同技術應用到最適合的地方,發揮其最大的效能。
參考文獻:
[1] 楊現民,李冀紅.創客教育的價值潛能及其爭議[J].現代遠程教育研究,2015(2):23-34.
[2] 魏大威,李春明,溫泉,等.萬物互聯背景下我國公共圖書館新業態發展思考[J].中國圖書館學報,2014(6):22-32.
[3] 武永強,康譽昌,馬宗鵬.運用生物力學方法研究老年人運動行為的前沿與熱點:基于CiteSpace知識圖譜的可視化研究[J].體育世界(學術版),2019(9):1-2.
[4] 程學旗,靳小龍,王元卓,等.大數據系統和分析技術綜述[J].軟件學報,2014(9):1889-1908.
(編校:徐黎娟)