許振哲 于喆



摘? 要:《互聯(lián)網(wǎng)時代下的高校智慧型檔案館建設》一文對高校智慧檔案館建設的解讀具有一定的創(chuàng)新性,但也存在認知偏頗和理想化傾向。本文針對該文提出的智慧型檔案館內(nèi)涵、我國高校智慧型檔案館建設現(xiàn)狀以及相關建設舉措三方面內(nèi)容與之進行商榷。提出智慧檔案館的智慧內(nèi)涵在于對內(nèi)容信息進行Apriori關聯(lián)算法分析與主動推送;指出我國高校智慧檔案館建設名不符實,地級智慧檔案館建設未能達到預期的現(xiàn)狀;認為目前建設高校智慧檔案館時機尚未成熟,應著力建設高校數(shù)字檔案館,并實現(xiàn)由數(shù)字檔案館向智慧檔案館的平穩(wěn)過渡。
關鍵詞:智慧檔案館;Apriori;主動推送;檔案信息化;高校檔案館
Abstract: The article'the construction of intelligent Archives of universities in the internet era' is innovative to the extent of how to construct intelligent Archives of universities, but it also has the tendency of cognition bias and idealization. This paper discusses from three aspects: the connotation of intelligent Archives, the current situation of intelligent Archives of universities in our country and the relevant suggestions. Points out that the connotation of intelligent Archives is to push information actively by using relevancy algorithm of Apriori; and the construction of intelligent Archives of universities is unworthy of the title, the construction of intelligent Archives of cities also fails to reach the target; Finally, it is concluded that intelligent Archives of universities should not be built until the time is ripe, we should focus on the construction of digital Archives and make a smooth transition from digital Archives to the intelligent Archives.
Keywords: Intelligent archives; Apriori; Active push; Archives informatization; University archives
《檔案管理》雜志2020年第5期刊登了王楠同志撰寫的《互聯(lián)網(wǎng)時代下的高校智慧型檔案館建設》(以下簡稱《王文》),文章對智慧型檔案館的內(nèi)涵做出闡釋,描述了我國高校智慧型檔案館建設現(xiàn)狀,并對高校“互聯(lián)網(wǎng)+智慧檔案館”建設的舉措提出相關建議。但《王文》對智慧型檔案館的內(nèi)涵認知不全面,對高校智慧型檔案館建設現(xiàn)狀分析不到位,提出的相關舉措存在理想化傾向。本文擬從智慧型檔案館的智慧內(nèi)涵、智慧型檔案館總體建設概況以及高校智慧檔案館建設舉措分析三方面與之商榷。
1 智慧型檔案館的智慧內(nèi)涵
《王文》認為,智慧型檔案館是指通過應用物聯(lián)網(wǎng)、云計算等先進技術,實現(xiàn)跨時空、跨平臺的信息共享和服務集成,便于用戶一站式獲取檔案信息資源。其實質是網(wǎng)絡信息化與高校信息化建設的高度融合,是實現(xiàn)檔案管理信息化的必然結果。[1]這種表述首先在語法上存在問題:缺少賓語,沒有闡明智慧型檔案館究竟是檔案館實體或者是檔案集成服務模式;再者,《王文》著重強調(diào)了互聯(lián)網(wǎng)技術與高校智慧型檔案館的密切關系,存在將“互聯(lián)網(wǎng)化”等同于“智慧化”的技術論傾向,這樣的理解未免有失偏頗。
檔案界對智慧檔案館的內(nèi)涵有很多不同的界定,至今未能形成統(tǒng)一。楊來青等人認為智慧檔案館是采用物聯(lián)網(wǎng)、云計算等新技術智能管理多元化檔案資源、具有感知與處置檔案信息能力并提供檔案信息泛在服務的檔案館模式[2];傅榮校等人認為智慧檔案館是采用物聯(lián)網(wǎng)、云計算等新興技術對多元化的檔案資源進行整合、感知、挖掘,并提供多方位、多層次、多渠道的檔案共享利用服務的一種檔案館模式[3];許桂清認為智慧檔案館=檔案館+物聯(lián)網(wǎng)+云計算+智慧化設備+智能館舍+信息資源+人力資源。[4]縱觀以上幾種觀點,不難發(fā)現(xiàn)檔案界公認智慧檔案館的核心技術應為物聯(lián)網(wǎng)、云計算技術。《王文》強調(diào)互聯(lián)網(wǎng)+技術以及網(wǎng)絡信息化與高校檔案信息化建設的融合,某種程度上仍是數(shù)字檔案館時代的建設方針,缺乏智慧性與時代特征。
前國家檔案局局長楊冬權曾強調(diào)數(shù)據(jù)挖掘技術的重要性[5]。我們認為:智慧檔案館的智慧內(nèi)涵體現(xiàn)為對用戶行為做出智慧化預測,并主動推送信息。實現(xiàn)智慧內(nèi)涵需要具備一定的前提,即數(shù)據(jù)化和用戶行為數(shù)據(jù)的關聯(lián)性開發(fā)。檔案數(shù)據(jù)化并不是單純地數(shù)字化掃描,而是需要進行OCR識別,保證全文內(nèi)容信息可供檢索;數(shù)據(jù)關聯(lián)性開發(fā)則需用到Apriori(關聯(lián)分析算法),通過對用戶行為數(shù)據(jù)的收集,根據(jù)用戶的檢索詞匹配高頻關聯(lián)詞,并推送給用戶。筆者構建了一個十名用戶的簡易關聯(lián)算法模型對之進行例證,如表1所示。
表1為十名檔案利用者檢索行為數(shù)據(jù),將出現(xiàn)頻次≥50%的檢索詞以及頻繁一起出現(xiàn)的雙項、三項檢索詞分別進行統(tǒng)計匯總后,得出結果如表2所示:
其次,《王文》所述互聯(lián)網(wǎng)+的智慧服務平臺缺乏現(xiàn)實基礎。由于各高校檔案信息網(wǎng)站的系統(tǒng)兼容性以及檔案安全保密性等各方面因素,校際檔案館全面互聯(lián)注定難以實現(xiàn)。高校智慧檔案館作為智慧校園建設的組成部分而設計,目前全國尚缺乏統(tǒng)一的規(guī)劃和相應的技術標準,各高校智慧檔案館建設基本處于各行其是的狀態(tài)??梢灶A見,未來各高校智慧檔案館僅服務于本身智慧校園建設,無從溝通互聯(lián),只可能變成一個個信息孤島。[16]
再次,《王文》強調(diào)智慧檔案館建成需要社會公眾的有序參與。但高校檔案館的主要受體是學校師生,用戶群體同質性高,因此高校智慧檔案館建設與社會公眾的參與并無太大關聯(lián)。提升服務質量的關鍵在于采集師生多元化的檔案利用行為數(shù)據(jù),通過云計算技術對這些數(shù)據(jù)進行處理分析,實現(xiàn)信息的智慧預測,主動推送。
最后,《王文》指出,應當提升搜索引擎服務功能。目前大多數(shù)高校檔案館的查檔方式仍然是用戶提出需求,由檔案工作人員在電腦進行檢索。部分檔案館是由用戶個人在電腦自行檢索,但搜索機制仍局限于根據(jù)檢索詞和檔案正題名進行字段匹配,因此在查全率、查準率方面有時難以滿足用戶需求。
正如楊冬權先生指出的檔案館應以所有數(shù)據(jù)可檢索為前提,通過數(shù)據(jù)挖掘技術主動推送。因此,筆者認為,對于高校檔案館而言,相比優(yōu)化搜索引擎,現(xiàn)階段最主要任務是腳踏實地做好檔案數(shù)字化建設及開放檔案全文數(shù)據(jù)化識別。[17]現(xiàn)階段絕不可好高騖遠,盲目跟風,急于籌建智慧型檔案館。[18]高校檔案館的當務之急是建成符合國家標準的高校數(shù)字檔案館,在此基礎上逐漸引入大數(shù)據(jù)、云計算技術,提升服務質量,步步為營,最終實現(xiàn)由數(shù)字檔案館向智慧檔案館的平穩(wěn)過渡。
參考文獻:
[1][6][10][13]王楠.互聯(lián)網(wǎng)時代下的高校智慧型檔案館建設[J].檔案管理,2020(05): 67-68.
[2][11]楊來青,徐明君,鄒杰.檔案館未來發(fā)展的新前景:智慧檔案館[J].中國檔案,2013(02): 68-69.
[3]傅榮校,施蕊.論智慧城市背景下的智慧檔案館建設[J].浙江檔案,2015(05): 14-17.
[4]許桂清.對智慧檔案館的認識與探析[J].中國檔案,2014(06): 70-71.
[5]楊冬權:關于智慧檔案館發(fā)展的構想[EB/OL].https://mp.weixin.qq.com/s/OTO0e5Z5UjsuyyfnFinwqQ,2020-12-7
[7]楊來青.智慧檔案館是信息化發(fā)展的必然產(chǎn)物[J].中國檔案,2014(06): 64-66.
[8]國家檔案局.2019年度全國檔案行政管理部門和檔案館基本情況摘要[EB/OL].[2020-09-04].https://www.saac.gov.cn/daj/zhdt/202009/5ce902bafc3f490d99596d55c8c33954.shtml.
[9][15]王小健,劉延平.面向智慧城市的智慧檔案館建設[J].檔案與建設,2015(05): 16-20.
[12]王正媛,朱悅華.RFID技術運用于檔案實體管理可靠性研究[J].中國檔案,2016(10): 58-59.
[14]羅琳娜.智慧檔案館服務功能實現(xiàn)研究[J].檔案管理,2017(04):10-13.
[16]王素紅.對智慧檔案館建設和研究熱的冷思考[J].檔案學通訊,2015(04): 39-44.
[17]高旭,趙豪邁.我國智慧檔案館研究現(xiàn)狀與熱點的可視化分析[J].檔案管理,2017(02):34-36.
[18]師寶玉.檔案智能管理的特點與智能服務模式分析[J].檔案管理,2020(01):108-109.
(作者單位:上海理工大學檔案館 來稿日期:2021-01-11)