張琬渝
摘 要:在政府實施信息公開制度之后,檔案信息的開放利用程度也越來越大,對于傳統的檔案信息管理和應用形式來說,已經不能很好地滿足人們對檔案信息應用的需求。在網絡信息普及發展過程中,紙質檔案也逐漸被電子檔案以及電子文檔所替代,數字信息技術以及網絡技術在檔案信息中已經逐漸被應用,讓檔案信息管理工作還有開放利用的效率都有所提高,也讓檔案信息管理工作更加容易。本文主要對數字模型應用于檔案信息的開放利用進行簡單分析,以供借鑒。
關鍵詞:數字模型;檔案信息;應用;開放
檔案信息主要是記錄了人們在社會中各項活動的一種文檔,能夠將人們在社會中的各種表現都反映出來,現在檔案信息越來越被人們所看重,在開發利用上也加大了力度。現在的檔案利用需求要明顯高于以前,且檔案館藏數量增加也相當迅速,這就明顯突出來檔案數化能力比較弱,所以在檔案信息開放利用上也要加大力度,爭取讓檔案信息實現數字化,而將數字模型應用于檔案信息開放利用中,能更加直觀和理性地將檔案間的規律都表達出來,更適合當代數字檔案信息的發展趨勢。
1 引用方法
1.1 MomeCarlo方法
這種方法也可以叫做計算機隨機模擬方法,其主要是美國在研制原子彈計劃中產生的。近些年,計算機技術發展比較迅速,所以這種方法也成為解決計算機數字技術問題的主要方法之一。
1.2 TOPSIS法
這種方法屬于多目標決策分支中的重要方法,主要的原理就是依據檢測評價對象的優劣距離做出排序,要是評價的對象是優解的,也是最遠離裂解的,那么就是最好的,反之則是最差的。優解的各項指標值都必須達到最優,而最裂解的指標則是最差值的指標。
1.3 術語說明
其一是全宗——年代單元,主要是將檔案依照年代和全宗來分類,從而得到的檔案類別就是全宗——年代單元。其二是全宗——年代單元編號,就是同一年的檔案都將被統一編成一個編號。其三是全宗——年代單元檔案卷數,這是主要是同一年檔案在該單元中所有的搭檔總卷數,表示檔案的數量。其四是全宗——年代單元利用卷數,這主要是同一單元中檔案信息總的利用卷數是多少。其五是檔案價值權重,這只要是指在這個全宗中,檔案的價值所占有的比重是多少。其六是成功率,主要是指用戶所訪問的檔案信息達到了數字化的比重和概率。
2 準備工作
2.1 檔案利用情況數據
在檔案信息利用數據上,可以分解為兩點。首先是檔案的利用總數是多少,其次是檔案利用的數據在全宗--年代單元中的分布情況。第一點主要是利用的線性最小數,并預測未來檔案利用的總數是多少,然后再利用直線方程來得出檔案利用總數情況。第二點主要是利用今年檔案的利用總數,看在不同全宗年代單元分布下,是否對其他的全宗年代單元分布有什么影響。
2.2 檔案掃描量和資源的投入
受到地區差異的影響,不同地方物價也有所不同,所以在數字化檔案信息上投入的資金也就有所不同,其中也存在一些可變的因素,但總體來看,其掃描量和投入的資金是成正比關系的。而比例系數,主要就是取前些年的總掃描卷數還有總的投入資金比例就可以了。
3 數字模型的建立
3.1 選擇模型
首先是目標,檔案數字化開放利用需要遵循的原則主要有幾點,即實用性原則、價值型原則、開放性原則、時效性原則以及搶救性原則。但是在實踐中,檔案利用的主體已經逐漸變成工種,所以首先要考慮的就是實用性,所以數字模型建立的主要目標也就是數字化檔案訪問的成功率是多少。其次是指標:檔案利用數據代表了檔案的利用率,為了最大化成功率,就得以檔案利用數據為指標。最后是分析:由于檔案利用數據存在明顯的扎堆現象——“二八現象”,即20%全宗的利用卷數之和可能占了總數的80%,20%年份的利用卷數之和可能占了總數的80%。如果盲目或粗放式的制定數字化順序,那么產生“要用的檔案未數字化,已數字化的檔案卻沒有用”現象也就不足為怪了。
3.2 直觀選擇模型
本模型主要想法是用局部最優來體現整體最優,即選擇總利用卷數最高的全宗與總利用卷數最高的年份的組合。步驟如下:求出每個全宗的總利用卷數(所有年份利用卷數之和),按從大到小次序,根據實際情況選取排在前面的部分全宗。求出每個年份的總利用卷數(所有全宗利用卷數之和),按從大到小次序,根據實際情況選取排在前面的部分全宗。按照以上兩步所選的全宗與年份組合的全宗——年代單元即為應該先數字化的全宗——年代單元。
3.3 MonteCarlo選擇模型
使用MonteCarlo方法來進行優化。其基本思想是每次試驗選取一種全宗與年份組合并求出該組合總的利用卷數,從大量的試驗中找出總卷數最大的組合。由于涉及組合問題,所有的情況太多,所需進行的試驗的卷數必須非常非常大才能夠得到較理想的結果。在長春市檔案館的計算中,在不加改進的情況下進行試驗,發現即使進行1億次試驗,所得到的結果也不如直觀選擇模型來得好。這里主要的思想是減少組合的數量,考慮到利用卷數是典型的稀疏矩陣,其中有很多全宗和年份其實是可以先被排除的,結合直觀選擇模型的方法,我們采用的方法是,先將利用卷數矩陣按照“行和”與“列和”大小從大到小進行排列,根據實際情況選擇排在前面所占比例比較大的行和列,然后再利用下面的流程進行計算。
3.4 仿真分析應用
按照仿真分析要求,輸入數據:檔案卷數矩陣,利用卷數矩陣,全宗--年代單元的排序以及每天平均數字化檔案卷數。按照流程,利用MATLAB編程,帶入相應數據,即可預測三個模型的數字化方案所帶來的成功率變換。
3.5 應用推廣
這里具有很強很廣的應用性,對于不同的需求可以使用不同的模型來滿足。對操作的簡易性要求比較高的用戶,這里建議采用直觀選擇模型,該模型簡單實用,僅需簡單操作即可實現較好的結果。
結束語
現在人們在檔案信息的應用和開發上有著更高的需求,傳統的檔案信息管理以及檔案信息利用模式已經不再適用,對檔案管理軟件統計功能進行升級和完善是亟需解決的。應用數字模型讓檔案利用統計自動化水平得以提高,也同樣是檔案管理軟件開發以及應用未來的發展趨勢。在檔案利用情況中有效采用自動統計系統,最終將檔案利用情況表現成全宗、年代、卷。同時,應用數字模型還可以設計檔案數字化模式,讓檔案利用和開發更加方便,更在檔案數字化成果檢驗過程中起到了重要作用,所以在檔案信息開發利用上有效應用數字模型是值得推廣應用的。
參考文獻
[1]周彩英.高校檔案信息利用服務綜合評價探究[J].浙江檔案,2011(03).
[2]陳艷紅.30年來檔案信息資源開發利用研究述評——基于《檔案學研究》、《檔案學通訊》的論文分析[J].檔案學研究,2010(02).
[3]米士剛,劉盈利,劉艷麗.檔案館建設如何踐行“低碳”理念[J].中國檔案,2010(07).
[4]張寧.思維的“逆行”——電子文件風險管理解析[J].中國檔案,2010(07).
[5]孫洪魯,劉虎.數字化加工檔案原件與信息安全的管理[J].中國檔案,2010(08).