文/常超,呂梁市高陽農業科技園管理委員會
新媒體環境下數字檔案管理新技術發展與應用
文/常超,呂梁市高陽農業科技園管理委員會
近年來,媒體在互聯網上蓬勃發展,爆發出驚人的能量,其傳播的信息已成為人們瀏覽互聯網的重要內容,不僅制造了社交生活中接連不斷的熱門話題,更是吸引傳統媒體爭相跟進。鑒于媒體的飛速發展和應用,該環境下的檔案管理越發引起社會各界的關注。因此,了解檔案管理工作中的應用現狀,有助于今后的檔案信息服務建設的良好發展。
新媒體;數字檔案;管理;新技術
檔案網站、論壇和博客等提供著大數據信息,如英國國家檔案館網站設計的虛擬展覽、澳大利亞國家檔案館在線網展的常設欄目、日本國家檔案館通過一個檢索工具實現的資源共享利用、美國檔案文件署組建的檔案信息導航系統等。國內數字檔案館重視以用戶為導向的檔案信息服務,如福建省的網上公共檔案館、青島檔案館的網絡社區、上海檔案信息網的“檔案博客”欄目、南昌市檔案局的微博等。這些海量檔案新型信息資源同樣符合當前大數據的規模性、多樣性、高速性等基本特征。
當前信息化浪潮正席卷全球,計算機技術與現代通信技術相結合,促使世界各國的檔案工作朝著數字化、網絡化方向深度發展。國際檔案信息化建設通過加快推進檔案資源數字化、信息管理標準化、信息服務網絡化進程,有力地促進了世界各國檔案事業持續、快速、健康發展,進而積累和儲備國家信息資源,真實保存社會記憶,從而實現更大范圍和更多種類的檔案信息資源互補與共享。隨著國家檔案局一系列重要法規、規劃綱要和戰略目標的相繼推出,檔案信息化建設迎來了跨越式發展,物聯網、云計算、大數據、移動互聯網等新興信息技術的應用不斷向縱深發展。
“十二五”期間,檔案信息化圍繞“電子文件管理”和“數字檔案館建設”在全國范圍內紛紛展開。《全國檔案事業發展“十三五”規劃綱要》進一步提出“加快檔案管理信息化進程”。“綱要”在技術和應用方面,突出強調了以下3個方面:
積極響應“數字中國”建設,加快推進信息技術與檔案工作深度融合,到2020年全國地市級以上國家綜合檔案館全部建成具有接收立檔單位電子檔案、覆蓋館藏重要檔案數字復制件等功能完善的數字檔案館;編制數字檔案館業務系統功能需求標準;采用大數據、智慧管理、智能樓宇管理等技術,提高檔案館業務信息化和檔案信息資源深度開發與服務水平。
積極參與國家政務信息化工程建設,明確電子文件歸檔范圍和電子檔案的構成要求;加強對業務系統電子文件歸檔管理,促進電子政務和電子商務文件歸檔管理工作;制定和完善信用、交通、醫療等相關領域的電子數據歸檔和電子檔案管理的標準和規范;探索電子檔案與大數據行動的融合;研究制定重要網頁資源的采集和社交媒體文件的歸檔管理辦法;加強電子檔案長期保存技術研究與應用。
實施國家數字檔案資源融合共享服務工程。建立開放檔案信息資源社會化共享服務平臺,制定檔案數據開放計劃,落實數據開放與維護的責任,優先推動與民生保障服務相關的檔案數據開放;積極探索助力數字經濟和社會治理創新的檔案信息服務。拓寬通過檔案網站和移動終端開展檔案服務的渠道。
隨著社會化媒體的發展,檔案管理的模式也發生了很大變化,由傳統模式逐步向現代化的管理模式轉變。政府應加強對檔案管理的宏觀控制,極力塑造開放的檔案管理環境,科學整合,鼓勵檔案資源在整個社會內合理流動。利用社會化媒體促進檔案管理建設,讓檔案管理趨于健康發展,能夠真正融人到市場經濟的浪潮,為自身發展贏得空間。
競爭歸根結底是對人才的競爭。在未來的社會發展里,擁有高科技人才能夠在競爭中掌握主動權。隨著社會化媒體的應用,檔案管理工作人員能力和水平的高低直接影響著檔案事業發展的興衰。隨著科技的不斷進步,人類逐步邁向了電子化、網絡化時代,檔案的載體已經從紙介質逐步轉向了紙介質和電子介質并存,這些都對檔案管理的工作人員提出了越來越高的要求,主要是體現在專業技術水平和文化知識水平等方面。就目前而言,傳統檔案管理的知識和方法已經無法滿足檔案事業的發展,因此,要重視檔案管理隊伍的專業化建設,打造一支作風優良、具有專業水平和創新精神的檔案工作隊伍。
對于檔案管理隊伍的專業化建設,要從各方面抓起,隨著社會化媒體的應用,檔案管理要采用現代化、自動化的管理方式。一支專業化的檔案管理隊伍要有專業的領導班子、研究型干部、具有專業水平的管理人員,并且還需具備嚴格的準人制度。在此基礎上,要對工作人員進行繼續專業教育,滿足檔案工作發展的需要。要使工作人員具有危機感和責任感,要逐漸培養他們的創新精神,通過繼續培訓不斷提高他們的檔案管理水平,通過不斷的努力逐步提升檔案管理事業在社會上的地位。
實現新媒體檔案信息資源開發,對互聯網上的大型檔案網站、檔案論壇、檔案博客中的信息資源進行動態跟蹤和全面采集。采集功能在支持傳統網頁采集功能的基礎上,為檔案信息分析挖掘提供豐富的數據資源。檔案信急的采集過程主要是完成從網絡信息源中獲取網頁頁面數據的工作,重點是網絡采集器(爬蟲)的實現以及優化,具體包括網頁腳本解析、更新搜索控制、采集的深度和廣度控制等。同時,采集信息預處理是對采集信息進行初步加工和處理,為檔案信息中的關鍵信息抽取和內容分析奠定基礎,主要工作包括Web頁面解析、數據清洗、網頁數據的索引、處理結果的儲存與初步統計等。其中,由于各數據源之間的結構與格式差異,需要合并處理采集數據的結構信息,提供統一標準的數據著錄格式存儲異構信息資源。所謂支持檔案網頁結構自動分析,即互聯網信息資源以網頁形式表現,類型格式紛雜多樣,采集工具能夠實現基于檔案網頁結構的統計分析算法,自動識別檔案網頁中的信息內容與相關屬性,滿足檔案信息分析的需要。所謂支持基于模板的元數據解析,即支持基于應用模板的檔案元數據解析功能,對于采集到的網頁可以解析出單位、發文時間、標題、內容等檔案元數據屬性。
信息檢索是檔案信急化服務的最基本功能。針對信息內容管理和資源建設的新需求,檔案信息資源研究交流平臺需要滿足精確和便捷的目標檢索需求。所謂多種檢索人口,即具有檔案的屬性字段檢索、關鍵詞檢索、多字段布爾邏輯組合檢索、二次檢索(漸進檢索)等。所謂同義詞典、主題詞典,即檢索時能夠應用同義詞典和主題詞典進行檔案信息的擴展檢索。
系統提供用戶和權限管理機制,充分保證信息內容的安全性。實現對檔案信息資源的訪問權限的分配,實現對檔案信息資源的安全保護與利用。
綜上所述,新媒體檔案信息資源開發系統及研究交流平臺投入運行后,將解決廣大檔案用戶與工作者構建與獲取網絡新媒體檔案信息資源困難的問題,提供一條操作性強、技術先進的途徑,并在檔案信息化的理論和應用上進一步提高信息獲取與服務的水平和質量,同時也推動檔案信息化的研究和應用創新。
[1]周迪.北京市檔案館綜合檔案管理系統設計與實現[D].北京工業大學,2012.
[2]宋萍萍.美國社會化媒體應用環境下檔案管理的最新發展及引發的思考[J].四川檔案,2013,02:51-52.