李蓉
【摘 要】在知識服務的重要性逐漸顯現的今天,利用大數據技術,將檔案中的信息資源轉化為知識資源,能夠更好地為檔案用戶提供不同功能和不同類型的便捷、精準和高效的個性化知識服務,促進檔案工作的可持續發展。
【關鍵詞】大數據;檔案;知識服務
大數據已成為當下熱門話題,開始滲透許多領域,并深刻地影響人們的工作和生活,同時也給檔案工作帶來新的機遇與挑戰。大數據技術橫跨數據存儲、虛擬化、云計算、數據庫管理和數據挖掘等多個技術領域,在檔案管理中引入此概念將為檔案工作實現信息服務內容的豐富、信息服務手段的完善、信息服務模式的突破等提供了新的思路和解決方案,必將推進檔案工作的可持續發展。
1 大數據的概念
目前為止,大數據并沒有一個統一的定義,但對于大數據有著一個共識:大數據描述的不是數據量的大小,而是一種在數據種類繁多、數量龐大的多樣數據中進行的快速信息獲取。
另外,就大數據的特點,業界一般歸納為4V。即(大量)Volume,(速度)Velocity,(多樣)Variety,(價值)Value。第一,Volume,即數據體量巨大。大數據中的數據不再以幾個GB 或幾個TB 來衡量,而是以PB(1 千個T)、EB(1 百萬個T)或ZB(10 億個T)為計量單位;第二,Velocity,要求處理速度快,一般要求在秒級時間范圍內給出分析結果,否則就失去了大數據分析價值;第三,Variety,數據種類繁多,包括結構化數據、半結構化數據、非結構化數據等類型多樣的數據;第四,Value,即價值密度低,而商用價值高。將大數據中已有的結構化與非結構化數據進行融合、分析,將從中挖掘出極高的商業價值。
作為一種數據管理新的理念和方式,大數據是伴隨著互聯網時代的云技術、移動互聯網、物聯網等技術而出現,同時也是人類社會所積累的數據迅猛增長的結果。
2 大數據與檔案數據挖掘
隨著數字檔案館建設的不斷推進及資源整合的實現,檔案數據資源總量龐大、種類繁雜、結構多樣,檔案領域已具備大數據特征。檔案作為一種最真實、最具權威性與憑證性的信息資源,是社會數據資源中最為精華的部分,其價值與作用的日益凸顯,必將使之在大數據時代占據重要地位。
長期以來,由于缺乏深度數據挖掘和整合,檔案信息資源存在著重藏輕用,檔案信息服務手段落后,檔案利用者日益增長的信息服務需求得不到有效滿足。數據本身不被有效的利用就不會帶來任何價值,而大數據的價值在于分析、挖掘與應用,利用大數據的分析與挖掘技術能有效的對檔案數據進行重新關聯、組合,挖掘出新的價值,實現檔案數據增值。
2.1 檔案知識挖掘
檔案學術界很早就提出知識管理與知識挖掘,檔案信息中蘊涵的巨大的知識寶藏,亟待深入開發和利用。利用大數據技術將檔案中的信息資源轉化為知識資源可滿足現今服務要求不斷提高的檔案用戶,也是檔案工作的重要目標。
隨著大數據時代到來,數據分析與挖掘技術在檔案工作中的應用也將進入一個新的發展時期。大數據的分析與挖掘技術可解決數據與知識之間的鴻溝,是將數據轉變成知識的有效方式。有檔案學研究者認為,“檔案館的傳統業務將向檔案資源的數據分析、數據挖掘方向轉移,對大量數據的分析處理將成為檔案館的主要業務”,“檔案信息服務的底層基礎可能不再是檢索,而是智能化的數據挖掘”。
大數據技術的核心作用就是挖掘出龐大的數據庫中獨有的價值。利用大數據,通過對檔案資源中結構化、半結構化及非結構化數據進行深度挖掘與分析,挖掘其潛在價值,得到更能揭示事物發展本質及規律的知識。利用大數據對檔案資源進行深層次的挖掘、整合和提煉,能使隱性知識顯性化,充分發揮隱性知識的價值。大數據深度分析與挖掘技術的應用能夠提升從海量和復雜的數據集中獲得知識和洞察分析能力。
大數據能夠活檔案資源,促進數據資源集成創新,激展現數據價值,創造新知識,滿足檔案用戶服務需求。
2.2 用戶數據挖掘
大數據時代,隨著信息環境的變化,用戶對檔案信息服務的需求呈現出新的變化。檔案用戶已從信息服務的被動接受者轉換為主動選擇者,他們關心的不再是信息來源,而是精準、快速的得到自己所需要的知識,同時,他們更希望獲得一種為自己量身定做的個性化服務。
一直以來,檔案信息服務采取的是“供給導向”的模式,僅從自身業務角度出發,有什么樣的內容就提供什么樣的服務,用戶常常面臨著“提供的服務不需要,需要的服務找不到”的尷尬局面。因此,為滿足服務需求日益提高的檔案用戶,應構建以人為本的用戶服務理念,做到以用戶為中心,以需求為導向,實現檔案信息服務理念從供給導向到需求導向的轉變。
大數據技術可以掌握用戶實時行為,尋找其隱性需求,還可以對用戶未來行為進行預測分析,通過對用戶搜索方式、行為軌跡、使用習慣、利用興趣、存儲行為等數據進行分析,挖掘出不同類型用戶的需求特征,發現用戶隱性訴求,通過對數據內在關聯挖掘,促進資源集成創新。
利用大數據,實時透徹感知和預測用戶需求,做到精確洞察,作出快速反應,精準服務,為用戶提供精品化、多元化、個性化的檔案知識服務,提升檔案用戶認同感,實現檔案知識服務價值。
3 大數據背景下的檔案知識服務
大數據時代,面對多元化的檔案資源,用戶對檔案信息服務的需求越來越高,他們關注的不再是簡單的獲取信息,而是在繁雜的信息環境中獲得能夠直接解決實際問題的知識服務。為解決用戶需求與傳統信息服務之間矛盾日益突出的問題,運用大數據技術挖掘檔案信息中的知識資源,通過檔案的知識管理,開展檔案信息資源的知識服務,滿足用戶精品化的信息需求與專業化的信息服務,實現用戶價值,也是檔案服務工作可持續發展的關鍵。
傳統的檔案服務是以信息服務為特點,在檔案信息化建設的基礎上開展檔案信息內容發布、瀏覽、下載、館藏信息資源檢索等方面的服務,目的是為用戶提供檔案信息。知識服務則是從大量的檔案信息中分析、挖掘出其潛在價值,向用戶提供有針對性的、能夠解決面臨的問題的信息資源。檔案知識服務的實現需要對檔案信息進行廣度和深度分析,從中挖掘更深、更多的隱藏信息和關聯關系,形成新的具有獨特價值的信息產品。
大數據有利于推動檔案信息資源的集成與整合,提升檔案管理與服務能力,實現檔案知識服務。大數據挖掘技術是將信息轉變成知識的有效方式,使檔案服務工作由信息服務過渡到知識服務。利用大數據,通過對檔案資源中結構化、半結構化及非結構化數據進行挖掘與分析,挖掘其潛在價值,得到更能揭示事物發展本質及規律的知識。同時,利用大數據對檔案信息資源進行深層次的挖掘、整合和提煉,使隱性知識顯性化,充分發揮隱性知識的價值。大數據技術不僅提供用戶所需的信息知識,通過對用戶需求分析,還將實現用戶不斷增長的高層次、個性化的知識服務。
大數據技術的運用將給檔案信息服務注入新的活力,推動檔案信息服務轉型升級。基于大數據的檔案知識服務能夠實現檔案資源的互聯互通和深入挖掘,實時感知和預測用戶需求,讓“信息倉庫”變成“知識海洋”,將為用戶帶來全新的檔案信息服務體驗。
【參考文獻】
[1]王雅潔,等.大數據挖掘在食品安全預警領域的應用[J].安徽農業科學,2015(8).
[2]張芳霖,唐霜.大數據影響下檔案學發展的趨勢的思考[J].北京檔案,2014(9).
[3]周楓.資源 技術 思維——大數據時代檔案館的三維詮釋[J].檔案學研究,2013(6).
[責任編輯:田吉捷]