李紫楠
(黑龍江大學,黑龍江 哈爾濱 150000)
在大數據背景下,越來越多的業務依附于大數據技術進行運作,數據挖掘、數據分析技術已然滲透到了各行各業,高校也越來越重視信息平臺建設以及信息資源的開發。但是隨著高校在科研、教學、招生等日常工作當中形成的數據資料呈幾何倍數增長,海量的信息數據無疑為高校信息資源的管理增加了難度,同時也造成了用戶的信息過載和信息迷航,加劇了用戶的焦慮情緒。
高校檔案館作為文化事業機構,肩負著傳承和傳播知識的重任,高校檔案更是高校各項工作的重要歷史記錄和憑證。但由于傳統的檔案觀念中重藏輕用的觀念以及檔案本身具有一定的保密性,導致了一些優質的檔案資源并未得到很好的利用。吳寶康先生曾經說過“利用是根本,是目的。”當前隨著電子檔案的普及,高校檔案越來越多的信息資源面向學生、教師以及公眾開放,更好地發揮了檔案的利用價值,服務高校自身的同時服務了社會。
高校作為科研的前沿陣地,是科研成果重要的產出地,如何基于用戶需求提供更有針對性更豐富的信息資源,為用戶提供更好的體驗感已然成了高校檔案館重要工作內容之一。其次,高校擁有大量的人才資源和充足的資金,無論是在服務理念和信息技術方面都更容易吐故納新。在大數據時代背景下,高校檔案館如何應對機遇和挑戰,筆者將立足于服務對策的優化展開討論。
作為高校不同時段保存并且遺留下的歷史記錄,高校檔案這種數據資源具有很高的價值。隨著大數據時代的到來,數字化技術賦予了高校檔案數據資源新的時代特征,更多的有價值的信息資源有足夠的空間和時間得以保存和利用,無論是高校檔案的管理人員還是相關使用的主體對象都越來越意識到檔案的價值和重要性。
大數據是指海量信息的集合,顧名思義,大數據的數量、種類繁多,并且隨著信息技術的發展其傳播速度越來越快。隨著數據數量成倍的增長數據的體量越來越龐大,在TB的程度上,出現了更大的PB、EB的計量單位,早期的主流軟件通過集中存儲和集中計算的方式,早已經無法滿足當前對信息捕捉、提取和分析的需求。按照數據格式可以將其歸為3種類型,即結構化、半結構化和非結構化數據。從特征上來看結構化數據有一定的共同屬性和基本結構,比如表格等,這類數據常常具有一定的關聯性且比較穩定,在組織管理方面也相對容易。而非結構化數據沒有較為顯著的基本結構,而且通常是固定信息,因此非結構化數據的加工處理相對而言較為復雜。第三種半結構化數據具備前兩者的部分特征,是兩者的結合體。雖然半結構化數據具備一定的相同語義特征和組織屬性,但是也具備一定的流動性,所以處理同等量級的半結構化數據要比結構化數據難度大得多。目前,高校檔案當中半結構化數據和非結構化數據與日俱增,大量半結構化數據以及非結構化數據的出現也使得當前對數據加工處理的系統和能力提出了更高的要求,所以想要深度挖掘用戶所需要的信息并且提供針對性服務可謂是難上加難。
高校檔案事業的發展隨著時代的進步和高校體制的不斷變革,逐漸走上科學規范的標準化統一化的道路,高校檔案的各項工作環節也隨著高校檔案類別的豐富以及數量的空前增長而更加系統化規范化。另一方面電子檔案的出現也推動了高校檔案的載體呈現出智能化數字化的發展趨勢,高校檔案信息資源數量和類別越來越多樣,服務主體的需求越來越具有層次性,服務范圍越來越擴大化。
新的時代背景以及新興技術的出現為高校的檔案工作注入了新的活力,隨著政策的不斷革新高校檔案的工作內容也更加細化,但對于高校檔案館而言,大數據的出現不僅僅為其帶來了一定的機遇,隨之而來的還有不同的挑戰,過去一些我們習以為常的工作方式工作內容同當前的環境和背景已經不能相適應,高校檔案的服務出現了一些問題亟須改變,高校檔案館的服務模式亟須變革。
2.1.1 服務體系不健全。傳統的服務方式服務內容已經落后于當前用戶的信息需求,大數據時代催生了用戶產生更加多樣性層次性的需求,高校檔案服務對象的范圍也從高校內部人員向同行業以及整個社會拓展。當前許多高校檔案館還秉持著重藏輕用的傳統觀念,在服務上缺乏積極主動性且傾向服務高校內部人員,導致很多優質的檔案資源被閑置,加上公眾對高校檔案館的認識較為模糊,高校檔案館基本上處于半邊緣化的狀態。由于目前高校圖書館在數據挖掘和數據分析技術上的能力還相對較弱,因此高校檔案館在把握用戶的利用規律以及提供針對性服務方面的水平有待提升。用戶反饋方面也相對比較欠缺,依靠檔案登記簿確實可以直接地了解用戶的需求,但并不能獲取高校檔案潛在的用戶的需求,以及當前用戶其他的潛在需求。
同時,高校檔案館的服務方式較為單一,由于目前信息技術上還存在一定的不穩定性和不安全性的因素,高校檔案館對于一些比較重要的檔案的數字化轉變還存在一定的疑慮,這在某種程度上也阻礙了高校檔案信息化的發展。當前的服務體系架構需要結合數據挖掘、數據分析等新興技術不斷地調整服務模式,從而為用戶帶來更好的體驗感,提升高校檔案館的社會影響力。
2.1.2 數字化水平有待提升。目前我國高校檔案館由于自身的規模和實際情況的差異,在檔案管理信息系統的選擇上也不盡相同。目前檔案管理信息系統從獨立系統到與系統配套的附屬管理系統,再到系統自帶的檔案管理功能,為高校檔案部門的信息化管理提供了更多樣化的選擇。但是其質量的良莠不齊及功能上的不健全,從某種程度上阻礙了高校檔案部門的工作效率的提升。大數據背景下,高校檔案信息系統在高校檔案各項工作當中發揮的效用越來越大,其在經濟效益上的訴求、高校檔案專業人才的輸出,也都成了檔案信息化建設的契機。為了滿足檔案工作發展的時代要求,高校檔案部門必須加快推動檔案數字化的轉變,朝著集成化、集約化方向發展。
2.1.3 信息共享程度較低。目前歐美一些國家在高校檔案信息化管理以及服務方面已經具備較為成熟的經驗,比如哈佛大學的圖書館和檔案館是一體化綜合管理,有豐富的線上信息資源以及完備的專題數據庫,并且時常開展與其他各地各高校之間的館際合作,一定程度上實現了信息資源的共建共享。而在我國,高校的圖書館和檔案館之間一般都鮮少有交集,這一方面是由于我國高校的本身的性質,在服務對象上更傾向于高校內部人員,與各地和其他高校之間沒有建立起資源共享,另一方面由于檔案本身具有一定的保密性和傳統檔案觀念的影響,造成了我國檔案館館際之間的合作較少,在信息資源方面存在一定的信息壁壘,容易出現信息孤島現象,當前的高校檔案館的服務模式還有待優化。
高校檔案未來的服務模式將朝著更加智能化、集約化和專業化的方向發展,在當下越來越注重用戶體驗的背景下,用戶的興趣的跟蹤以及用戶需求的分析已經成為必然的趨勢,高校檔案館需要把握好高校檔案的利用規律,在利用低谷期間做好檔案管理的相關工作,在做好分析和數據挖掘的前提下做好相關檔案的準備工作,加強檔案工作人員專業素養及技能的培訓,提高高校檔案服務水平也是發展服務的必然要求。
要建立規范化、標準化、實用化的高校檔案信息系統,保證數據和平臺建設的安全性能、檢索功能、動態處理能力以及兼容性等問題的處理,推動高校檔案服務朝著更加智能化、人性化的方向發展,也只有這樣高校檔案才能更好地實現自身的價值,被公眾認識和接受。除此之外,高校檔案部門可以運用Hadoop等系統進行檔案的數據挖掘、數據清洗和數據分析,對用戶行為進行長期跟蹤,加強用戶隱私信息的安全保護,根據用戶借閱收藏和瀏覽記錄提供定制化信息,實現為不同類型的用戶提供個性化且有針對性的服務。豐富高校檔案的宣傳路徑包括加大宣傳力度、提升相關人員的服務水平、制定獎懲標準、提升高校檔案館工作人員的主動服務的意識、定期組織開展專題數據線上線下展覽等等,建立用戶反饋機制,完善高校檔案服務體系。
高校檔案館應當進一步引進相關優秀的平臺建設的技術,圍繞高校檔案數據的周期以及數據可視化等提高數據分析處理的能力,打造適合高校檔案館建設發展的大數據服務平臺和服務體系。比如目前比較知名的大數據分布處理平臺Hadoop,該平臺是基于Google的大數據算法發展而來的,是一種分布式計算數據的結構框架。對于高校檔案而言,這種大數據處理平臺既滿足了高校檔案的數據存放的要求也滿足了大量半結構化數據處理的需求,是一款性能較好的數據處理平臺。高校檔案館可以引進類似的系統軟件,為高校檔案館的服務平臺提供數據分析的支撐,更好地將高校檔案中的半結構化和非結構化數據分門別類地進行整合和分析,建立起完善的信息資源體系。
鑒于各高校的實際情況的差異,資源共享在實際的操作當中存在很大的困難,高校使用的信息系統之間的交互性和融通性較差,并且高校檔案信息資源的異構化嚴重,高校檔案的信息化建設缺乏統一的規范和標準,出現了各自為政的現象,也造成了難以跨越的信息鴻溝。相關部門應該及時出臺相關的標準和規范,來約束信息資源的建設和管理,以避免出現盲目建設、建設投入大效果差的情況。其次,高校檔案館之間應加強館際合作,建立更加集約化和標準化的資源共享平臺,打破信息孤島現象,解決信息資源過于分散且價值密度較低的問題。
大數據技術是信息時代的產物,推動著高校檔案走向更加智能化的發展道路,基于時代背景下對高校檔案服務進行研究,能夠為高校檔案館的發展帶來更多的機遇與挑戰。高校檔案館本身作為數據的產出者,其數據的價值就在于與不同數據之間搭建新的聯系。推動高校檔案服務體系的建設,是高校檔案館發展的必要之路。