□ 北京 管 博
“大數據”是人們描述和定義信息爆炸時代產生的海量數據提出的新概念。大數據概念誕生于計算機行業中,是有影響力的技術革命。如今,大數據的價值已被大眾所認可,大數據技術正在逐步走進各行各業中。企業可以通過對數據的分析,挖掘出其中的價值,成為其戰略決策、科研生產的重要依據。企業在生產發展過程中產生了大量的原始檔案,這些原始檔案中蘊藏著寶貴的信息,擁有一定的價值,是無形的財富。如何應用大數據技術將這些價值挖掘出來,并以一定的形式加以應用,是我們值得思考的問題。
企業檔案編研是將零散的文件材料通過收集、歸納、整理、摘編、分析等步驟將檔案信息發掘出來,形成企業檔案編研成果,將靜態的檔案資源轉化為動態的、可供利用的信息資源的加工制作過程,是企業檔案資源開發利用的一種有效途徑,充分利用好這些豐富的檔案資源,發掘檔案資源的價值,加強企業檔案編研,有利于企業的發展。大數據是有影響力的技術革命, 企業檔案編研是企業檔案資源開發利用的一種有效途徑,將兩者結合起來,具有重要意義。
大數據指的是大小超出常規的數據庫工具獲取、存儲、管理和分析能力的數據集。大數據是云計算、物聯網之后IT行業又一大顛覆性的技術革命。大數據并非單指海量的數據,它更是一種新的思維方式,即“在多樣的或大量的數據中迅速獲取信息的能力”。大數據包含5個特征:第一,數據體量巨大。指收集和分析的數據量非常大,從TB級別,躍升到PB級別,但在實際應用中,很多企業用戶把多個數據集放在一起,已經形成了PB級的數據量。第二,處理速度快,需要對數據進行近實時的分析。第三,數據類別大,大數據來自多種數據源,數據種類和格式日漸豐富,包含結構化、半結構化和非結構化等多種數據形式,如網絡日志、視頻、圖片、地理位置信息等。第四,數據真實性。大數據中的內容是與真實世界中的發生息息相關的,研究大數據就是從龐大的網絡數據中提取出能夠解釋和預測現實事件的過程。第五,價值密度低,商業價值高。盡管大數據的價值密度不高,但是能從中挖掘出含金量更高的價值。無論是商業、經濟或其他諸多領域中,管理層的不少決策與方案確定均是通過挖掘大數據中的有用信息而定的,這就是大數據的價值所在。
企業檔案編研工作是為了滿足企業生產經營和管理活動的實際需要,選定特定的專題和題目,對企業檔案信息進行分析和綜合,形成二次、三次企業文獻的一項檔案業務工作。企業檔案編研是企業檔案開發利用的重要形式和途徑。通過編研,可以圍繞某一個專題,全面、綜合地反映與之有關的事實、數據、取得的成果,以及產生的經濟效益和社會效益,集中體現一個企業在技術、市場等方面所取得的重要成就,有利于宣傳企業,提升企業的社會知名度。通過編研,還能夠提高企業檔案工作者的業務水平和知識水平,有助于發現企業檔案管理中的漏洞和問題,及時糾正和解決。
中共中央辦公廳、國務院辦公廳在《“十四五”全國檔案事業發展規劃》中提到推出一批主題鮮明、內容豐富、形式多樣的編研成果,推進數字化、網絡化宣介展示,生動反映新時代取得的歷史性成就,展現中國力量、中國精神、中國效率。同時還提及加大檔案資源開發力度。統籌館(室)藏資源,積極鼓勵社會各方參與,圍繞重要時間節點、重大紀念活動,通過編研出版等方式,不斷推出具有廣泛影響力的檔案文化精品。開展全國性檔案開發利用優秀成果征集活動,集中展示推薦優秀檔案開發利用成果。加強檔案文化創意產品開發,探索產業化路徑。基于這些要求,企業檔案編研的價值主要體現在以下幾個方面。
1.促進企業發展。企業在發展過程中通過歷史來指明發展方向。企業自身形成的檔案是企業在各項活動中形成的歷史記錄,起著不可或缺的參考和憑證作用。通過對企業過往的分析,總結歷史經驗,得出帶有前瞻性的結論,可促進企業的發展。
企業檔案編研工作能為企業提供決策支撐作用。企業檔案信息資源的數據具有真實性和可靠性,它能夠對企業在發展過程中起到有針對性、有目的性的指導,從而減少企業決策失誤。看似零散孤立的文件資料里面實則蘊藏著潛在的企業發展規律,充分利用這些檔案資源,綜合各方面的數據信息,發掘其中蘊藏的潛在規律,能夠為企業的發展提供決策支持,厘清發展思路,為今后的發展和規劃提供方向和目標。
2.傳播企業文化。一個企業能夠長久地發展,就要有自己特色的文化并一脈相承。企業檔案是企業文化的真實記錄,管理好檔案是保護好企業文化的重要工作。檔案編研工作可以記錄企業的發展歷史,通過歷史展現企業文化并傳承下去,對內可以增強員工的凝聚力、自豪感、責任感和使命感,對外可以顯示企業核心文化價值,提升企業的知名度。
反映一個企業發展歷史的檔案編研成果能夠使企業人員回顧歷史,了解過去,珍惜現在,展望未來,以更加熱情的姿態投入到企業未來的發展中。檔案館作為宣傳陣地的中堅力量,可充分利用企業檔案文件資料,對企業發展歷程進行總結和梳理,形成企業發展歷程檔案編研成果,使企業人員了解企業的發展歷史,重溫前輩們的奮斗歷程,珍惜現在優越的生活條件,激發大家干事的奮斗激情,營造良好的、積極熱情的工作氛圍。
3.宣傳檔案工作。檔案工作在企業的發展過程中雖不是主營業務工作,但也是不可或缺的。當企業遇到戰略決策、財務分析、法律援助等一系列問題時,都需要查閱原始檔案來核實,檔案的重要性不言而喻。檔案編研將零散的信息整合并加工,其成果的價值大于零散檔案的價值,幫助企業更好地認識檔案工作對企業發展的重要作用,為企業檔案工作贏得更多的認同與支持。
目前在企業檔案工作中,檔案編研意識弱,編研人員精力和能力有限,檔案編研成果少,類型單一,檔案深層次開發意識不強,檔案編研的專業素質有待提高。
檔案編研包含兩方面,一是“編”、二是“研”。“編”是把檔案原始信息進行簡單地整理,編寫起來較為簡單,耗時短,所需精力相對較少。“研”是通過對原始信息的分析,以不同的體例將內容表達出來,編寫起來較為復雜,耗時多,所需精力相對較多。當前的檔案編研工作大多數方式是以“編”為主,“研”的成分較少。檔案編研成果形式大多為資料性匯編、摘編、匯集等,服務形式單一,沒有深度挖掘、分析、研究檔案資料。有的檔案編研成果是為“編”而“編”,而不是為“用”而“編”,編寫后利用率低,往往保存在庫房中束之高閣,其現實意義和經濟價值得不到充分體現。
檔案編研工作是一項腦力勞動,檔案編研成果的質量一是取決于材料的本身,二是取決于編研人員的水平,所以要增強編研隊伍的力量。編研隊伍素質的提高要吸納高學歷高素質人才,并結合當前以大數據技術為主的新興技術有針對地進行培訓,使人員掌握新技術應用手段。傳統編研成果載體主要以紙質為主,應多結合新媒體技術,豐富編研形式。
隨著社會變革和企業機構改革的不斷深化,檔案工作也隨之發生改變。企業對檔案工作的需求越來越強,提出了更高的要求和更加精細化、科學化的目標。檔案部門要充分利用大數據時代的技術優勢更好地開展檔案工作,充分發揮檔案資源的作用。檔案編研工作是針對用戶的需求,劃定匹配的檔案范圍,提取原始檔案信息并將其加工、研究、輸出,形成檔案編研成果為用戶提供服務的工作。大數據時代下,對信息資源的開發利用能力已經成為企業競爭力的重要體現,大數據技術與企業檔案編研工作相結合勢在必行。大數據技術是現代社會處理資料挖掘信息的新方法、新手段。在企業檔案編研工作中,如何用大數據技術對檔案進行深度的開發,從中挖掘出對現實、對歷史、對社會有重要意義的內容,成為發揮檔案作用的一個新方向。
1.推動企業檔案數字化發展。大數據時代的到來促進著檔案工作模式的創新。檔案數字化工作日益興起,它已成為檔案館由傳統檔案館步入數字檔案館的基礎,檔案工作效率的提升以及管理的規范化離不開數字檔案館的支撐。隨著現代信息化及網絡化進程的不斷深入,檔案信息資源的數字化工作不斷推進,應充分利用其技術優勢和人員素質優勢,不斷推進檔案信息化工作的開展,努力提高檔案資源信息化管理水平和檔案資源數字化水平。
2.提高企業檔案編研效率。大數據技術提高了原有數據處理的效率,可以及時利用挖掘的信息開展編研工作,避免因加工周期過長而降低信息的價值。大數據時代使得檔案信息快速的收集、整理、加工變為現實,這一環境下,檔案電子編研更能滿足當前企業發展的新形勢。大數據技術與企業檔案編研工作的結合為檔案編研工作人員提供了一種新的思路,利用大數據技術可使檔案編研工作從全人力加工轉化為半自動化生成。首先從企業大量的數據中提取出有價值的信息,再對其進行分析、加工,最終形成編研成果。此成果的形式不再局限于紙質載體,利用電子載體形式可使其傳播范圍更廣泛,影響力更大,從而實現深層次、多元化、實用價值高的開發編研。
3.拓寬企業檔案編研平臺。企業檔案工作已逐步向數字檔案館轉型,檔案數字化加工是轉型期的基礎工作。隨著檔案數字化加工的開展,企業積累的數字化檔案信息日益增多,各單位、行業間的聯系也不再受時間、空間的限制,數字檔案信息資源可在允許的條件下相互共享,有助于聯合編研。而且,數字檔案編研成果便于用戶的查詢與利用,提高檔案利用效率,加快推進工作進程。
1.對企業數據進行分析,開展深度檔案編研。大數據技術有利于對企業數據等信息進行綜合分析,深度挖掘檔案數據的價值,開展企業深度檔案編研工作。隨著大數據技術的廣泛應用以及企業對檔案工作的日益重視,部分企業已經開始利用云計算、數據挖掘等先進大數據技術,創新性地形成電子編研成果進行展示。企業將檔案中的文字、照片、視頻等信息進行融合,利用電子圖冊、新媒體技術等進行展現,全方位地展示企業概況、歷史沿革等內容;將業務方面的數據通過時間線貫穿起來,建立對比表、增量圖等統計分析圖表,為企業領導決策提供依據,為部門管理提供信息支持,充分實現企業檔案的價值。這種簡單方便的電子編研成果,通過檔案管理系統進行在線展示,打破了時間和空間的局限性,開創了檔案開發利用的新模式。大數據技術的發展使得數據分析能力得到極大提升,將大數據技術應用于企業檔案編研中,利用大數據技術對檔案利用規律、檔案內容信息、各類檔案數量信息等進行分析處理,能夠發現其中的規律,為總結各項工作發展趨勢,發現工作中的問題,尋找解決思路等工作提供強有力的支撐。
2.依據用戶需求,有針對性地開展檔案編研。大數據技術,是從各種類型、未經加工的海量數據中快速獲得有價值信息的技術。目前,數據采集、數據存儲、數據處理和數據呈現等技術的快速發展更好地推動了大數據的發展。大數據處理的關鍵技術主要有:大數據采集、大數據預處理、大數據存儲及管理、大數據分析及挖掘、大數據展現和應用(大數據檢索、大數據可視化、大數據應用、大數據安全等)。大數據技術中的數據分析及挖掘技術,可有助于固化編研模式,完成電子編研成果的展示。數據挖掘就是從大量的、未經加工的、隨機產生的、并不精確的實際應用數據中,找到潛在的、從表面發現不了的但又極可能具備利用價值的信息和知識的過程。數據挖掘可以從用戶的訪問歷史中,判斷出用戶的興趣愛好,相應地推薦其有可能感興趣的檔案信息,類似于微博、抖音等新媒體中給用戶推送感興趣內容的方式。企業可以對用戶歷史借閱記錄、查詢記錄進行統計,分析用戶的查詢習慣、重點關注的內容、借閱檔案頻率等信息,針對用戶的喜好、需求對檔案數據進行電子編研,并主動推送給用戶利用。數據挖掘還可以根據用戶的需求,針對性地選取所需數據,并加以分析歸納,呈現出綜述、分析報告等形式,作為電子編研成果,提供給用戶決策參考。
在大數據技術不斷進步的背景下,衍生出各式各樣的數據處理庫和軟件,能夠有效實現對海量信息的處理。企業應充分認識到大數據技術的優勢,并積極進行應用,不斷提高企業檔案編研工作的效率,從而創新其工作模式和方式,促進自身的可持續發展。檔案編研本質上是對檔案信息的分析、整理和再加工,是對原始檔案的開發與利用,對于企業甚至行業的影響,在戰略決策、信息支撐等方面都起到一定的作用。傳統的檔案查詢方式耗時長,效率低,難以既全面又準確地找到對企業有價值的信息,大數據技術的引進對挖掘海量信息價值提供了良好的契機與支持。我們需要正確認識到應用大數據技術開展企業檔案編研工作的必要性及其重要價值,積極探索檔案編研管理的信息化、科技化和數字化的發展軌道,為企業縱深發展提供重要支撐。
大數據時代為檔案編研工作提供了先進的工具和技術手段,在社會檔案意識不斷增強的環境中,檔案人員應順應時代的發展趨勢,具有“大編研”的意識。檔案人員可以充分地利用大量、豐富的檔案信息,利用各種數據分析方法,找出信息之間的關系,發掘出其潛在的價值,做出精品編研成果。