楊明
(四平市鐵西區平西鄉人民政府計劃生育指導站,吉林 四平 136000)
探討大數據時代背景下的檔案管理模式
楊明
(四平市鐵西區平西鄉人民政府計劃生育指導站,吉林 四平 136000)
文章首先討論了在數據時期的背景下,檔案館融入智慧城市的建設、電子文件的管理、檔案數據的存儲與備份、檔案館加入政府 2.0的建設、檔案管理工作從實體管理上升到常識管理等方面都需要引入大數據技術;其次,介紹了檔案管理中的大數據應用;最后總結了在大數據時代下對我們是機會也是挑戰
大數據;檔案管理;需要方法
(1)檔案館深入智慧都市需要大數據技術。2012年2月20日,住房和城鄉建設部公布了首批91個智慧都市試點,這個由國家統一監督和指導的都市建設正式起航。要建設智慧城市,應該做到“節省能源加重信息傳播”、“重視信息減少災害”和“利用信息幫助群眾”這幾點。一個永久保存檔案并提供檔案為社會服務的科學文化事業機構的檔案館,里面儲存著很多的檔案,這里是信息匯聚的地方,但是由于人力資源稀少、技術不成熟等原因,使這些信息沒有得到合理的運用。智慧都市的開展成為了對檔案資源開發和運用的大好時機,一個可以深入到城市中并變化形象的機會。智慧都市需要信息的運用,要想深入到城市中去就要好好地使用這些數據,使智慧都市出現數據流,為上到高層,下到小民去運用,要使整個檔案館的信息發出新的活力,找到其中所具有的無比財富,單單依靠人力是不可能實現的,一定得是技術,所以大數據處理技術是必須之選。
(2)對數據的管理需要大數據技術。在這個時期,儲存文件的數量已經堆積成山,儲存文件的去向成為了一個大問題,人們只知道這些儲存文件中有許許多多的商機,同時也知道要從堆積如山的文件中得到財富是何等的艱難。對于這些如山的儲存文件,人們一直推舉的“直接鑒定法”將會有很大的危機,在去一件件找尋信息根本不可能。直到后來有人總結出了比較類似的方法,就是從整個文件中找到有價值的東西,進而就避免了對人力的浪費。從這個方向看,在確定這個儲存文件的管理權以后,就可以對這個類型的儲存文件進行篩檢,但這僅僅是儲存文件的第一步,在今天的配置下,篩檢這些十分簡單,問題是怎么很快的從這些如山文件中找出需要的文件;以及怎么樣給他們分類;怎樣鑒定那些文檔是有用的;怎樣從中找到人們所需要的。
要想解決上述提出的問題,檔案工作者要在管理方面下功夫,技術方面也不能落后。大數據技術就是技術的一個更新。將人們發明的新硬件安裝到以前的版本上,這樣可以收集到新的儲存文件,這個可以達到每天TB甚至是向PB數量級增長,大數據軟件可以在這些如山的儲存文件中建立索引。
(1)新時期儲存文件的備份離不開大數據。大數據有好多分類,其中有結構化數據、半結構化數據和非結構化數據,現在的互聯網出現了非結構化數據增長十分快速的特征,到2012年的年末,非結構化數據已占到整個數據的70%以上,同時,由于數據顯性或隱性的網絡化存在,讓儲存文件間的聯系一直無處不在。一直以來,人們整理儲存文件一直是關系型的,其中代表的有IOE(I指IBM的服務器,O指Oracle的數據庫,E指EMC的存儲模式)模式,檔案行業也一樣,可是在現在的形勢下,IOE模式已經落后了很多。大數據模式除了有龐大的規模之外,還有這如山的文件數量,這是文件系統及原數據管理的一大難題,一旦處理不當,就會影響到很多方面。對于這些成長迅速的非結構化文件,進行儲存文件整理時就處處困難,而在大數據庫的基礎上,像SQL這些已經可以完成關系數據,更別說是空間數據、圖像、數據流等非結構化數據,而且基于對象的存儲架構可以在一個系統中管理十億級別的文件數量,減少很多不必要的麻煩,大數據技術給文件管理這一問題提供了一個很好的處理辦法。
檔案數據庫的應用大大提高了館員的工作效率,但是在這幾年,館員在利用檔案數據庫的過程中,經常會遇到不能給數據庫中添加新的儲存數據的情形,這就是之前所遇到的的“脹庫”現象,這是因為庫房的容量不足造成新的檔案儲存不到庫中。根據新聞報道,從2013年6月至2014年2月八個多月的時間中,香港政府所處理的紙質信息堆起來的高度超過了24163m),這好比46個環球貿易廣場首尾相接壘起來那么高,香港方面沒有一個法律來說明不能這樣做,所以官員們可以隨便燒毀文件。人們在為這些有可能存在著財富的文件被銷毀而默默心疼時,同樣也被政府能夠制造這么多文件給震驚到了,如果可以把這部分文檔進行分類并儲存的話,那樣產生的數據數量將是十分巨大的。在檔案信息化越來越完善的今天,并伴隨著大數據的出現,檔案數據庫的內存已經遠遠不夠。想要儲存如山的文件并保證其安全,不能只是不斷的建設大樓修建機房,再說,檔案數據還要有備份這也需要大量的儲存空間。這讓檔案館不得不改善儲存、增高效率和節省成本,和其他的電信行業、通訊行業、電子商務、微博運營等行業面對的內存不足問題相比,檔案行業所需要的儲存空間就不值一提了。通過調查一些大公司,如中國移動、騰訊、百度、阿里巴巴等,可以發現這些公司都是大數據應用的佼佼者,這又從另一個方面說明了大數據的應用已經開始成熟,說明了大數據儲存可以解決空間問題,這些公司對大數據的使用經驗可以被借鑒和運用。
(2)加入政府2.0的修建離不開大數據技術。政府2.0是政府在處理政務上一個很大的創新,它可以直接對話群眾,從“閉關鎖國”的結構逐漸走向一個開放、共贏、互動的結構,政府2.0可以對政務更高效率的進行處理,讓政務人員可以在別的地方找到自己想要的消息。檔案館是一個非官方的機構,最基本的作用就是提供檔案讓人們所運用,建設政府2.0離不開檔案館,而現在每一個檔案館之間所用的檔案管理系統都不太一樣,檔案信息七零八散的分布在各個檔案館之間,檔案部門和政府之間也完全沒有建立起溝通。隨著大數據技術逐步繁榮,即使不在一個部門,不在一個區域,也能實現信息的共享,這大大提高了人們對儲存文件的利用。
(3)檔案工作從實體轉型到知識離不開它。如今人們想要的不僅僅是如何使用這些儲存文件,更多的是想要知道儲存文件背后的一些事和其中所藏著的東西,所以,對檔案的利用也轉變成了為人們提供便利。一個好的處理核心可以說是檔案服務的技術核心,也是儲存文件的一大幫手,可以為人類創造更大的收益,發掘一些以前人們看不到的財富,是人類在大數據上走得更遠的一個碣石。
大數據時代的來臨,可以說是對檔案工作管理者的一個挑戰,然則更大的是機遇。隨著大數據技術的一步步成長,大數據一定會有更為寬大的平臺,檔案管理將在大數據時代涅槃重生,儲存檔案中所含有的巨大財富和知識將會真正的為人們所利用。
Exp loration of Archives M anagement M ode in the Age of Big Data
YANG M ing
(Family Planning Center of Pingxi Township People's Government in Tiexi District
of Siping City,Siping,Jinlin 136000,China)
This paper first discusses under the background of big data,integration of archives in the smart city construction, managementofelectronic documents,storage and backup of records data,construction ofarchives into government2.0 construction,filemanagementhave transformed from entitymanagement to common knowledgemanagement,which need to introduce big data technologies;secondly,this paper introducesbig data applications in filemanagement;finally,itsummarized in that the era of big data isboth opportunity and challenge forus.
big data;filemanagement;approach
G270.7
A
2095-980X(2016)11-0150-01
2016-10-07
楊明(1969-),女,吉林四平人,助理館員。