摘 要:本文首先簡(jiǎn)要介紹大數(shù)據(jù)概念界定和特征,其次通過(guò)描述大數(shù)據(jù)背景下西部高校檔案工作發(fā)生的新變化,接著對(duì)當(dāng)前西部高校檔案工作的尷尬現(xiàn)狀進(jìn)行闡述,最后對(duì)此提出建議。
關(guān)鍵詞:大數(shù)據(jù);西部高校檔案;發(fā)展淺析
現(xiàn)今IT業(yè)發(fā)展之快令人應(yīng)接不暇,“大數(shù)據(jù)”技術(shù)橫空出世可謂炙手可熱,2013年甚至被稱(chēng)為“世界大數(shù)據(jù)元年”,開(kāi)辟時(shí)代新局面,賦予時(shí)代新內(nèi)涵。我國(guó)政府為搶占新一輪科技競(jìng)爭(zhēng)戰(zhàn)略制高點(diǎn),將大數(shù)據(jù)上升為國(guó)家戰(zhàn)略層面,戰(zhàn)略部署輾轉(zhuǎn)西部,隨之大數(shù)據(jù)滲透至各行業(yè),并成為迅猛發(fā)展的新動(dòng)能。步入“大數(shù)據(jù)”時(shí)代檔案行業(yè)應(yīng)如何適應(yīng)并借勢(shì)而上、立足潮頭?本文立足于“大數(shù)據(jù)”背景下,以國(guó)家大數(shù)據(jù)戰(zhàn)略為契機(jī),呼吁西部高校全面推行檔案信息化工作,利用“大數(shù)據(jù)”的優(yōu)勢(shì)充分挖掘有價(jià)值的信息,提高檔案管理工作效率,從而提升檔案服務(wù)質(zhì)量。
1 大數(shù)據(jù)概念界定與特征
(一)大數(shù)據(jù)概念界定
工信部在《2014年大數(shù)據(jù)白皮書(shū)》[1]中提出大數(shù)據(jù),源于2011年5月麥肯錫從經(jīng)濟(jì)和商業(yè)維度詮釋大數(shù)據(jù)發(fā)展?jié)摿Φ膶?zhuān)題研究報(bào)告:大數(shù)據(jù)指的是大小超出常規(guī)的數(shù)據(jù)庫(kù)工具獲取、存儲(chǔ)、管理和分析能力的數(shù)據(jù)集。[2] 維基百科釋義“大數(shù)據(jù)”,指所涉及的數(shù)據(jù)量規(guī)模巨大到無(wú)法通過(guò)人工在合理時(shí)間內(nèi)達(dá)到截取、管理、處理并整理成為人類(lèi)所能解讀的信息。[3] 大數(shù)據(jù)是一個(gè)總稱(chēng)性概念,它還可以細(xì)分為大數(shù)據(jù)科學(xué)、大數(shù)據(jù)技術(shù)、大數(shù)據(jù)工程、以及大數(shù)據(jù)應(yīng)用等不同領(lǐng)域。[4] 如IBM、Teradata和oracle等研究集中于大數(shù)據(jù)技術(shù)研發(fā),MIT(Massachusetts Institute of Technology,即麻省理工學(xué)院)Cal(University of California,Berkeley,即加州大學(xué)伯克利分校)這些高校大多聚焦于大數(shù)據(jù)科學(xué)研究,政府企業(yè)更倚重大數(shù)據(jù)應(yīng)用方面。雖然目前對(duì)大數(shù)據(jù)沒(méi)有很統(tǒng)一的認(rèn)識(shí),但多數(shù)比較認(rèn)同大數(shù)據(jù)是指對(duì)數(shù)量巨大、類(lèi)型繁多的數(shù)據(jù)進(jìn)行采集、預(yù)處理、存儲(chǔ)、分析,發(fā)現(xiàn)新的知識(shí),挖掘新的價(jià)值并應(yīng)用到實(shí)踐中,從而提高效率。
(二)大數(shù)據(jù)特征
2001年,高德納咨詢公司分析員Doug Laney在其研究演講中將數(shù)據(jù)增長(zhǎng)特性歸納為有三個(gè),分別是:量(Volume)即數(shù)據(jù)多少;速(Velocity)即資料輸入、輸出的速度;類(lèi)(Variety),即多樣性。在此理論基礎(chǔ)上,IBM提出大數(shù)據(jù)的4V特征,得到了業(yè)界的廣泛認(rèn)可。(1)Volume(數(shù)據(jù)量大),
每年數(shù)據(jù)量劇增,從PB到ZB數(shù)量級(jí)甚至更大,IDC的報(bào)告指出早在2013全球數(shù)據(jù)量4.4ZB;(2)Variety(數(shù)據(jù)類(lèi)型多),包括傳統(tǒng)的格式化數(shù)據(jù),以及來(lái)自互聯(lián)網(wǎng)的日志、視頻、音頻、圖片、地理位置信息等數(shù)據(jù)類(lèi)型;(3)Velocity)(處理速度快);(4)Veracity(真實(shí)性),即追求高質(zhì)量的數(shù)據(jù)。
大數(shù)據(jù)技術(shù)與傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)有著本質(zhì)的不同,它開(kāi)發(fā)數(shù)據(jù)網(wǎng)絡(luò)挖掘、特異群組挖掘、圖挖掘等新型數(shù)據(jù)挖掘技術(shù),從各種類(lèi)型的數(shù)據(jù)中快速獲得有價(jià)值信息,時(shí)間越長(zhǎng)大數(shù)據(jù)分析價(jià)值就越低,甚至失去意義。
2 大數(shù)據(jù)背景下高校檔案工作新變化
大數(shù)據(jù)滲透各個(gè)行業(yè)使得人們進(jìn)一步認(rèn)識(shí)關(guān)注信息資源,并且不斷從深度上挖掘,從寬度上拓展,實(shí)現(xiàn)利用最大化,高校檔案作為信息資源的重要組成部分,必然受到影響并已悄然發(fā)生新變化。
(一)高校檔案信息量急劇增長(zhǎng)
檔案是社會(huì)組織或個(gè)人在以往的社會(huì)實(shí)踐活動(dòng)中直接形成的清晰、確定的原始記錄作用的固化信息。在大數(shù)據(jù)背景下,高校學(xué)生的學(xué)籍、選課、成績(jī)、借書(shū)、上網(wǎng)、論壇、微博、教師的基本信息、上課課件和視頻、遠(yuǎn)程教育課程等都會(huì)產(chǎn)生大量數(shù)據(jù),同時(shí)還有設(shè)備、機(jī)房和圖書(shū)信息等也會(huì)產(chǎn)生大量數(shù)據(jù)。[5] 除人才培養(yǎng)方面意外,高校管理活動(dòng)、科研學(xué)術(shù)、社會(huì)服務(wù)等同樣也會(huì)產(chǎn)生大量數(shù)據(jù),這些數(shù)據(jù)量大,類(lèi)型多樣,來(lái)源分布廣,變化速度快,明顯具備了大數(shù)據(jù)特征。以貴州醫(yī)科大學(xué)(簡(jiǎn)稱(chēng)貴醫(yī))為例,
數(shù)據(jù)來(lái)源的主要渠道:(1)各類(lèi)網(wǎng)站。貴醫(yī)現(xiàn)有1個(gè)學(xué)校主頁(yè)網(wǎng)站,下設(shè)多個(gè)院系、黨群行政和直屬單位等二級(jí)網(wǎng)站;(2)各級(jí)管理系統(tǒng)。部分業(yè)務(wù)部門(mén)有自己的管理系統(tǒng),如辦公自動(dòng)化(OA)、教務(wù)、學(xué)生、財(cái)務(wù)、人事等系統(tǒng),每天都會(huì)產(chǎn)生大量的數(shù)據(jù);(3)科研數(shù)據(jù)。貴醫(yī)每年在科研中也會(huì)產(chǎn)生海量的實(shí)驗(yàn)數(shù)據(jù);(4)各類(lèi)媒體報(bào)道。在各個(gè)新聞媒體時(shí)有關(guān)于貴醫(yī)的報(bào)道。從上述幾個(gè)渠道產(chǎn)生的信息量大且種類(lèi)多,都具有一定價(jià)值,屬于歸檔范疇,可見(jiàn)高校檔案信息量與日俱增。
(二)高校檔案信息需求劇增
當(dāng)下高校檔案用戶信息需求呈現(xiàn)多元化的發(fā)展,包括教學(xué)、科研、校園文化等各個(gè)方面。隨著踐行“陽(yáng)光政府”信息公開(kāi),人們對(duì)國(guó)家的法律政策和學(xué)校的相關(guān)規(guī)定等需求不斷增加;隨著學(xué)校發(fā)展壯大,如今高校更加重視文化底蘊(yùn)的建設(shè),紛紛開(kāi)展諸如歷史、名人、校園文化等特色檔案,如貴醫(yī)2014年更名(貴陽(yáng)醫(yī)學(xué)院更名為貴州醫(yī)科大學(xué))期間,利用歷史檔案、名人檔案、特色檔案等總計(jì)600余次;時(shí)代在進(jìn)步用戶對(duì)高校檔案利用也提出了更高的要求,如近幾年的出國(guó)深造、移民等人數(shù)逐年增多,有學(xué)生要求檔案館出具中英文成績(jī)單及學(xué)籍證明,如貴醫(yī)2013-2015年期間,有此要求的次數(shù)分別是2次、8次、19次,逐年呈上升趨勢(shì)。可見(jiàn),大數(shù)據(jù)促使高校檔案數(shù)量增長(zhǎng),同時(shí)刺激用戶對(duì)檔案信息的需求類(lèi)型隨之提高。
(三)高校檔案信息價(jià)值提高
大數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘,首先需在從海量信息中,提取真實(shí)可靠有價(jià)值的信息。高校檔案是指高校從事教學(xué)、科研、管理等活動(dòng)直接形成具有保存價(jià)值的各種圖文、聲像等不同形式的記錄載體。正因?yàn)檫@類(lèi)信息資源最真實(shí)可靠、最具權(quán)威的特性,在進(jìn)行大數(shù)據(jù)挖掘和分析技術(shù)處理時(shí)比其他信息資源更具優(yōu)勢(shì)。
3 西部高校檔案工作面臨尷尬現(xiàn)狀
大數(shù)據(jù)背景下高校檔案信息量與日俱增、種類(lèi)繁多,傳統(tǒng)的檔案工作方式已無(wú)法適應(yīng)新的變化,實(shí)施檔案信息化建設(shè)迫在眉睫,然而西部高校檔案工作面臨尷尬的現(xiàn)狀很難跨越第一步。
(一)對(duì)檔案信息化建設(shè)工作重視力度不夠
高校普遍存在對(duì)檔案工作重要性認(rèn)識(shí)不夠,檔案工作未列入學(xué)校考核指標(biāo)范疇,因此對(duì)檔案工作缺乏指導(dǎo)、關(guān)注少,資金投入不夠、人員配置匱乏,從而導(dǎo)致檔案事業(yè)的發(fā)展滯后。西部高校財(cái)政本身的困窘,檔案工作專(zhuān)項(xiàng)資金更少,要實(shí)施檔案信息化建設(shè),需要必要的資金投入保障,用于檔案信息化的服務(wù)器、掃描儀等相關(guān)硬件設(shè)備高達(dá)數(shù)萬(wàn)元,檔案資料繁多外包成本高達(dá)數(shù)百萬(wàn)元,西部各高校檔案館每年可支配經(jīng)費(fèi)應(yīng)付日常開(kāi)銷(xiāo)尚且捉襟見(jiàn)肘,數(shù)百萬(wàn)資金望而卻步,人員嚴(yán)重匱乏情況進(jìn)行檔案信息化建設(shè)顯然是力不從心,如貴醫(yī)檔案館在編4人,在館檔案5000余份。
(二)檔案信息服務(wù)能力與方式滯后
檔案部門(mén)長(zhǎng)期習(xí)慣保管重于利用的工作方式,以文書(shū)管理為主;館藏結(jié)構(gòu)類(lèi)型單一;僅限為教職員工生服務(wù);用戶親自辦理相關(guān)審批手續(xù),程序較為繁瑣。部分西部高校沒(méi)有設(shè)立檔案館,檔案以科室隸屬于人事組織等部門(mén),查閱登記等還是手工方式,沒(méi)有引入檔案管理系統(tǒng),即使應(yīng)用該系統(tǒng)的高校也普遍存在以下問(wèn)題:1、在檢索上查全率和查準(zhǔn)率低,系統(tǒng)信息更新速度遠(yuǎn)遠(yuǎn)趕不上每日信息量。檔案利用常通常采用借閱、復(fù)印等形式,錄入系統(tǒng)的僅僅是簡(jiǎn)單的目錄,很難對(duì)檔案信息分析處理,更難挖掘出有價(jià)值的信息。如貴醫(yī)檔案館2013年成立,目前還沒(méi)有引入檔案管理系統(tǒng),還是傳統(tǒng)人工收集、整理、登記等工作方式。可見(jiàn),檔案信息服務(wù)能力與方式遠(yuǎn)遠(yuǎn)滿足不了大數(shù)據(jù)發(fā)展需求。
(三)檔案信息安全問(wèn)題凸顯
各類(lèi)信息資源在大數(shù)據(jù)背景下逐漸開(kāi)放和共享,同時(shí)給檔案信息帶來(lái)了安全隱患。西部高校進(jìn)行檔案信息化的為數(shù)不多,國(guó)家相關(guān)法律法規(guī)滯后于檔案信息化的發(fā)展,因此沒(méi)有統(tǒng)一標(biāo)準(zhǔn)進(jìn)行規(guī)范化控制,無(wú)法建立健全的檔案信息安全保障體系。如我國(guó)在上世紀(jì)90 年代初開(kāi)始信息化建設(shè),1999 年頒布《電子文件歸檔與電子檔案管理辦法》,直到2001 年才出臺(tái)《檔案管理軟件功能要求暫行規(guī)定》等。
大數(shù)據(jù)背景下西部高校檔案工作發(fā)展建議
在大數(shù)據(jù)背景下,西部高校檔案工作迫切需改變傳統(tǒng)的工作模式,充分挖掘檔案信息的價(jià)值,全面建設(shè)檔案信息化,改進(jìn)工作方式,以適應(yīng)大數(shù)據(jù)時(shí)代的發(fā)展要求。
(一)抓住發(fā)展機(jī)遇 加快檔案信息化基礎(chǔ)設(shè)施建設(shè)
西部高校檔案信息化建設(shè)的必要前提是大量資金支持,資金問(wèn)題一直是制約檔案工作發(fā)展的主要因素,因此檔案部門(mén)應(yīng)緊跟國(guó)家發(fā)展腳步,多方尋求支持,抓住發(fā)展機(jī)遇。五中全會(huì)公報(bào)提出實(shí)施“國(guó)家大數(shù)據(jù)戰(zhàn)略”,標(biāo)志著大數(shù)據(jù)戰(zhàn)略正式上升為國(guó)家戰(zhàn)略,我國(guó)政府為搶占新一輪科技競(jìng)爭(zhēng)戰(zhàn)的略制高點(diǎn),戰(zhàn)略部署輾轉(zhuǎn)西部,國(guó)家級(jí)首個(gè)大數(shù)據(jù)綜合綜合試驗(yàn)區(qū)落戶貴州,IBM在成都建立云計(jì)算大數(shù)據(jù)中心,騰訊云數(shù)據(jù)中心落地重慶,契合了西部高校檔案工作發(fā)展壯大的迫切實(shí)際需求,以此為依托爭(zhēng)取國(guó)家支持,全面實(shí)現(xiàn)檔案信息化,提升檔案利用價(jià)值。同時(shí),應(yīng)當(dāng)把檔案事業(yè)納入到學(xué)校整體發(fā)展規(guī)劃中,實(shí)時(shí)進(jìn)行監(jiān)督管理,給予必須的人財(cái)物等資源,為學(xué)校的檔案信息化建設(shè)堅(jiān)實(shí)后備力量。
(二)提高檔案工作服務(wù)能力與方式
挖掘檔案有價(jià)值信息,西部高校信息化起步晚,首先就得規(guī)范收集,在原有范圍基礎(chǔ)上,增加對(duì)人物、歷史、文化等類(lèi)型收集,
并且高校檔案工作須實(shí)時(shí)與各業(yè)務(wù)系統(tǒng)對(duì)接,確保電子文件的形成、運(yùn)行和歸檔過(guò)程真實(shí)可靠性。同時(shí)還要關(guān)注并主動(dòng)收集電視、互聯(lián)網(wǎng)等各種媒體上產(chǎn)生的檔案資源。搭建檔案管理系統(tǒng),確保該系統(tǒng)的擴(kuò)展性,服務(wù)器能承載巨大的數(shù)據(jù)量,檢索方式延伸至可以搭建內(nèi)容,確保該系統(tǒng)檢索功能良好。逐步開(kāi)展檔案信息加工服務(wù),針對(duì)用戶提出的需求,通過(guò)加工給予有價(jià)值的服務(wù),提升檔案服務(wù)質(zhì)量。對(duì)外經(jīng)濟(jì)貿(mào)易大學(xué)檔案館開(kāi)發(fā)了成績(jī)管理系統(tǒng),該系統(tǒng)能自動(dòng)翻譯學(xué)生成績(jī),并制作統(tǒng)一、規(guī)范的成績(jī)單等成品,實(shí)現(xiàn)檔案利用高效率,受到師大的好評(píng)也值得我們學(xué)習(xí)借鑒。
( 三 ) 加強(qiáng)檔案信息安全管理能力
大數(shù)據(jù)給檔案信息資源帶來(lái)隱患,西部高校檔案信息安全還是沿用傳統(tǒng)模式,因此要特別加強(qiáng)信息安全管理,構(gòu)建信息安全保障體系。首先檔案工作人員要樹(shù)立高度的責(zé)任感與安全意識(shí),認(rèn)識(shí)數(shù)據(jù)重要性并確保其安全、保密,這是任何預(yù)防任何隱患的必要前提。高校檔案部門(mén)從技術(shù)著手,通過(guò)設(shè)立多重不同密碼、全方位進(jìn)行監(jiān)控、網(wǎng)絡(luò)安全技術(shù)等嚴(yán)格控制訪問(wèn),加強(qiáng)隱私管理,保留檢索日志,避免檔案泄密;建立數(shù)據(jù)備份系統(tǒng)防止信息化資源被毀壞、遺失,實(shí)現(xiàn)信息化檔案異質(zhì)異地、隨時(shí)保存?zhèn)浞荨M瑫r(shí),高校檔案部門(mén)應(yīng)根據(jù)學(xué)校檔案工作發(fā)展實(shí)際需求,制定信息安全方面的規(guī)章制度,確保各項(xiàng)工作有章可循。
總而言之,西部高校檔案信息化較發(fā)達(dá)地區(qū)高校起步晚,發(fā)展緩慢。大數(shù)據(jù)時(shí)代到來(lái),不僅給傳統(tǒng)檔案管理工作帶來(lái)新的挑戰(zhàn)與機(jī)遇,以國(guó)家大數(shù)據(jù)戰(zhàn)略重心投入西部為契機(jī),贏得相關(guān)管理部門(mén)與學(xué)校的大力支持,結(jié)合實(shí)際做好統(tǒng)籌規(guī)劃,全面推動(dòng)實(shí)現(xiàn)高效檔案信息化的可持續(xù)發(fā)展,提升高校檔案利用。
參考文獻(xiàn)
[1] 工業(yè)和信息化部電信研究院.大數(shù)據(jù)白皮書(shū) [R].2014.
[2] James M, Michael C, Brad B. Big data: the next frontier for innovation, competition and productivity [R].McKinsey Global Institute.2011.
[3] 維基百科. 大數(shù)據(jù)[EB/OL],(2014- 02- 21)[2014- 02- 27]. http://zh.Wikipedia.org/wiki/大數(shù)據(jù).
[4] 黃欣榮.大數(shù)據(jù)時(shí)代的思維變革[J].重慶理工大學(xué)學(xué)報(bào)(社會(huì)科學(xué)).2014,(5):14
[5] 任祎.大數(shù)據(jù)時(shí)代下高校信息化建設(shè)思路探究 [J].電子測(cè)試,2014,(7):128-130.
作者簡(jiǎn)介
龍宛苡(1986-)女,苗族,貴州銅仁人,貴州醫(yī)科大學(xué)檔案館,助理館員。