趙 瑾
(山東省海河淮河小清河流域水利管理服務(wù)中心,山東 濟南 250100)
在我國,水利事業(yè)單位主要負責(zé)的是以水利為服務(wù)目標(biāo)的相關(guān)事情,其檔案工作則與水利事業(yè)涉及的各類資料、信息、數(shù)據(jù)有關(guān)。具體來講,水利事業(yè)單位檔案涉及的檔案資料主要包括:水利工程全生命周期中產(chǎn)生的各類資料,包括工程勘察、設(shè)計、施工、運行管理、工程改造、工程拆除等;與水利事業(yè)相關(guān)的科研、教學(xué)、水政、水法資料;開發(fā)利用及保護水資源工作中產(chǎn)生的資料等。可以看出,水利事業(yè)單位檔案涉及的檔案資料與我國社會、經(jīng)濟、民生發(fā)展都有重要關(guān)系,其工作質(zhì)量與水利事業(yè)單位“興利除害”的核心價值直接相關(guān)。近年來,計算機軟件、數(shù)字化、信息化等技術(shù)快速發(fā)展,我國各事業(yè)單位也在逐步推進信息化、數(shù)字化改革工作,并取得了一定成果。
山東省水文中心通過十余年的數(shù)字化建設(shè)工作,目前取得了如下成果。其一,針對日照、臨沂、威海等城市超過50萬頁的紙質(zhì)降水記錄進行數(shù)字化,提取了超過2.5億條降水?dāng)?shù)據(jù),并將其錄入全國水利系統(tǒng)之中,形成了我國最早的高質(zhì)量分鐘降水?dāng)?shù)據(jù)集。其二,構(gòu)建了相對成熟的水文資料檔案管理系統(tǒng),并配備了比較先進的關(guān)系型數(shù)據(jù)庫及非關(guān)系型數(shù)據(jù)庫。其三,編制了《非結(jié)構(gòu)化水文資料數(shù)據(jù)庫結(jié)構(gòu)標(biāo)準(zhǔn)》《降水自記紙記錄數(shù)字化規(guī)范》等標(biāo)準(zhǔn)型文件,為該單位后續(xù)工作乃至其他地區(qū)相關(guān)單位的數(shù)字化工作提供了參考。其四,結(jié)合實際編制了數(shù)字化檔案編號及文件命名規(guī)則,對超過55萬個水利電子文件進行了規(guī)范化命名,完成了電子和紙質(zhì)檔案的雙套制歸檔工作。其五,構(gòu)建了包括水文論文數(shù)據(jù)庫、分鐘降水?dāng)?shù)據(jù)庫在內(nèi)的多個水利事業(yè)工作分項數(shù)據(jù)庫[1]。
從水利事業(yè)單位檔案工作內(nèi)容來看,其主要是為事業(yè)單位水利工程建設(shè)、勘察、科研、水文環(huán)境保護等工作提供重要參考,同時反映水利工作成果,為工作改良、創(chuàng)新提供依據(jù)。近年來,水利事業(yè)單位相關(guān)專業(yè)發(fā)展迅速,國家對其工作質(zhì)量的要求更高,意味著檔案工作涉及的檔案資料體量和復(fù)雜程度都在不斷提升。從另一個角度來講,如今信息化、數(shù)字化技術(shù)發(fā)展迅速,各領(lǐng)域為了有效提升工作效率、適應(yīng)社會發(fā)展趨勢,都在從技術(shù)和管理兩個角度推進數(shù)字化創(chuàng)新。具體來講,推進水利事業(yè)單位檔案工作數(shù)字化創(chuàng)新有以下幾方面意義。其一,改良工作方式,提高工作效率。顯然,水利事業(yè)單位的檔案工作涉及的管理對象是十分復(fù)雜的,面對大量不同類型的資料、信息、數(shù)據(jù),單純依靠人員進行管理不僅效率低,而且也容易出現(xiàn)紕漏。而通過利用計算機軟件、數(shù)據(jù)庫,可以全面改良檔案工作方式,實現(xiàn)對檔案基礎(chǔ)工作的自動化處理,促進管理效率的提升。其二,創(chuàng)新管理機制,提升檔案資料價值。當(dāng)數(shù)字化達到一定程度,水利事業(yè)的大數(shù)據(jù)體系就此建立,這將有助于水利事業(yè)單位進一步做好檔案資料數(shù)據(jù)價值的挖掘工作,對提高工作水平有積極意義。其三,有助于建立可持續(xù)化的水利事業(yè)工作機制。從水利事業(yè)單位的工作內(nèi)容來看,檔案工作的關(guān)鍵價值在于對各時期的重要資料、數(shù)據(jù)進行儲存,并在某個時刻提供給相關(guān)部門、技術(shù)人員使用。相較于傳統(tǒng)基于人工的實物化儲存管理機制,數(shù)字化的檔案管理有助于建立可持續(xù)、標(biāo)準(zhǔn)化的水利事業(yè)檔案工作機制,降低水利事業(yè)單位在信息溝通、人才培養(yǎng)、技術(shù)升級等方面的投入,促進行業(yè)可持續(xù)發(fā)展[2]。
數(shù)字化是當(dāng)前時代發(fā)展背景下的大勢所趨,但是在進行數(shù)字化建設(shè)及創(chuàng)新的過程中,需要建立科學(xué)的數(shù)字化認知,確保數(shù)字化方式符合實際。但是部分水利事業(yè)單位在數(shù)字化過程中,簡單認為數(shù)字化就是將原有紙質(zhì)檔案轉(zhuǎn)化為電子檔案即可。事實上,對實物信息的數(shù)字轉(zhuǎn)化僅是數(shù)字化最為基礎(chǔ)的工作,在如今的技術(shù)背景下,檔案工作的數(shù)字化需要從數(shù)字化機制構(gòu)建,到數(shù)字化技術(shù)應(yīng)用等角度投入大量的研究精力。一些單位由于在這方面存在認知偏差,導(dǎo)致在檔案工作數(shù)字化中的投入不足,進而導(dǎo)致其數(shù)字化檔案工作長期停留在初期階段。值得一提的是,也有部分水利事業(yè)單位檔案工作者受到傳統(tǒng)思維的影響,不愿意花費成本和精力去學(xué)習(xí)數(shù)字化知識,在檔案儲存及管理中依然側(cè)重于實物端,導(dǎo)致數(shù)字化進程較慢。
水利事業(yè)單位涉及的檔案資料、信息、數(shù)據(jù)具有名目眾多、體量巨大、復(fù)雜程度高的特點,意味著在數(shù)字化過程中對數(shù)據(jù)庫的建設(shè)要求較高[3]。但是,部分單位在進行數(shù)字化建設(shè)時,出現(xiàn)數(shù)據(jù)庫硬軟件選擇不合理的情況,為后續(xù)的檔案工作的數(shù)字化管理埋下了隱患。部分地區(qū)的水利事業(yè)單位數(shù)字化技術(shù)資金、技術(shù)投入側(cè)重于前段管理,相對滯后的數(shù)據(jù)庫建設(shè)影響了數(shù)字化工作的有效開展。值得一提的是,目前很多水利事業(yè)單位的數(shù)字化數(shù)據(jù)庫建設(shè)存在一定技術(shù)壁壘,導(dǎo)致信息孤島問題的出現(xiàn),不僅影響了相關(guān)單位之間的信息溝通,對我國水利事業(yè)的遠期發(fā)展也不利。
水利事業(yè)單位檔案工作數(shù)字化的主要目標(biāo)是,通過利用數(shù)字化技術(shù)提升工作效率,以及進一步挖掘檔案的價值。目前部分單位雖然針對檔案工作數(shù)字化投入了一定的硬件、軟件,但是由于在數(shù)字化應(yīng)用及人才培養(yǎng)方面的投入較少,導(dǎo)致檔案工作的數(shù)字化應(yīng)用水平較低。比如,在水利檔案資料的歸檔管理中,相關(guān)人員依然沿用傳統(tǒng)紙質(zhì)化檔案管理的名錄、命名方式,沒有對數(shù)字化歸檔及查閱功能進行科學(xué)應(yīng)用,導(dǎo)致數(shù)字化技術(shù)的應(yīng)用價值沒有被發(fā)揮出來。再比如,在大數(shù)據(jù)背景下,水利事業(yè)單位的大數(shù)據(jù)機制構(gòu)建相對滯后,無法對大量檔案數(shù)據(jù)進行快速篩選和分析,得出有價值的結(jié)論。
作為管護社會發(fā)展、民生工程及生態(tài)可持續(xù)發(fā)展的重要工作,水利事業(yè)單位的檔案管理需要時刻加強對檔案資料及關(guān)鍵信息的保護。相對于傳統(tǒng)的紙質(zhì)化管理形式,檔案管理數(shù)字化的優(yōu)勢和風(fēng)險并存。優(yōu)勢方面在于目前數(shù)字化檔案工作涉及的權(quán)限管理、密鑰管理技術(shù)相對成熟。但在檔案數(shù)字化儲存、傳輸過程中,也勢必會面對來自網(wǎng)絡(luò)病毒、黑客攻擊帶來的風(fēng)險,從一定程度來講,目前的數(shù)字化檔案管理安全風(fēng)險是比較大的,部分水利事業(yè)單位在數(shù)字化檔案工作的技術(shù)投入和制度建設(shè)兩個方面存在一些不足,導(dǎo)致檔案數(shù)據(jù)安全面臨風(fēng)險。
水利事業(yè)單位的檔案工作數(shù)字化,對相應(yīng)專業(yè)人員的整體素質(zhì)要求較高。但是,部分水利事業(yè)單位對檔案數(shù)字化技術(shù)資源投入較大,卻忽略了對相關(guān)人才的引進和培養(yǎng)[4]。一方面,檔案人員的數(shù)字化檔案管理知識儲備、技能學(xué)習(xí)不足,直接影響了數(shù)字化水平;另一方面,單位其他人員缺少基本的數(shù)字化檔案意識和處理能力,無法配合檔案管理人員做好檔案資料的歸類處理。另外,水利事業(yè)單位人才培養(yǎng)機制的缺失,也影響了檔案工作的持續(xù)創(chuàng)新。
在水利事業(yè)單位的檔案工作數(shù)字化中,面臨的首要任務(wù)就是將傳統(tǒng)紙質(zhì)檔案資料轉(zhuǎn)化為數(shù)字資料。自20世紀(jì)50年代以來,山東省水文中心主要采用降水自記紙對降水記錄進行記錄,截至2020年,該中心保存的自記紙記錄超過100萬條。在確定數(shù)字化創(chuàng)新路線之后,山東省水文中心首先選擇了日照、臨沂及威海三個市的降水自記紙記錄資料,使用降水跡線識別軟件對自記紙上的坐標(biāo)值進行識別和提取,通過公式自動計算相應(yīng)的降水量。然后,使用文字識別軟件對三個試點城市的紙質(zhì)水文監(jiān)測資料進行識別,形成電子文件。在期間,通過多次識別,結(jié)合人工核對的方式,確保實物檔案數(shù)字化的準(zhǔn)確性[5]。
(1)針對虹吸雨量計記錄結(jié)果而制定的數(shù)字化規(guī)范。自20世紀(jì)50年代以來,我國各級水利事業(yè)單位技術(shù)部門采用降水自記紙對相關(guān)降水參數(shù)進行記錄和計算。但是受到不同地區(qū)復(fù)雜氣候、水文條件及技術(shù)應(yīng)用方式的影響,存在記錄標(biāo)準(zhǔn)不不統(tǒng)一、結(jié)果誤差大等問題。2014年水利部制定了《降水自記紙記錄數(shù)字化》國家標(biāo)準(zhǔn),對基于數(shù)字化的降水參數(shù)記錄工作提供了參考。結(jié)合多年的實踐應(yīng)用,水利部又對相關(guān)標(biāo)準(zhǔn)進行了細化,頒布了《降水自記紙記錄數(shù)字化規(guī)范》,作為中國水利學(xué)會的團體標(biāo)準(zhǔn)。該標(biāo)準(zhǔn)通過虹吸量對記錄進行訂正,將記錄的參數(shù)誤差控制在了2%以內(nèi),為水利系統(tǒng)降水自記紙記錄數(shù)字化打下了可靠基礎(chǔ)。
(2)基于非關(guān)系型數(shù)據(jù)庫構(gòu)建的數(shù)據(jù)庫建設(shè)標(biāo)準(zhǔn)。自水利事業(yè)檔案工作數(shù)字化建設(shè)工作開展以來,我國水利事業(yè)主管單位制定了一系列數(shù)據(jù)庫技術(shù)標(biāo)準(zhǔn)。其中,各級水利事業(yè)單位一般通過關(guān)系型數(shù)據(jù)庫對水利數(shù)據(jù)進行儲存。但是,隨著水利事業(yè)呈現(xiàn)多元化發(fā)展趨勢,業(yè)界出現(xiàn)了大量的非結(jié)構(gòu)化數(shù)據(jù),尤其是對在歷史水文數(shù)字化過程中產(chǎn)生的大量非結(jié)構(gòu)化數(shù)據(jù),急需要制定相應(yīng)的數(shù)據(jù)庫技術(shù)標(biāo)準(zhǔn)。為此,相關(guān)單位構(gòu)建了非關(guān)系型數(shù)據(jù)庫,突破傳統(tǒng)關(guān)系型數(shù)據(jù)表結(jié)構(gòu),可以對多類型、多格式水利事業(yè)資料進行識別和儲存。在這個過程中,《非結(jié)構(gòu)化水文資料數(shù)據(jù)庫結(jié)構(gòu)標(biāo)準(zhǔn)》應(yīng)運而生,不僅解決了當(dāng)下水利事業(yè)單位非結(jié)構(gòu)化數(shù)據(jù)的檔案化管理問題,同時也與水利技術(shù)的發(fā)展趨勢相匹配[7]。
(1)儲存。采用關(guān)系型和非關(guān)系型數(shù)據(jù)庫獨立建設(shè)的方式,分別識別儲存結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。將每條資料記錄分為兩個部分,其中關(guān)系型數(shù)據(jù)庫儲存檔案號、年度、命名、頁碼等,非關(guān)系型數(shù)據(jù)庫儲存水文資料文件以及從資料中抓取的關(guān)鍵詞、文件容量等,由關(guān)系型數(shù)據(jù)庫子記錄和非關(guān)系型數(shù)據(jù)庫子記錄組成該資料的完整記錄,兩者之間的數(shù)據(jù)交換由非關(guān)系型數(shù)據(jù)庫的訪問接口和JDBC實現(xiàn)。
(2)檢索。在檔案資料及信息檢索方面,關(guān)系型數(shù)據(jù)庫配置了目錄檢索、關(guān)鍵詞檢索功能;非關(guān)系型數(shù)據(jù)庫配置了同義詞檢索、全文檢索、二次檢索及布爾檢索等功能,同時兩者之間也存在檢索功能交互。
(3)統(tǒng)計分析。通過將搜索引擎集成在數(shù)據(jù)庫系統(tǒng)中,結(jié)合集成分析函數(shù)的應(yīng)用程序,實現(xiàn)對非關(guān)系型數(shù)據(jù)庫的統(tǒng)計分析;通過日期、時間、數(shù)值等標(biāo)準(zhǔn)化內(nèi)容,實現(xiàn)對關(guān)系型數(shù)據(jù)庫的統(tǒng)計分析。
綜上所述,在現(xiàn)代社會經(jīng)濟發(fā)展過程中,水利事業(yè)單位發(fā)揮著至關(guān)重要的作用。在信息化、數(shù)字化背景下,水利事業(yè)單位檔案工作在數(shù)字化方面雖然取得了一定成果,但是依然也存在一定的挑戰(zhàn)。為此,水利事業(yè)單位應(yīng)當(dāng)積極保持對數(shù)字化理念和方法的創(chuàng)新意識,結(jié)合水利事業(yè)的實際情況,對數(shù)據(jù)庫建設(shè)及數(shù)字化檔案管理的標(biāo)準(zhǔn)進行優(yōu)化,同時加強對相關(guān)人才的培養(yǎng),以滿足國家社會發(fā)展對水利事業(yè)單位的要求。■