張春艷 孫杰 蔡夢凡


【摘要】本文從大數據視角看海洋檔案發展,與傳統檔案對比,分析大數據背景下海洋檔案的新特點,發展原因,以及大數據技術在海洋檔案中的應用。
【關鍵詞】大數據;海洋檔案;發展;技術應用
一、大數據時代背景
計算機技術革命性地改變世界,全面融入社會生活,帶來的信息積累的速度和信息量爆炸式增長引發新的變革。“大數據”,順勢而生,它是具有更強的決策力、洞察力、流程優化能力、高增長率和多樣化的信息資產,同時具有容量大、多樣、快速、價值密度相對較低的特點。大數據技術在海洋領域的戰略意義不在于掌握的數據信息的數量,而是在于對這些有意義的數據進行專業化處理體現其價值。比如我們可以通過收集、分析歷年的海洋災情數據,包括臺風風暴潮、海浪災害等,并對數據進行比較分析,建立一個特定的數學模型,深入研究海洋災害歷史性影響范圍,為海洋防災減災提供輔助決策支撐。
二、傳統海洋檔案特點
(一)傳統海洋檔案來源有限。傳統的海洋檔案數據來源基本靠延遲歸檔的海洋檔案資料。這些資料主要來自日常的海洋行政管理和海洋業務工作包括海洋臺站觀測、船舶設備管理、船舶測報、海洋專題調查、海洋斷面調查、基本建設等。
(二)傳統海洋檔案載體單一。從國家海洋局兩次歷史檔案進館內容來看,紙質檔案占主導。東海區移交至中國海洋檔案館1965-2000年檔案中紙質檔案7500余卷。其中第一次移交進館的1965-1982年產生的檔案3400余卷,均為紙質檔案材料。第二次移交進館1983-2000年歷史檔案,紙質檔案約4100余卷,僅有少量的照片檔案,聲像檔案、史料檔案。
(三)海洋檔案類型固定。海洋檔案主要是在履行業務職能和承擔各類項目等活動中形成的科技檔案,以及在管理工作中形成的機關文書檔案。1965-2000年間產生的檔案多為海洋科技檔案。這些科技檔案中多數為海洋臺站觀測記錄,類型和格式都相對固定。
(四)傳統檔案數量增長穩定。通過國家海洋局東海分局(以下簡稱東海分局)兩次歷史檔案進館分析過去30年海洋檔案的增長速度:第一次檔案進館檔案海濱觀測和東海標準斷面調查分別為1779卷、230卷,與第二次進館數量對比2029卷、274卷相差不大,見“圖1”。
三、現代海洋檔案的發展
21世紀是海洋世紀,為了實現我國的“海洋強國”戰略,海洋科技實力不斷提高,海洋檔案作為各類海洋活動記錄載體也發生了歷史性的變革。
(一)與傳統檔案的對比。1.海洋檔案數據來源多頭、載體多樣。隨著海洋業務的擴展和先進的海洋儀器的大量采用,數據來源越來越廣,數據量越來越大。業務系統傳輸數據、業務系統的加工數據、收集資料等都納入了海洋檔案歸檔范圍中。同時,海洋檔案的外延不斷延伸,檔案載體和形式也千姿百態。現代海洋檔案涵蓋了紙質(含照片和圖件)、錄音帶、錄像帶、磁盤、光盤、硬盤、底片、膠片、幻燈片和實物等不同的載體形式。2.海洋檔案類型及屬性更復雜。在海洋業務中,進行海洋地質勘探、水下地形測量、海洋環境監測、水動力要素觀測、氣象要素觀測、生物種類鑒定、放化殘毒分析、海洋環境要素預報、海洋災害預測預報等活動過程中形成了大量的檔案文獻、專業基礎數據等資料。在實際的實施上,由于有多個系統記錄的海洋信息的各種數據,形成了非常密集的記錄。這些記錄所涵蓋的信息包羅萬象,既有時間維度,也有地理維度,同時還有頻率維度、區域維度、站點維度等等。3.現代海洋檔案數據量增長快。隨著聲光電等高科技手段在海洋業務中的應用、數字信息及載體的迅猛發展、現代智能技術和信息技術與海洋裝備和海洋活動相結合,07年開始東海區部分臺站數據電子化,到09年基本所有臺站都實現自動化觀測,在日常運營中生成、海洋實時傳輸中產生的數據以每分MB的速度累積。4.海洋檔案需求多樣性呈現個性化趨勢。隨著海洋業務的擴展,使海洋科技檔案和資料工作不斷發揮作用,這就對海洋檔案的利用提出了新的更高要求,更快,更準、更全。傳統的海洋檔案服務是比較狹隘和單一的,一般情況是在知道某個明確需求(某份文件)下,檔案人員為此提供一對一的服務。在傳統的檔案信息化技術下,通過數字化手段和數字檔案館的建設檔案服務水平得到一些提升,但同樣是面臨服務單一的問題。一是嚴重依賴于檔案管理水平,比如著錄的準確度、詳細度。二是在跨類別、跨庫檢索上會有缺陷。大數據時代背景下,為滿足業務需求,海洋檔案服務向多元化發展,以提供海洋檔案信息服務(憑證參考作用)、電子信息利用服務(文檔類)、數據資料服務(電子資料)、數據產品服務這四類為主。
(二)發展變革原因。1.海洋業務的擴展。1965-2000年,海洋局的職能歷經8次調整,經歷了艱苦創業時期、改革發展時期、依法管海時期3個階段。海洋檔案依托于海洋事業的發展,不同的海洋活動產生不同的資料,隨著業務的發展海洋檔案類型不斷新增,見“圖2”。以海濱觀測為例,觀測臺站由最初的20個臺站,發展到現在50多個,其中近半數為現代自動化觀測站。隨著海濱觀測業務的不斷發展完善,1958-2006年海濱觀測規范,經歷了6個版本的變遷,在觀測要素、觀測方法、記錄方式等方面做了許多調整和改動。2.海洋科學技術發展。隨著時代的進步與科學技術的發展,海洋事業實現了前所未有的飛躍。高科技多媒體的聲光電技術,成為現代化海洋科技發展中不可缺少的輔助手段之一,其應用越來越廣泛,并且隨著技術的提高與種類的多樣化,越來越起著拓寬海洋業務手段和范圍的作用。地波雷達、海上大型浮標的布設、船用測量儀器、聲學儀器、以及GPS技術等其他高精尖手段廣泛應用于日常的海洋觀監測、勘察、調查等科學研究過程中。海洋物探、水文調查、地形地貌調查、觀測預報、測繪等工作的數字化產生,海洋科技檔案也隨之從傳統的紙質檔案逐漸轉變為電子檔案。3.新時代要求。與全球性的海洋開發利用熱潮相適應,海洋信息化進程不斷加快,中國近海“數字海洋”信息基礎框架建設完成,各海洋專題服務網站建設不斷完善,海洋綜合管理信息系統建設得到深化拓展。同時,“智慧海洋”也要求將各類海洋信息資源整合在一起,海洋檔案作為重要的海洋信息資源,探索大數據技術在海洋檔案方面的應用是“智慧海洋”的內在要求。
(三)大數據技術應用。在大數據時代,利用大數據技術從大量的電子化和數字化海洋檔案文獻、專業基礎數據中實現智能化檢索檔案,探索非結構化檔案文獻的關系、災害趨勢預測、災害處置預案推薦分析、觀測數據的挖掘分析等。在節約人力和物力的同時能夠高效實現檔案文獻分類整理檢索、專業基礎數據挖掘分析,給用戶呈現精細化、直觀的、動態的、趨勢的專業數據分析結果。1.與傳統海洋數據分析對比。傳統意義上的數據是賦值的數字,大數據時代的數據內涵和概念擴展為數字和信息的統稱。現在的海洋業務中大數據分析,跟傳統意義的分析有一個本質區別,就是傳統的分析是基于結構化、關系型的數據,而且往往是取一個很小的數據集,來對整個海洋數據進行預測和判斷。但現在是大數據時代,理念已完全改變,現在的海洋大數據分析是對整個數據全集直接進行存儲和管理分析。2.大數據分析技術在海洋檔案中的應用。大數據分析采用的模式識別技術、圖文轉換技術、語義分析技術、地理信息技術等成為關鍵技術。通過對涉海海洋檔案、文獻,海洋活動數據充分獲取,應用大數據的方法和技術處理(ETL),收集、過濾、加工、分析、展現并提供開放的信息訪問接口。用戶通過訪問數據接口,提供數據處理的展示平臺,也可以進一步為各類用戶、系統開發所需的個性化數據服務。大數據分析的工具從長期來說可以提高工作效率,優化人力資源分配,促進海洋各項工作的進展。目前國家海洋局東海信息中心正在探索建設的東海檔案數據庫管理系統就是大數據技術在海洋檔案方面應用的典型。基于對檔案文獻和專業數據等數據清洗、整理、轉換、展現應用計算機模型建立海洋檔案智能檢索及專業數據分析系統平臺,從多個視角、多個層次、多個維度碎片化檔案文獻數據、刻畫海洋觀測、監測的高清數據畫像,進一步分析檔案數據、實時監測數據,為更好地管理和利用海洋提供數字支持。
四、結語
當代海洋檔案發展,既要有較高的學術和價值定位,又要符合大數據的時代背景。同時,還要不斷地利用現代信息化手段,讓海洋檔案資料充分應用和投入到海洋生產、再生產等實踐過程中,為海洋業務決策提供相應的數據、信息支撐,優化決策,造福于民。
【參考文獻】
[1]吳依林.新的《海濱觀測規范》[J].海洋預報,1988(2).
[2]張弘弢.發展智慧海洋建設海洋強國[N].中國船舶報, 2015-06-12(001).
[3]黃少芳,劉曉鴻,孫玲,朱青峰.初論大數據時代地質資料信息集成與服務[J].中國礦業,2016(02):170-172.