張彭輝 杜建平 吳帥 程文華 侯建 孔祥峰 張麗

摘要:海洋環境大數據是諸多學科研究領域的基礎,也是實施海洋強國戰略和建設海洋強國奮斗目標的先決條件。文章從全球海洋環境觀測計劃及系統出發,探討現階段全球海洋環境大數據觀測、國家數據庫建設、數據質控方法以及數據應用現狀,闡明了海洋環境大數據在國家發展中的重要性,客觀地分析了目前海洋環境大數據發展在基礎設施、數據處理及數據質控能力建設等方面面臨的關鍵問題與挑戰,以期為將來海洋環境大數據在多尺度、多學科、多行業的深入發展與深度融合提供可靠的資料與建議。
關鍵詞:海洋環境監測;大數據;數據質控;數據應用
中圖分類號:P76;TP31文獻標志碼:A文章編號:1005-9857(2021)11-0104-09
Research Progress on the Construction of Marine Environment Big Data System
ZHANG Penghuil, DU Jianpingl, WU Shuai?, CHENG Wenhual, HOU Jianl, KONG Xiangfeng?,ZHANG Li?
(1. State key laboratory for marine corrosion and protetion, Luoyang ship material research institute, Qingdao 266101,China;2.Southwest Technology and Enginering Research Institute, Chongging 400039, China; 3. Institute of Oceanographic Instrumentation,Qilu University of Technology(Shandong Academy of Sciences), Qingdao 266061, China)
Abstract:Big data on the marine environment isthe foundation of many disciplines and research fields, and it is also a prerequisite for implementing the strategy of a maritime power and the goal of building a maritime power. Starting from theglobal marine environment observation plan and system, this paper discussed the current global marine environment big data observation, national database construction,data quality control methods and data application status, clarified the importance of marine environment big data in national development, and objectively analyzed the key issues and challenges on capacity building of infrastructure, data processing and quality control faced by the current development of marine environmental big data, to provide reliable in-formation and suggestions for the in-depth development and in-depth integration of marine envi-ronmental big data in multi-scale,multi-disciplinary,and multi-industry in the future. Keywords:Marine environment monitoring,Big data,Data quality control,Data application
0引言
“大數據”這一概念起源于20世紀80年代,最早被提出用來描述容量非常大的數據集,美國科學家JohnR.Mashey在“BigDataandtheNextWaveofIn-fraStres”的演講中即提到這一概念[1]。隨著摩爾定律的應用與技術的發展,大數據不僅是指簡單的數據集,而是通過一系列特征準確定位的專業術語,即“4V”特征:大數量(Volume)、多樣性(Variety)、高速度(Velocity)和高價值(Value)[2]。海洋環境觀測在海洋探測中起著至關重要的作用。隨著信息技術的指數增長及海洋觀測手段的日益發展,海洋科學已正式進入大數據時代。海洋觀測數據的獲取通常建立在多時空尺度、多平臺的采集與分析上,具有數據量大、維度廣、類型多樣、測量持續、利用潛力大的特點,是一種典型的大數據,即海洋環境大數據。
作為海洋大國,我國大陸海岸線長達1.8萬km余,島嶼岸線長達1.4萬km余,海岸線總長度超過3.2萬km,有300萬km2余的管轄海域,海洋空間范圍廣闊,海洋環境復雜。隨著我國海洋監測立體網絡的建立與發展,“908近海海洋綜合調查與評價”等專項的順利實施,全球海洋Argo系統的布放與觀測,多種監測平臺與高端傳感器的開發與應用,海洋環境數據呈現了暴發式增長。海洋環境大數據是生物科學、地球科學、海洋和大氣科學等諸多研究領域的基礎,也是維護國家海洋權益、保護海洋生態環境、開發海洋資源、發展海洋經濟、實施海洋強國戰略、建設海洋強國奮斗目標的先決條件。與常規大數據不同,海洋環境大數據因其獨特的地理特性,呈現了與環境屬性、時空差異等因素的高度耦合性[3],在大數據時代的背景下,如何有效利用海洋環境大數據的特點挖掘更深層的科學信息,解決大數據存儲、算法突破、組織分析方法、支持決策應用系統等關鍵技術問題,為未來海洋領域發展、海洋管理決策、全球海洋預報、災害預警、海洋生產開發等奠定堅實基礎,仍是海洋環境大數據發展過程中需要攻克的重點以及難點。
本研究從全球海洋環境觀測計劃及系統出發,探討了現階段全球海洋環境大數據觀測、國家數據庫建設、數據質控方法以及數據應用現狀,闡明了海洋環境大數據在國家發展中的重要性,客觀分析了目前海洋環境大數據發展面臨的關鍵問題與挑戰,以期為將來海洋環境大數據在多尺度、多學科、多行業的深入發展與深度融合提供可靠的資料與建議。
1海洋環境大數據的獲取
海洋環境大數據包括海洋氣象、水文、化學以及海底地形地貌等多個方面,其獲取需要長期計劃和持續發展的觀測技術的穩定支持。在全球一體化的大背景下,成立于1991年的全球海洋觀測系統(GlobalOceanObservingSystem,GOOS)通過政府間合作,開展地轉海洋學實時觀測陣(ArayforReal-timeGeostrophicOceanography,Argo)計劃、數據浮標合作組(DataBuoyCooperationPanel,DBCP)項目、系泊與船基時間序列(OceanSITES)項目、全球海洋船基水動力學調查項目(theGlobalOceanShip-basedHydrogrphicInvestigationPro-gram,GO-SHIP)、全球海平面觀測系統(theGlobalSeaLevelObservingSystem,GLOSS)以及船觀測隊(ShipObservationTeam,SOT)等項目,對全球海洋水文、氣象、化學和生物等多類關鍵海洋變量(EsentialOceanVariables,EOVs)進行觀測[4]。南極科學委員會(ScientificCommiteonAntarcticResearch,SCAR)組織實施的南大洋觀測系統計劃(SouthernOceanObservingSystem,SOOS)、北極理事會(ArcticCommite,AC)和國際北極科學委員會(InternationalArcticScientificCommite,IASC)聯合開展北極持續觀測網計劃(SustainingArcticObservationNet,SAON)開始對南北兩極海洋環境要素進行長期觀測[5]。美國和加拿大于1998年和1999年啟動海王星(NEPTUNE)計劃,即東太平洋時間系列海底網絡實驗(North-EastPacificTime-seriesUnderseaNetworkedExperi-ments),旨在建立區域性、長期實時的交互式海洋觀測平臺[6]。此外,多種深海觀測計劃,如熱帶海洋與全球大氣實驗計劃(TOGA)、綜合大洋鉆探計劃(IODP)以及國際大洋中脊計劃(InterRidge)也正在開展當中[7]。上述計劃的實施,將為海洋環境大數據的獲取提供便利條件。
海洋環境大數據的獲取技術包括調查船調查、浮標潛標臺站等海洋實地觀測技術,以遙感為主的衛星觀測技術以及多學科融合為基礎的海洋觀測網絡。調查船調查是最早使用的獲取原位海洋環境數據的方式之一,包括全球海洋觀測系統的GO-SHIP等在內的多個項目,對全球海洋近岸與大洋區域水體環境開展數百次海洋調查。目前,相關航次公開發布CTD數據包括北極相關航次94個,調查時間從1972年7月至2015年9月;大西洋相關航次116個,調查時間從1972年7月至2020年3月;太平洋相關航次與時間觀測連續觀測結果657個,調查時間從1973年8月至2020年3月;印度洋相關航次96個,調查時間從197年12月至2019年5月;南大洋相關航次193個,調查時間從1972年7月至2019年5月(htps://chdo.ucsd.edu/)。1958—1960年以及2004—2009年,我國先后兩次開展了全國海洋綜合調查,編繪海洋物理、海洋化學、海洋生物以及海洋地質地貌圖集和圖志等,摸清我國近海海洋資源儲備情況,為我國近岸海域海洋大數據提供寶貴資料[8-9]。
浮標、潛標和觀測站觀測也是獲取原位海洋環境數據的重要手段。作為全球海洋觀測系統的一部分的Argo計劃,利用剖面浮標為全球海洋剖面水溫和鹽度數據的實時獲得提供了重要的支撐[10]。截至2020年11月5日,布放在全球海洋中仍處于工作狀態的Argo剖面浮標已達3717個。同時,隨著海洋技術的發展以及深海觀測需求的增大,Argo剖面浮標的探測深度已經由之前的0~2000m拓展到0~6000m[11]。通過集成生物化學傳感器,在獲得剖面溫度和鹽度數據的同時,浮標還可實時觀測懸浮顆粒、光強、pH、硝酸鹽濃度、葉綠素a濃度以及溶解氧濃度等多種環境數據,為多參數環境大數據的獲得提供了極為便利的條件[4,11]。此外,同樣屬于全球海洋觀測系統的OceanSITES、DBCP和GLOSS等項目提供的由臺站、系泊浮標、潛標和衛星追蹤漂流浮標觀測獲得的氣象、物理海洋和生物化學等多種參數數據,也是海洋環境大數據的重要來源[4]。
自美國1997年發射第一顆專用海洋水色衛星Seastar以來,遙感技術在海洋研究中的應用蓬勃發展。通過衛星遙感,可以估算全球初級生產力、觀測海水化學參數(如鹽度等)和上層水體動力學過程(如海平面高度變化等),為海洋環境大數據提供了豐富資料[12]。
海底觀測網絡是通過綜合運用水下機器人、海床光纖電纜等技術手段,實現全天候、原位、長期、連續、實時、高效的新型海洋觀測平臺。2016年6月6日,美國大型海洋觀測計劃(OceanObservatoriesInitiative,OOI)正式投入使用,83個實驗平臺將投放到大西洋和太平洋的7個觀測陣列中,用來觀測海表至海底的物理、化學、地質和生物過程[13]。此外,加拿大海底觀測網(OceanNetworksCanada,ONC)、歐洲多學科海底及水體觀測系統(EuropeanMultidisci-plinarySeafloorandWater-ColumnObservatory,EM-SO),日本地震和海嘯海底觀測密集網絡(DONET,DONET2)和日本海溝海底地震海嘯觀測網(S-net)以及我國的南海海底觀測網試驗系統,均已投入建設或開始使用[7]。美國OOI系統的數據向公眾免費開放,有效推動了海洋大數據研究的進步。
2海洋數據類型
目前,對于浩瀚龐大的海洋來說,已經進入大數據時代,并且形成了范圍較廣的海洋監測體系,收集了大量的海洋自然科學數據,在傳感器技術、海洋觀測技術、通信技術的快速發展下,海洋環境觀測數據的采集頻率不斷增加,產生了相應的應用和產品。根據海洋數據的監測方法不同和表達方式的不同,數據分為現場觀測監測數據、海洋遙感數據、海洋再分析產品數據、海洋模擬數據等[14]。
海洋實測調查包括船基觀測、定點觀測和移動觀測等觀測方式,不同觀測方式采集的數據不同,例如船基觀測的數據采集主要包括海洋氣象、物理海洋、海洋物理、海洋化學、海洋生物等;定點觀測根據平臺的不同,又分為岸基雷達站、河口水文站、海洋氣象站、驗潮站、浮標、潛標等[15]。海洋移動觀測能夠覆蓋更大的區域,包括水上、水下移動觀測平臺,能夠提供水下幾千米的溫度、鹽度、深度等[16]。
海洋遙感數據包括衛星遙感數據和航空遙感數據,其中航空遙感又可分為有人機航空遙感和無人機航空遙感[17]。航空遙感由于監測范圍廣、監測頻次高、監測數據連續,適用于重點區域的高精度監測,如近海海洋調查、海岸帶制圖、資源勘測、海洋動態監管、海洋突發情況應急響應、海洋資源環境監測等。此外,海洋遙感數據定量化應用的不斷深入和個性化服務的不斷完善,也是未來海洋數據發展的重要方向[18]。
海洋數值模擬是以現實海洋為基本物理背景,以計算機為載體,按照物理規律,建立數學模型,從而對海洋狀態(包括海溫、鹽度、海流、海浪、潮汐等要素)進行模擬,參數化、定量化地描述海洋的具體狀況。國內外比較常用的數值模擬產品網站有:中國科學院海洋研究所海洋大數據中心、國家海洋信息中心、國家極地科學數據中心、普林斯頓海洋模型(PrincetonOceanModel,POM)、非結構有限元近海海洋模型(AnUnstructuredGrid,Finite-VolumeCoastalOceanModel,FVCOM)、漢堡陸架海洋模型(HamburgShelfOceanModel,HAM-SOM)等[19]。數據分析是大數據價值鏈中最后也是最重要的一個階段,其目的是提取潛在的有用價值,提供建議或決策,有效地處理和利用現有觀測資料,重建高質量、長時間序列和高分辨率的海洋資料集,最終形成海洋再分析產品。目前,國內外科研機構先后公開發布了數十個時間序列長、要素較為完整、統一協調的全球海洋再分析數據產品。包括美國的全球海洋再分析產品,歐洲中期天氣預報中心的全球海洋再分析產品,法國全球海洋再分析產品,日本的全球海洋再分析產品,中國的全球海洋再分析產品[20]。這些海洋再分析產品時間跨度不同,時間分辨率也不同,變量一般包括鹽度、溫度、經緯向海流速度和海表面高度等,其中日本的MOVE-G2海洋再分析產品還提供了一些生物變量等。海洋再分析產品已經在諸多研究領域得到廣泛應用,例如海洋對氣候變化的響應、大洋環流與溫鹽結構、海洋動力學過程、監測方案的設計、數值預報和模式評估等。
3海洋數據質控方法
隨著海洋環境監測數據種類和量級的不斷增加,數據質量控制的重要性日益突出[21]。海洋環境監測數據的質量,將直接影響對海洋環境的綜合評估、生態保護、災害預警、管理決策和資源開發等。海洋數據的質量控制,決定了海洋數據的準確性和可靠性,具有重要的科學意義和社會價值[22-24]。目前采用的質量控制方法主要分為兩類:一類是根據數據的基本信息進行合理性辨別,如合理性檢驗和一致性檢驗等;另一類是基于數據處理算法進行質量管理,包括相關性檢驗、異常值檢驗和統計學習檢驗等方法(圖1)。
3.1合理性檢驗方法
合理性校驗主要是對數據基本信息進行初步檢驗,判斷其數值是否合理,如數據的日期時間、位置坐標、記錄格式、觀測要素等[25]。在海洋數據的質量管理中,數據日期不能超前于當前日期,年、月、日、時、分、秒均應在其規定進制內;數據位置的經度在-180°~180°,緯度在-90°~90°;數據記錄的起始位置、長度、類型等要素,均滿足規定要求;觀測要素應為已知觀測范圍內的要素等[26]。
3.2一致性檢驗方法
海洋監測數據的一致性檢驗主要包括值域一致性檢驗和邏輯一致性檢驗。值域一致性檢驗是根據每個數據參數在該環境中的經驗值域范圍對數據進行檢驗,判斷其是否在經驗值域范圍內[27]。經驗值域范圍可以根據被監測數據參數的理化性質、最低檢出限、最大污染等級、時間空間分布規律、歷史統計數據和相關文獻資料等進行劃定。邏輯一致性檢驗是根據某些檢測參數間存在的邏輯關系進行質量控制,包括同一參數在不同形態下的關系(如總氮和無機氮、有機氮之間的關系)、同一物質的不同參數之間的關系(如有機物在COD的錳法檢測中氧化程度低于在鉻法檢測中的氧化程度)、不同參數之間的內在關系(如pH值和總堿度的一致性關系)等[28]。
3.3相關性檢驗方法
相關性檢驗是根據海洋觀測數據各元素之間的自相關或互相關關系來判斷數據的質量。如針對某一參數,一天內數據的最大值應高于其平均值;兩個相鄰時間或位置間的觀測值,其差值應在一定范圍內;海水的溫度、鹽度數據與其密度數據之間的關系等[29]。如:羅冬蓮[30]研究得出深滬灣溶解氧與浮游植物數量呈二次拋物線關系,與懸浮物呈線性負相關關系;戴文娟等[31]利用Aprior算法對濱海觀測數據進行了相關性檢驗,檢測出東海大橋海洋站的一批溫度、鹽度和波浪數據不符合相關性檢驗,系機器故障導致,應作缺測處理。
3.4異常值檢驗方法
在海洋環境數據的監測過程中,由于人為、儀器、通信等方面問題造成的錯誤、誤差或噪聲,會體現異于正常數據分布規律的顯著性差別,該類數據視為異常值,應通過數據質量控制予以標記或處理。海洋數據質控過程中用到的異常值檢驗方法有Grubbs檢驗、Dixon檢驗、萊特準則檢驗、局地檢驗、K-means檢驗等。在實際應用中,可以根據監測數據的特征選擇合適的檢驗方法,或進行方法的結合、改進,以對數據進行更好的質量控制[32]。如:鄭琳等[33]分析數值分布較大的營養鹽要素適合選用Grubbs檢驗,而針對數值差異較小的溫度、pH和COD等參數的數據,選用Dixon檢驗能得到更好的效果;劉首華等[34]通過結合Grubbs檢驗和局地異常值檢驗,建立了一種針對海洋浮標波高監測數據異常值的質控方法;蔣華等[35-36]對K-means檢驗算法進行了改進,以提高海洋數據異常值的檢測率。
3.5統計學習檢驗方法
在傳統海洋數據質量控制中,有些數據需利用專家經驗進行人工檢驗。隨著智能學習算法的發展,學者們開始采用統計學習或智能學習等相對復雜的算法來進行數據質量控制[37]。如:李飛等[38]探索引入統計學習算法(SupportVectorDomainDescription,SVDD),利用歷史觀測數據進行訓練,建立可用于海洋站多要素數據質量控制的模型;王振華等[39]引入梯度模糊數抽樣檢驗模型,解決具有不確定質量參數的海洋數據質量檢驗問題;陳括等[40]將粗集理論引入海洋數據質量檢驗中,用于對不同質量檢驗方案進行優化選擇。
在實際應用中,海洋監測數據的質量控制往往根據參數的自身特點和應用需求,選用多個質量控制方法相結合,并根據質量控制方法的復雜性和時效性,分批進行質量檢驗[41-42]。以國際Argo計劃的監測數據為例,其質量控制通常分為實時質量控制和延時質量控制,實時質量控制在浮標觀測后的24h內完成,進行基本的合理性、一致性等質量檢驗,突出實時性;延時質量控制在6個月內完成,可根據歷史資料統計分析等方法,對數據進行檢驗和校正,突出其準確性[43-45]。
4海洋大數據應用
4.1海洋生態環境保護
海洋是人類社會發展重要的戰略資源基地,蘊含著豐富的海洋資源。良好的海洋生態環境是海洋資源可持續開發利用的基本條件。近年來,海洋環境監測技術不斷發展,已經從單一特征性參數監測,發展為多任務、多區域、多站位、多參數的綜合調查監測[46],為海洋資源的開發利用、海洋生態環境保護、海洋經濟可持續發展提供了重要支撐。
海洋環境監測內容豐富,包括海洋氣象觀測、水質分析、沉積物分析、生物監測和海洋放射性監測等[47]。隨著海洋監測數據的不斷獲取和更新,已積累形成海量的數據資源,傳統的數據分析與信息挖掘等技術已經難以滿足海量數據的分析需求,而基于大數據的海洋信息技術,能快速有效地對海洋生態監控區的指標參數進行整合與優化[48]。例如,利用遙感與聲學數據,對海洋底棲生物的生物群落和物種分布進行監測,為海洋生態保護提供科學參考[49]。利用海洋水色遙感探測如葉綠素、懸浮物、黃色物質、污染物等信息,對海洋水質監測和近岸水體污染預警具有重要意義[50]。基于海洋遙感大數據和生物多樣性監測技術,實現對典型海洋生態系統、海洋生態功能區、敏感區和脆弱區的連續監測,及對重要海洋經濟物種專項監測[51-52]。通過海洋大數據分析與應用,進一步提升海洋生態調查精度,推動海洋水質環境改善,保護海洋生物多樣性,提高海洋生態環境綜合治理水平。
4.2海洋防災減災
中國是世界上受海洋災害影響最為嚴重的國家之一,災害種類多、分布廣、頻率高,影響正常的海洋生產活動并危害國民生命財產安全。201—2017年,中國海洋災害(風暴潮、海浪、海冰、赤潮及其他海洋災害)造成的直接經濟損失累計超過2075億元[53]。改革開放以來,人口、城市在中國沿海地區高度聚集,沿海地區城鎮化與工業化快速發展,海洋災害對中國沿海地區的經濟社會發展帶來嚴峻挑戰。
近年來,我國海洋環境監測技術研究與應用已經取得巨大的進步,逐步建立起由海洋監測平臺、多參數浮標、調查船、衛星遙感等組成的海洋環境立體監測網絡[47]。隨著海洋自動監測技術的發展,基于海洋大數據的數據處理系統對海洋監測數據進行分析、處理和挖掘,為海洋災害預報預警提供支持。2000年基本建成的“海洋環境立體監測和信息服務系統”上海示范區是我國第一套自行研發的海洋環境立體監測系統,為上海地區海洋經濟發展、海洋環境保護、減輕海洋災害損失提供海洋環境信息服務[47]。2002年我國發射了第一顆海洋衛星—“海洋一號A”衛星,主要開展海洋水色要素(包括葉綠素、懸浮泥沙、可溶性有機物)、水溫、污染物及淺海水深和水下地形的探測工作,并對全球海洋環境進行遙感觀測,對我國近海的海洋災害如赤潮、綠潮等進行監測和預警[54]。“九五”以來,我國加大了海洋環境監測高新技術的研發投入,攻克了一系列關鍵技術。集成自主研發儀器設備構建的區域性海洋立體監測網于2008年投入業務化運行,產生的近海監測數據服務地方經濟發展,提高海洋防災減災水平[47]。近年來,我國陸續建成多個海洋環境立體監測系統與近海海洋觀察研究網絡,實現對我國東海、黃海和南海北部海域的長期綜合監測,提高了所在區域對赤潮、綠潮、溢油、核輻射、環境突發事件的監控能力和預警水平,并為我國近海變化規律預測、生態環境保護、海洋經濟發展提供了大量的海洋綜合性基礎資料[55]。
4.3全球氣候變化研究
全球氣候變化影響人類活動與全球生態系統,并產生諸多嚴重后果,如冰川消融、海平面上升、厄爾尼諾現象、旱澇災害增加、嚴寒熱浪等極端天氣增多。海洋水文氣象監測為全球氣候變化研究提供基礎數據,也是海洋環境監測的重要內容。隨著海洋觀測和信息技術的發展,海洋水文氣象監測已經形成了以遙感、遙測自動化為重點的海洋水文氣象自動監測系統[56]。基于海洋遙感大數據,海洋水文氣象監測涵蓋諸多海洋環境要素,具有廣泛的應用領域。例如,根據美國NASA衛星觀測結果,北極海冰自20世紀80年代以來每10年以13.1%的速度下降,南極洲和格陵蘭島海冰分別以每10年148億t和279億t的速度減少,全球海平面每年平均升高3.3mm[57]。利用Argo數據對不同深度處的海水溫度年周期數據進行分析,獲取全球變暖理想觀測點,為海面浮標布局提供科研參考[58]。通過衛星遙感監測到的海洋風場、海洋高度數據,可以應用于海平面變化觀測、海洋極端降雨預報;海表鹽度、海表溫度數據可服務于大洋環流、臺風預報、全球氣候變化與預測等[59]。
未來,全球化的海洋觀測系統是人類認識海洋、掌握海洋環境變化規律、開展全球氣候變化研究的發展方向。基于此,全球海洋觀測系統(GOOS)在海洋環境監測和資源共享方面發揮重要作用,促進國際間開展海洋數據搜集、海洋數據應用與合作,為全球氣候變化背景下的海洋多要素變化與關聯分析提供平臺[47]。而從海洋大數據中挖掘的大氣-海洋互作信息、生態系統-海洋理化參數耦合變異過程、氣候變化對極端氣候事件發生頻次、強度及空間分布特點的影響,將成為未來利用海洋環境監測數據開展全球氣
候變化分析的研究熱點[16]。
4.4海洋經濟(航運、養殖、捕撈等)
我國不斷加大海洋環境監測力度,基于海洋環境監測的大數據分析服務國家海洋經濟的快速發展。隨著多功能海洋監測平臺的建設,基于海洋環境監測系統的大數據分析在環境科學研究、航運、漁業、能源探測等諸多海洋活動中得到運用并提高效率和生產力。受益于衛星技術(如通信、遙感、導航等)的發展,海洋監測技術平臺為船舶航運業提供了全面的風速、水流、浪潮、水深、水溫變化等數據資料,為船型開發設計、航線航速優化提供支持[60]。如2014年1月通過對衛星遙感數據與海洋氣象數據的快速綜合分析,中國“雪龍”號極地考察船在南極冰海成功救援被困的俄羅斯“紹卡利斯基院士”號考察船,成為海洋大數據指導極地航行船只脫困的典型案例[61]。
此外,傳統漁業和海水養殖業通過依靠海洋環境監測技術、生物技術、先進材料技術、傳感器技術的發展實現產業的轉型升級。如利用海洋生物監測技術,對養殖區域重金屬、有機污染物、赤潮毒素、生化耗氧量、硫化物、氨氮等指標進行檢測與實時監測[46],提高魚蝦貝藻等養殖品種的生長品質與安全品質,提高養殖產量,并改善養殖生態環境,實現冷水名貴魚種的增殖增產[62-63]。新型海洋牧場在傳統海洋牧場原有人工魚礁、網箱養殖、增殖放流的基礎上引入物聯網、大數據、通信傳感等信息技術手段,對漁場海況信息(如葉綠素濃度、海表溫度、海洋表面鹽度、海洋表面高度、海洋水色信息等)進行在線監測,對海洋初級生產力、海洋生物存量分布及其變化進行分析,提高對漁期、漁場、魚群數量和質量等漁情預報的準確性[64]。近年來,海洋環境監測系統在我國新型海洋牧場建設中發揮重要作用,如在山東海洋牧場區域海域布設海底觀測站,實現對海洋牧場水文生態及生物資源狀況的實時在線監測,建立山東省海洋牧場觀測預警數據中心,提升區域海洋安全管理和風險預報預警能力。
4.5國防建設
近年來,各沿海國家正積極地應用和發展海洋監測高新技術,從空間、水面、水下對海洋進行立體監測,加速構建海洋環境立體監測系統,維護國家安全和海洋權益[65]。目前,海洋環境立體監測系統的核心是依托遙感衛星組成的天基海洋環境監測平臺,同時,海洋巡航飛機、無人航空遙感飛機組成空基平臺,固定監測站和高頻地波雷達站組成岸基平臺,浮標、潛標、船舶組成海基監測平臺,水下固定監測站、水下水聲探測陣組成海底監測平臺,上述多平臺共同構成海洋環境的立體監測系統,能夠對特定海域實施海天一體化的立體監測[65-66]。例如,美軍航母編隊在作戰巡航海域以“岸基保障為主,艦基平臺為輔”為原則,通過衛星、雷達遙感、遙測浮標、航母編隊艦船,完成海洋環境特征參數的獲取、分析、預測和評估[67]。此外,為滿足海洋環境監測和海上國防建設需求,一系列軍事技術指標被應用于海洋環境監測裝備的研制中。如,高頻地波雷達能夠超視距探測海平面視線以下的艦船、飛機、導彈和冰山等移動目標,因其獨特的性能優勢被各海洋國家競相研制與部署,以抵御戰爭威脅并應用于海洋開發與研究[68]。水下航行器因具有適應復雜環境、監測范圍廣、作業時間長、隱蔽性強等特點,成為世界各國高度重視的海洋科技[69]。目前水下航行器正向遠航程、深海型、多傳感器、混合式、智能化方向發展,特別利用圖像識別、人工智能、大數據分析實現信息處理、精密導航定位等技術要求,在民用領域開展海底地形勘察、海洋資源調查、水文參數測量和生物監測,在軍用領域用于偵察、掃雷、援潛救生等[70]。
5結論與展望
人類社會文明、科學技術的發展與海洋一直息息相關,國際政治、經濟、軍事等各個方面也與海洋有著密切聯系。未來海洋事業將會更加深入地貫穿到人類科技、文化、經濟、政治的各個層面,從多產業、多環境、全方位影響國家核心力量建設。海洋環境大數據平臺的建設、海洋環境大數據的發展也將為建設海洋強國提供更強有力的支撐。因此,仍處在發展階段的海洋環境大數據建設,尚存在一系列問題亟待解決。5.1基礎軟硬件設施的能力建設在全球各地觀測站點不斷更新觀測數據的當下,海洋環境數據量已達到前所未有的規模,傳統以單一數據輸入與查詢為中心的數據管理系統已不能滿足科學研究的需要。日益增長的數據量迫切需求更高效、穩定的數據存儲與管理系統的支持,因此對基礎的軟硬件設施提出了更高的建設要求。
5.2數據處理能力建設
海洋環境大數據發展的核心在于數據的有效處理、提取、分析及反饋。海量數據資源的產生既給科研人員帶來了極大的挑戰,也給科學研究帶來了更大的機遇。如何深度挖掘數據、優化算法,決定了從復雜數據中獲取信息的全面性與有效性,也是實現海洋環境大數據價值的重要手段。
5.3數據質量控制能力建設
海洋大數據的數據量大,數據計算速度快,數據種類繁多,由于數據讀取的不準確性和不完整、數據傳輸或計算的意外錯誤,可能引起數據處理結果的嚴重誤差,極大地影響數據的有效利用,浪費傳輸、存儲和計算資源。如何在第一時間使數據系統及時自檢錯誤,并準確修復,也是海洋環境大數據建設研究中一個挑戰性難題。
參考文獻
[1]MASHEYJR.BigDataandtheNextWaveofInfraStres[C]//ComputerScienceDivisionSeminar.Berkeley:Univer-sityofCalifornia,Berkeley,1997.
[2]BARWICKH.The“fourVs”ofBigData:ImplementingInformationInfrastructureSymposium[EB/OL].[2012-10-02].htp://www.computerworld.com.au/article/396198/is_four_vs_big_data/
[3]錢程程,陳戈.海洋大數據科學發展現狀與展望[J].學科與領域,2018,33(8):884-891.
[4]SLOYANBM,RoughanM,HILLK.Theglobaloceanob-servingsystem[C]//NewFrontiersinOperationalOceanog-raphy,E.Chasignet,A.Pascual,J.Tintoré,andJ.Veron,Eds.,GODAEOceanView,2018,75-90.
[5]何劍鋒,張芳,林凌.我國極地海底觀測系統的發展與展望[J].地球科學進展,2013,28(5):566-571.
[6]羅續業,李彥.海王星海底長期觀測系統的技術分析[J].海洋技術,2006,25(3):15-18.
[7]李風華,路艷國,王海斌,等.海底觀測網的研究進展與發展趨勢[J].中國科學院院刊,2019,34(3):321-330.
[8]徐渡.1958-1960年:全國海洋綜合調查[J].海洋科學,2010,34(4):109-110.
[9]崔愛菊,曲媛媛,韓京云.淺談“908專項”檔案整理工作[J].海洋開發與管理,2013,30(12):46-48.
[10]蘇紀蘭.如何正確認識Argo計劃[J].海洋技術,2001,20(3):1-2.
[11]JAYNESR,ROEMMICHD,ZILBERMANN,etal.TheArgoProgram:PresentandFuture[J].Oceanography,2017,30(2):18-28.
[12]陳戈,楊杰,張本濤,等.新一代海洋科學衛星的思考與展望[J].中國海洋大學學報(自然科學版),2019,49(10):110-117.
[13]吳自軍.美國大型海底觀測計劃(OOI)正式啟動運行[J].海洋地質與第四紀地質,2016,36(6):134.
[14]CHENC,ZHANGY,SHIXY.ResearchonDetectionand
AnalysisofMarineEcologicalEnvironmentBasedonBigData[J].IOPConferenceSeriesEarthandEnvironmentalScience,2020,514:032053.
[15]WANGZA,MOUSTAHFIDH,MUELLERAV,etal.
AdvancingObservationofOceanBiogeochemistry,Biology,andEcosystemsWithCost-EfectiveinsituSensingTechnol-ogies[J].FrontiersinMarineence,2019,6:519.
[16]侯雪燕,洪陽,張建民,等.海洋大數據:內涵、應用及平臺建設[J].海洋通報,2017,36(4):361-369.
[17]羅續業.海洋技術進展2014[M].北京:海洋出版社,2015:295.
[18]徐京萍,趙建華.遙感技術在海域使用動態監測中的應用[J].衛星應用,2016,6:35-39.
[19]鄭沛楠,宋軍,張芳苒,等.常用海洋數值模式簡介[J].海洋預報,2008,25(4):108-120.
[20]王世紅,趙一丁,尹訓強,等.全球海洋再分析產品的研究現狀[J].地球科學進展,2018,33(8):794-807.
[21]QIANC,LIUA,HUANGR,etal.Qualitycontrolofma-rinebigdata-acasestudyofreal-timeobservationstationdatainQingdao[J].JournalofOceanologyandLimnology,2019,v.37(06):195-205.
[22]GUANC,YANGY.Researchoncomputercontrolmethodofma-rineenvironmentalmonitoringdataquality[J].IOPConferenceSeriesEarthandEnvironmentalScience,2019,252:042067.
[23]姜歡歡,張威,馬芳,等.淺談海洋環境監測質量控制及質量保證技術[J].海洋開發與管理,2014,31(4):58-61.
[24]張鐵艷,王化仁,楊鯤,等.海洋調查觀測資料的質量控制[J].水道港口,2006(1):48-50.
[25]路文海,向先全,楊翼,等.海洋環境監測數據處理技術流程與方法研究[J].海洋開發與管理,2015,32(2):58-62.
[26]楊揚,苗慶生,韋廣昊,等.海洋站觀測資料的質量控制方法及其應用[J].海洋開發與管理,2017,34(10):109-113.
[27]張立輝.海洋大數據質量檢測中的嵌套循環算法[J].艦船科學技術,2019,41(6):152-154.
[28]向先全,路文海,楊翼,等.海洋環境監測數據集質量控制方法研究[J].海洋開發與管理,2015,32(1):88-91.
[29]溫玉波.海洋環境觀測數據的質量控制研究[J].農業網絡信息,2014(2):35-38.
[30]羅冬蓮.深滬灣溶解氧的分布及其與浮游植物懸浮物的相關性研究[J].海洋通報,2002(1):31-36.
[31]戴文娟,雒偉民,陳靚瑜,等.Aprior算法在海濱觀測數據相關性檢驗中的應用[J].海洋信息,2014(4):35-38.
[32]周旭聰,胡劍.海洋站自動觀測系統數據異常的檢查方法研究[J].海洋信息,2019,242(4):30-34.
[33]鄭琳,劉艷,崔文林,等.海洋監測數據質量評估研究[J].海洋通報,2014,33(2):228-234.
[34]劉首華,陳滿春,董明媚,等.一種實用海洋浮標數據異常值質控方法[J].海洋通報,2016(3):264-270.
[35]蔣華,武堯,王鑫,等.改進K均值聚類的海洋數據異常檢測算法研究[J].計算機科學,2019,46(7):211-216.
[36]蔣華,季豐,王慧嬌,等.改進Kmeans算法的海洋數據異常檢測[J].計算機工程與設計,2018,39(10):3132-3136.
[37]MORELLOEB,GALIBERTG,SMITHD,etal.QualityCon-trol(QC)proceduresforAustralia'sNationalReferenceStation'ssensordata-Comparingsemi-autonomoussystemstoanexperto-ceanographer[J].MethodsinOceanography.2014,9:17-33.
[38]李飛,盧勇奪,林波,等.初探支持向量機算法在海洋站觀測數據質量控制中的應用[J].海洋預報,2016,33(2):66-73.
[39]王振華,周雪楠,黃冬梅.不確定海洋數據的質量抽樣檢驗模型研究[J].計算機科學,2015,42(2):182-184.
[40]陳括,匡翠萍,王蕾,等.基于粗集理論的海洋數據質量檢驗方案多屬性決策法[J].海洋環境科學,2019,38(2):233-237.
[41]于婷,劉玉龍,楊錦坤,等.實時和延時海洋觀測數據質量評估方法研究[J].海洋通報,2013,32(6):610-614.
[42]INGLEBYB,HUDDLESTONM.Qualitycontrolofoceantemperatureandsalinityprofiles-Historicalandreal-timedata[J].JournalofMarineSystems,2007,65(1-4):158-175.
[43]盧少磊,許建平.Argo剖面浮標觀測資料質量控制方法研究概述[C]//第八屆全國海洋資料同化研討會暨第二屆Argo科學研討會,舟山:國家海洋局衛星海洋環境動力學國家重點實驗室,2013:64-75.
[44]王輝贊,張韌,王桂華,等.Argo浮標溫鹽剖面觀測資料的質量控制技術[J].地球物理學報,2012,55(2):577-588.
[45]GAILLARDF,AUTRETE,THIERRYV,etal.QualityControlofLargeArgoDatasets[J].JournalofAtmospheric&OceanicTechnology,2007,26(2):337-351.
[46]曾容,許艷,楊翼,等.海洋環境監測數據統計研究[J].海洋開發與管理,2017,34(4):32-7.
[47]吳夏青,王巧寧.海洋環境監測概況[C]//陳令新,王巧寧,孫西艷.海洋環境分析監測技術,北京:科學出版社,2018:3-25.
[48]DANOVAROR,FANELLIE,CANALSM,etal.Towards
amarinestrategyforthedepMediteraneanSea:Analysisofcurentecologicalstatus[J].MarinePolicy,2020,112.
[49]BROWNCJ,SMITHSJ,LAWTONP,etal.Benthichabitat
mapping:Areviewofprogrestowardsimprovedunderstandingofthespatialecologyoftheseaflorusingacoustictechniques[J].Es-tuarine,CoastalandShelfScience,2011,92(3):502-20.
[50]潘剛,段舜山,徐寧.海洋赤潮水色遙感技術研究進展[J].生態科學,2007,26(5):460-5.
[51]林金蘭,陳彬,黃浩,等.海洋生物多樣性保護優先區域的確定[J].生物多樣性,2013,21(1):38-46.
[52]馬克平.生物多樣性監測依賴于地面人工觀測與先進技術手段的有機結合[J].生物多樣性,2016,24(11):1201-2.
[53]葉攀.本世紀以來中國海洋災害致直接經濟損失超2000億元[N].中新社,2018-05-11(1).
[54]楊保華.構建中國海洋衛星體系提升海洋環境與災害監測能力[J].中國空間科學技術,2011,31(5):1.
[55]李健,陳榮裕,王盛安,等.國際海洋觀測技術發展趨勢與中國深海臺站建設實踐[J].熱帶海洋學報,2012,31(2):123-133.
[56]李帥,郭俊如,姜曉軼,等.海洋水文氣象多時空尺度資料來源分析[J].海洋通報,2020,39(1):24-39.
[57]NASA.GLOBALCLIMATECHANGE[EB/OL].[2020-10-13]htps://www.nasa.gov/mision_pages/noaa-n/cli-mate/index.html.
[58]CHENG,ZHANGH,WANGX.Annualamphidromiccol-umnsofseatemperatureinglobaloceansfromArgodata[J].GeophysicalResearchLeters,2014,41(6):2056-62.
[59]洪陽,侯雪燕.海洋大數據平臺建設及應用[J].衛星應用,2016(6):26-30.
[60]徐文,鄢社鋒,季飛,等.海洋信息獲取,傳輸,處理及融合前沿研究評述[J].中國科學:信息科學,2016,46(8):1053-85.
[61]張林,李春花,柴先明,等.2014年初雪龍船在南極被海冰圍困期間海洋氣象環境分析[J].極地研究,2014,26(4):487-95.
[62]張學雷,朱明遠,李瑞香,等.貝類養殖環境的多參數同步連續監測[J].海洋科學進展,2004,22(3):340-5.
[63]尤鋒,張培軍,相建海,等.海水養殖魚類遺傳多樣性的保護[J].海洋科學,2003,27(12):10-3.
[64]朱文東.智慧漁業背景下智慧型海洋牧場發展研究[D].舟山:浙江海洋大學,2019.
[65]孫西艷,付文龍,溫國義,等.海洋環境立體監測系統[C]//陳令新,王巧寧,孫西艷.海洋環境分析監測技術.北京:科學出版社.2018:315-65.
[66]漆隨平,厲運周.海洋環境監測技術及儀器裝備的發展現狀與趨勢[J].山東科學,2019,32(5):21-30.
[67]于宇,黃孝鵬,崔威威,等.國外海洋環境觀測系統和技術發展趨勢[J].艦船科學技術,2017,39(12):179-83.
[68]陳鉅龍.地波雷達海洋環境監測中的技術及應用[J].中國新通信,2014,16(19):121-2.
[69]KINSEYJC,EUSTICERM,WHITCOMBLL.Asurveyofunderwatervehiclenavigation:Recentadvancesandnewchalenges[C]//ProcedingsofIFACConferenceonManeuveringandControlofMarineCraft,Lisbon,Portugal.2006,9.
[70]李碩,劉健,徐會希,等.我國深海自主水下機器人的研究現狀[J].中國科學:信息科學,2018,48(9):1152-64.