趙聰蛟,宋琍琍,余駿,劉希真,陳思楊,張曉輝,劉瑞娟
(浙江省海洋監測預報中心 杭州 310007)
準確有效的數據是開展各項海洋科學研究的基礎和前提,監測數據的質量控制通常與數據的獲取和分析同時開展。數據獲取的流程通常為采樣準備、樣品采集和預處理、樣品儲存和運輸、實驗室分析、數據處理、數據歸檔[1],其中數據的質量控制應貫穿于整個流程。
因數據獲取方式不同,質量控制方法略有側重。海洋站觀測數據具有長期性、連續性和近岸性特點,獲取溫鹽、潮汐、波浪和氣象四大類數據的質控流程通常為數據采集、傳送和轉化,質控方法的選擇和處理以及質控結果的顯示和存儲,常用的質控方法有極值控制、狄克遜檢驗、Cochran檢驗、全等性檢驗、相關性檢驗和相鄰站一致性檢驗[2-3]。譚哲韜等[4]介紹范圍檢查、相關性檢驗和連續性檢驗等14種海洋觀測數據質量控制方法的原理;趙秀玲等[5]從準備、實施和內業分析3個方面介紹海洋調查數據的質量控制要求。
船舶走航采樣監測的質量控制工作通常分為采樣前、采樣中和采樣后3個階段。采樣前主要從管理制度、人員和儀器設備等方面加強質量控制[6-7]。采樣中的水質樣品通常采用現場空白樣、現場平行樣以及現場加標樣或質控樣等進行樣品采集、儲存和運輸的質量控制[6-8],生物樣品通常要現場固定、防止污染以及選擇合適的樣品容器,沉積物樣品要有代表性、避免水體攪動以及規范預處理和儲存[8]。采樣后將樣品帶回實驗室進行分析測試,通常采用室內空白樣、平行樣、質控樣或加標樣以及質控圖進行質量控制[7-8],必要時開展一致性檢驗和異常值剔除[9]。
自Argo計劃實施以來已獲取海量全球海洋溫鹽剖面數據資料,常采用閾值、軌跡、與可信數據比對以及基于“三倍標準差”的異常數據檢測等方法開展質量控制[10-13]。福建和廣西是我國較早開展海洋水質浮標在線監測的沿海地區:張江龍等[14]從規章制度、實驗室條件、設備維護和校準、數據檢查和審核以及記錄等方面介紹廈門近岸海域水質自動監測系統運行過程中的質量保證和質量控制措施;舒俊林等[15]從規章制度、人員素質、儀器設備維護與保養、軟件系統維護、周報和月報制作以及資料歸檔等方面介紹廣西近岸海域自動監測系統的質量保證和質量控制。中國環境監測總站等單位聯合編制的《近岸海域水質自動監測技術規范》(HJ 73l-2014)在標準量值傳遞、儀器性能審核、校準和比對以及數據有效性檢查等方面提出系統運行的質量保證和質量控制方法[16]。此外,還有少數報道介紹浮標監測葉綠素、溫度、鹽度和氮磷營養鹽等參數的質量控制方法[17-19]。
由于浮標所處的海洋環境十分復雜,隨著時間的延長,監測數據可能發生漸變式整體偏移。張宇等[20]研究浙江海域水質浮標監測數據中的這一異常現象,根據酸堿度(p H值)、溶解氧(DO)和葉綠素(Chl-a)三者的相關性特性,建立基于相關性的漸變異常數據自動識別質控方法。已有研究大多僅提出監測資料或浮標監測的普適性質量控制方法,雖然有少數報道對葉綠素等個別參數進行研究,但仍停留在探索階段,沒有深入研究浮標所載儀器設備監測參數集的質控方法和質控結果,也沒有具體量化較長時間序列的各監測參數集的數據質量。
浙江近岸海域浮標實時監測系統自2011年正式啟動建設,至2017年年底已完成18套海洋水質浮標的建設任務(其中寧波有7套)[21],這些浮標已獲取大量的常規水質、氣象、營養鹽和特征參數數據。本研究選用浙江近年的浮標監測數據,從浮體穩定性、儀器設備校準、系統運行維護、數據傳輸接收、比對監測和異常值判定等關鍵環節,設計浙江近岸海洋浮標監測數據質量控制體系,并以此為指導開展浙江海洋浮標監測數據質量控制,以期整體提升浙江近岸海域浮標在線監測數據質量,為客觀反映海洋環境質量及其變化趨勢、準確預警赤潮等海洋生態問題和突發狀況以及助力海洋經濟健康有序發展提供有效基礎數據。
本研究采用浙江近岸海域11套海洋水質浮標,其中包括嘉興1套、舟山4套、臺州3套和溫州3套。浙江近岸海域浮標實時監測系統(不含寧波)自2011年正式啟動建設,2012年8月在臺州大陳海域投放第一套試點海洋水質自動監測浮標,至2017年3月完成全部11套浮標的建設任務[21](表1)。

表1 浙江近岸海域海洋水質浮標基礎信息
根據投放地點的功能區特點,浮標具有不同的監測參數。浮標1~6所在海域為赤潮高發區、增養殖區、貝類種質保護區和排澇通道,監測參數為常規水質、氣象和營養鹽;浮標7~11所在海域為濱海旅游區、核電溫排水區和石油儲備基地附近,監測參數為常規水質和氣象,且浮標10增加核輻射監測參數,浮標11增加碳氫化合物監測參數。其中,常規水質參數包括水深、水溫、鹽度(電導率)、濁度、溶解氧、p H值和葉綠素a;氣象參數包括風向、風速、雨量、氣壓、氣溫、濕度和光照度;營養鹽參數包括氨氮、硝酸鹽氮、亞硝酸鹽氮和活性磷酸鹽。
自浙江海洋浮標實時監測系統省級監控平臺提取上述11套海洋水質浮標2020—2021年連續2年的水溫、鹽度、p H值、溶解氧、葉綠素a、濁度、氨氮、硝酸鹽氮、亞硝酸鹽氮、活性磷酸鹽和碳氫化合物11項監測參數集,開展質量控制技術研究。浮標運行維護、儀器設備性能核查和現場比對監測等數據分別來自浮標系統運行維護服務商和浮標屬地建設任務承擔單位。
區別于傳統船舶走航的監測流程,海洋浮標在線監測無須人工現場采樣、樣品預處理和運輸以及室內測試分析,從樣品采集到數據分析完全實現自動化,數據質量控制的重點也不再聚焦樣品采集和分析測試階段,而是從浮體穩定性、儀器設備校準、系統運行維護、數據傳輸接收、比對監測和異常值判定等關鍵環節開展質量控制,保證浮標監測數據的有效性。
浮標浮體為圓餅形,直徑為2 m或3 m,設計海上使用壽命為15年,目前未超過使用壽命。浮體標架上安裝的太陽能電池板和蓄電池為各傳感器和數據傳輸提供動力,警示燈、雷達反射器和防撞環可避免往來船只碰撞。浮體下方安裝的穩定錘可保證浮標水平穩定,并通過雙錨設計保證浮標穩定在預定海域范圍內。通過運行維護檢查浮體各組成部分的緊固程度和運行狀態,確保浮體及所載儀器設備處于穩定工作狀態。
儀器設備在投入使用之前或維修后再次使用之前,須經過檢測、校準或性能核查,以保證儀器設備在海上的正常運行。對多參數水質傳感器以及氨氮、硝酸鹽氮、亞硝酸鹽氮和活性磷酸鹽等傳感器進行定期性能核查,包括檢出限檢查、穩定性檢查、標準曲線檢查、量程漂移和零點漂移等;對p H值、溶解氧、濁度和葉綠素a等傳感器進行校準;對碳氫化合物和核輻射傳感器進行性能檢測校準。
通過例行維護、應急維護和年度整體維護,保證浮標系統的正常穩定運行。通常情況下例行維護為每月開展1次,維護內容包括浮體和傳感器清潔、試劑更換、儀器設備校準、緊固件檢查以及通信檢查等。受臺風和惡劣海況影響,或發生漁船碰撞、斷電或通信故障等突發事件時,立即開展應急維護。每年開展1次整體維護,包括將浮體拖上岸進行清潔后重新涂刷防腐材料,以及將各傳感器帶回實驗室進行檢測和校準等。
監測數據經加密處理后,采用GPRS/CDMA或北斗系統實時傳輸至浙江海洋浮標實時監測系統省級監控平臺。通過該平臺每日監控數據傳輸接收情況,查看各浮標數據接收是否正常、數據入庫是否正常、有無異常值或故障值以及經緯度是否明顯偏移。一旦發現數據缺失、通信中斷和經緯度明顯偏移等情況,須立即采取措施加以解決。
每個浮標每年開展6次現場采樣比對監測,即每2個月開展1次。采樣方法和要求為:在距離浮標10 m范圍內布設1個采樣點,采樣前用GPS定位并記錄經緯度;采集海水表層(離海面0.5~0.8 m,與傳感器同一高度)樣品,整點采集并連續采集5次以上,與在線監測時間保持同步。
表層海水溫度、p H值和濁度均在現場完成比對分析,溶解氧、鹽度、葉綠素a和碳氫化合物樣品經現場采集處理后帶回實驗室完成比對分析。樣品現場固定、運輸和實驗室分析應符合《海洋監測規范》(GB 17378-2007)和《海洋調查規范》(GB/T 12763-2007)的要求。各比對參數的分析方法和依據標準如表2所示。

表2 各比對參數的分析方法和依據標準
水質監測的質量控制采用平行樣,其中p H值和溶解氧采用100%的現場平行樣,碳氫化合物采用10%的現場平行樣。
建立異常值判定方法庫,將已見諸報道的方法納入方法庫,并針對各參數特點進行適宜性篩選。海洋監測異常值判定方法主要包括:
(1)標定[22]。室內標定由國家標準計量單位進行,現場標定選用有效期內的標準物質。主要適用參數為水溫、鹽度、p H值、溶解氧。
(2)值域檢驗[9]。檢驗參數是否超出對應的經驗值域。主要適用參數為鹽度、水溫、p H值、透明度、溶解氧。
(3)檢出限檢驗[9]。利用儀器設備的檢出限范圍檢驗參數的最小值。主要適用參數為海洋環境要素。
(4)最大污染倍數檢驗[9]。利用參數最大污染等級的倍數檢驗該參數值域的最大值。主要適用參數為重金屬、有毒污染物、化學需氧量、活性磷酸鹽、溶解無機氮、總氮、石油類、硫化物。
(5)專家經驗檢驗[9]。利用專家經驗對參數進行審核確認。主要適用參數為大氣干沉降和濕沉降。
(6)極值檢驗[4]。根據對海洋的基本認知,結合海洋環境要素的歷史極值等統計經驗,判定參數是否異常。主要適用參數為海洋環境要素。
(7)相關性檢驗(一致性檢驗)[3-4]。根據同一時刻和同一地點的監測數據的相互關系(是否符合一定的物理聯系)進行檢驗。主要適用參數為風速與風向、風速與浪高、水溫與氣溫、鹽度與雨量、水溫與寒潮以及浮標觀測要素。
(8)連續性檢驗[2,23]。通過確定要素相鄰時刻間的差值進行檢驗。主要適用參數為海洋站、浮標站和驗潮站等定點和長時間監測資料。
(9)等值檢驗[24]。在一定深度范圍內出現多個相同的監測值,推測可能是儀器設備故障造成的可疑值。主要適用參數為Argo監測要素。
(10)逆溫檢驗[4]。通常海水溫度隨深度增加而逐漸降低,若出現逆溫且超過一定的閾值,可判定為異常值。主要適用參數為水溫。
(11)尖峰檢驗(牛眼檢驗)[24]。由于儀器設備性能或操作等原因,可能出現明顯不合理的較大突變即“牛眼”。主要適用參數為Argo監測要素。
(12)深度遞增檢驗[4]。現場監測的水溫和鹽度等剖面深度均是從海表單調往下遞增,據此檢驗數據異常值。主要適用參數為水深。
(13)密度遞增檢驗[25-26]。下層海水密度總是大于上層海水密度,據此檢驗數據異常值。主要適用參數為深層水溫和鹽度。
(14)陸地位置檢驗[4]。經緯度是否在預定范圍內。主要適用參數為儀器設備及其載體。
(15)垂直梯度檢驗[4]。相鄰2個深度值對應監測值的垂直梯度是否超出一定閾值。主要適用參數為鹽度。
(16)局地最大深度檢驗[25]。深度監測值是否比該地的海底深度更深。主要適用參數為水深。
(17)局地氣候態檢驗[10,27]。根據局地歷史監測數據的統計分布特征或概率分布界定閾值,據此標記可疑值。主要適用參數為水溫、鹽度和溶解氧等剖面資料。
(18)溫度-鹽度圖檢驗[4]。將監測的溫-鹽曲線與事先構建的氣候態溫-鹽曲線進行比較,檢驗異常信息。主要適用參數為水溫和鹽度。
(19)非法碼檢驗[28]。根據各類要素的數據編碼格式,對不同位置出現的符號、數字或字符進行范圍檢驗。主要適用參數為水溫、鹽度、海浪、海冰和氣象等海洋站監測數據。
(20)全等性檢驗[28]。部分參數相對于固定的海洋站往往是長期不變的,據此檢驗參數是否保持不變。主要適用參數為資料類型、經緯度、水深、監測方法、儀器設備、海拔高度。
(21)24 h滑動平均[29-30]。對某數據序列在逐一小區間上不斷進行局部平均,即可得出較平滑的監測結果,而濾掉頻繁起伏的隨機誤差。主要適用參數為浮標監測葉綠素。
(22)漸變異常數據自動識別[20]。在一定時序上參數之間的相關性是穩定甚至一致的,據此開展自動識別。主要適用參數為p H值、溶解氧和葉綠素。
(23)現場比對監測[15,31]。現場人工采樣監測結果與同一時刻浮標在線監測結果進行比對。主要適用參數為浮標在線監測數據。
(24)實時質量控制[10]。對72 h內獲得的浮標監測參數進行垂向斜率統計檢測、與同浮標歷史對比檢測以及浮標漂移速度檢測等。主要適用參數為Argo監測要素。
(25)延時質量控制[10]。將浮標監測數據和質量控制標準數據進行比對,再進行數據校正。主要適用參數為溫鹽剖面數據。
(26)平均值-標準差檢驗[13]。用氣候態資料或較長時間序列浮標監測數據的“平均值-標準差”范圍判定異常值。主要適用參數為溫鹽剖面數據。
(27)“最佳匹配”歷史剖面資料比對[11]。比對Argo和歷史剖面數據對應的漂移軌跡和要素圖,有效識別數據誤差。主要適用參數為溫鹽剖面數據。
(28)三倍標準差檢驗[11]。計算浮標監測位置剖面資料的對應平均值和標準差,同時考慮與其他剖面之間的關系。主要適用參數為溫鹽剖面數據。
(29)氣候態校正[12]。使用海洋氣候態平均數據集WOA對浮標監測數據進行校正,增加深水值校正和表層值校正。主要適用參數為Argo監測溶解氧剖面數據。
(30)空氣測量校正[12]。用可信的海表面氧氣分壓校正Argo浮標監測空氣中的氧氣分壓。主要適用參數為Argo監測溶解氧的漂移誤差。
(31)空白樣、平行樣、加標樣和內控樣[6]。主要適用參數為海洋環境要素。
(32)萊茵達檢驗[2,19]。以基于萊茵達準則計算的3倍標準差作為標準范圍。主要適用參數為浮標在線監測水溫和鹽度。
(33)狄克遜檢驗[2]。基于規則計算樣本中的最大值和最小值是否異常。主要適用參數為數據量較少的參數。
(34)格拉布斯檢驗[2]。基于規則計算樣本中的最大值或最小值的殘差是否超過選定顯著性水平的臨界值,超過則判定為異常值。主要適用參數為服從或近似服從正態分布的數據集。
(35)均方差檢驗[17]。計算某時刻值與鄰近50個值的平均值和均方差,據此判定異常值。主要適用參數為浮標在線監測數據。
對11項參數開展3個層級的質量控制,分別獲得有效、可信和相對準確的浮標監測數據集(圖1)。

圖1 浮標監測數據質量控制體系的設計流程
第一層:去除明顯的故障值、異常值和離群值,得到有效數據集。傳感器故障期間、網絡通信故障期間、浮標運行維護期間以及浮標發生明顯偏移或移位期間產生的數據不是浮標正常運行采樣獲取的數據,應首先判斷為故障值或異常值。波浪造成浮體明顯擺動、傳感器采樣過程中產生氣泡以及數據加密傳輸解碼異常等情況可能產生低于或高于傳感器檢出限的離群值。對各監測參數整年的數據集進行滑動平均處理,剔除明顯離群值。根據傳感器的工作狀態,結合各監測參數的歷年均值、傳感器檢出限和閾值等判定故障值和異常值。
第二層:自方法庫選取合適的質控方法,對各項參數的有效數據集開展質量控制,去除可疑數據,得到可信數據集。根據各監測參數的特點,選擇極值檢驗、等值檢驗、尖峰檢驗、相關性檢驗、連續性檢驗、均方差檢驗、萊茵達檢驗和狄克遜檢驗等數據質量控制方法,判定有效數據集的可信程度。臺風過境期間,應視臺風對浮標造成影響的程度確定數據是否可信;赤潮期間浮標數據會發生明顯變化,如無其他異常情況發生,應視為可信數據。
第三層:根據現場采樣比對監測結果,結合歷年均值,檢驗可信數據集的質量,必要時增加修訂系數,得到相對準確數據集。例如:廈門西海域浮標監測葉綠素數值僅約為現場比對監測數值的50%[17],則可設定修訂系數為2.0。
質量保證是整個監測過程的全面質量管理,質量控制是質量保證的組成部分,是為達到監測質量要求所采取的作業技術和活動[32]。浮標監測全過程涉及的人員素質、規章制度、站位布設、設備投放和運行維護、傳感器校準、數據傳輸接收存儲、軟件系統維護、比對監測、異常值判定、數據應用和資料歸檔等方面均屬于質量保證范疇。本研究從中歸納并選取浮體穩定性、儀器設備校準、系統運行維護、數據傳輸接收、比對監測和異常值判定等關鍵環節開展質量控制,獲得有效、可信和相對準確3個層級的數據集。
第一層是去除明顯的故障值、異常值和離群值等無效數據后得到的浮標監測有效數據集,可用于評估浮標監測有效數據接收率,進而評估浮體系統運行的穩定性以及各傳感器的運行狀態。第二層是針對各參數特點,自方法庫選取適宜的質控方法去除可疑數據后得到的浮標監測可信數據集,可用于反映浮標所在海域的水體環境質量及其變化趨勢;由于此數據集反映的趨勢性變化是可信的,其結果可用于制作赤潮短期預警等信息產品[33],也可用于研究相關海洋生態問題和突發狀況。第三層是經現場比對監測結果驗證后的浮標監測相對準確數據集;該數據集以段代線,結合浮標監測各參數的歷年均值,驗證較長時間序列浮標監測數據的準確性,通過設置合適的修正參數,所得結果可視為水體環境質量的相對準確值。
經過3個層級的質量控制,期望獲得較長時間序列且相對準確的水質、營養鹽、核輻射和碳氫化合物等監測參數集的量化數據結果,整體提升浙江近岸海域浮標在線監測數據質量,為客觀反映海洋環境質量及其變化趨勢、準確預警赤潮等海洋生態問題和突發狀況以及助力海洋經濟健康有序發展提供有效基礎數據。
本研究充分考慮海洋浮標在線監測的特點,從浮體穩定性、儀器設備校準、系統運行維護、數據傳輸接收、比對監測和異常值判定等關鍵環節設計浮標監測數據質量控制體系,重點從異常值判定和比對監測2個方面開展研究,設計合理且操作可行;3個層級的異常值判定規則具有一定的創新性,預期獲得有效、可信和相對準確的浮標監測數據集,為整體提升浙江近岸海域浮標在線監測數據質量發揮積極作用;以浙江海洋浮標監測數據為基礎提出的浮標監測數據質量控制體系的設計思路和方法,可為全國海洋浮標監測數據質量控制以及相關數據質量控制提供參考。