任紅萍 唐哲兵 唐瀟
(陜西省環境監測中心站, 陜西 西安 710054)
環境監測數據質量評估體系框架研究
任紅萍 唐哲兵 唐瀟
(陜西省環境監測中心站, 陜西 西安 710054)
開展環境監測數據質量評估是提高環境監測數據質量的有效手段,本文通過搭建環境監測數據評估體系框架,為環境監測質量管理工作探索一項新的質量控制技術。
數據;質量;評估;研究
環境監測數據質量是環境監測工作的“生命線”,環境監測數據的科學性、規范性、相關性、代表性和準確性是政府環境決策和經濟發展決策科學性、針對性、可行性的保障,也是維護公民合法環境權益的基礎。因此,開展環境監測數據質量評估成為提高環境監測數據質量的有效手段。目前,我國環境監測數據質量尚無完整的評估體系,本文在構建監測數據評估體系框架的同時,為環境監測質量管理工作探索一項全新的質量控制技術。
依托計算機網絡平臺架構五個系統:登錄系統、數據輸入系統、數據檢索系統、數據質量評估系統、數據輸出系統。通過這五個系統,重點實現對數據的輸入、輸出、檢索、評估等。系統總體結構圖如下:

系統采用三層架構:數據層、應用層、功能層。
(1)數據層:利用數據庫技術實現數據的集中存儲與管理,主要包括源數據庫、評估后數據庫、異常值數據庫。源數據庫主要存放原始監測數據;評估后數據庫主要存放剔除異常數據后的準確數據;異常值數據庫主要存放剔除的異常值。
(2)功能層:建立與數據庫的鏈接,實現數據獲取、數據分析、數據剔除、數據可視化顯示等工作,并處理應用層與數據層數據的交互任務。
(3)應用層:基于圖形界面的用戶應用接口,采用圖形用戶接口,進行人機交互操作,進行數據輸入與數據輸出,實現用戶與功能層的對話功能。
(1)閾值檢驗法 閾值檢驗法是基于區域環境要素時空分布和變化規律,在分析研究已有的長期監測結果的基礎上,確定的符合區域環境特征的各監測要素正常取值范圍(即閾值),并通過數據比對判別異常值。如:陜西省渭河及漢丹江流域的斷面監測、全省空氣自動站點的監測等,都是長期監測任務,目前已積累了近30年的數據,對于這些監測區域的環境要素的環境特征已經有了一定基礎,這些區域的監測數據質量評估就可以充分運用閾值檢驗法。閾值檢驗法操作簡單、直接,能夠有效地檢驗出極端異常的數據。
(2)相關性檢驗法 由于自然界物質具有自身的化學性質,遵循一定的自然規律,環境監測中的一些項目間必然存在一定的相關性。
如水質監測中,一般情況下化學需氧量(COD cr)與五日生化需氧量(BOD5)和高錳酸鹽指數(CODMn)之間的關系表現為: CODcr> CODMn,CODcr> BOD5;三氮中總氮(TN)是有機氮(TON)和無機氮(TIN)的總和,無機氮的量不應大于總氮的量;總磷(TP)是指水中正磷酸鹽、聚合磷酸鹽、可水解磷酸鹽以及有機磷的總濃度值,則正磷酸鹽、聚合磷酸鹽、可水解磷酸鹽的總和不應大于總磷;六價鉻的濃度不能大于總鉻的濃度;河口、小區域的環境要素具有一定的相關性等。在大氣監測中,一般情況下顆粒物PM10不能大于總懸浮顆粒物TSP,顆粒物PM2.5不能大于顆粒物 PM10等。
(3)數理統計檢驗法 數理統計是以概率論為基礎的一門學科分支,在此系統中的應用目的主要是將搜集到的數據進行整理歸納,在形成數、表、圖的同時計算出需要的統計量。
① 測量值的相對位置。表示測量值相對位置的百分位數或四分位數對于數據匯總是十分有益的,是一個大于或等于給定數據值百分比的數據值,有多種方法計算樣品的百分位數,但最常見的重要的百分位數是四分位數。50th被稱為中位數,而25th和75th則經常用來估計數據集的分散程度。對于環境監測數據來說,90th、95th、99th百分位數也同樣重要,因為我們總是希望有90%、95%或99%的把握確保污染物的水平低于一個固定的風險水平。公式如下:

②測量值的中心趨勢。測量值的中心趨勢表征數據集的中心,最常見的是平均值、中位數和眾數。平均值是數據集的“重心”,受極端值以及未檢出數據的影響;中位數不受極端值的影響,而且適用于處理那些存在大量未檢出的數據集;眾數是發生頻率最大的數值,可能不存在或者并不是唯一的。公式如下:
中位數:當n為奇數時,

③測量偏差
一個數據集中測量值的偏差包括:極差、方差、標準偏差和變異系數。一般來說,極差可充分代表數據集的離散程度;方差說明數據離平均值的遠近程度;變異系數可用來比較交叉的多個數據集的離散程度。公式如下:
④測量值的相關性。在環境監測中每個采樣點都有數個特征變量,當我們要了解兩個或兩個以上變量之間的關系或相關程度時,相關系數就成了衡量的標準。公式如下:

皮爾遜相關系數:用于衡量兩個變量之間的線性相關程度,相關系數接近+1是為正相關,說明一個變量增加,另一個變量也增加;相關系數接近-1是為負相關,說明一個變量增加,另一個變量減少。他的一個重要性質是不受數據位置變化和范圍變化的影響,對一個或兩個極端值的存在,是相當敏感的。
斯皮爾曼秩相關:是皮爾遜相關系數的替代或補充,它是用X和Y的秩代替數值X和Y來計算相關系數,具有可取的性質,因此它受極端值的影響較小。
開展環境監測數據質量評估體系框架研究是滿足環境監測質量管理工作需求,是實現對監測數據科學性、可靠性、代表性、準確性評估的快捷而有效的手段。本研究根據環境監測數據的特征和應用服務的實際需求,對適用于環境監測數據質量評估體系框架模型進行了探討研究,構建了環境監測數據質量評估體系,實現了監測數據的自動分析與質量評估功能。
[1]沈陽市環境監測中心站編.環境監測數據質量管理與控制技術指南.中國環境科學出版社,2010,(12).
[2]薛念濤主編.環境監測的全面質量管理.中國建筑工業出版社,2008,(12).
Research on the evaluation framework of environmental monitoring data quality assessment system
Environmental monitoring data quality assessment is an effective method to improve the quality of environmental monitoring data.In this article,by demonstrating the setup of the environmental monitoring data evaluation system framework,therefrom we will explore a new quality control technique for environmental monitoring quality management.
Data; Quality; Assessment; Research
任紅萍(1965-),女,高級工程師,現任陜西省環境監測中心站質量管理中心主任,主要從事環境監測質量管理工作。