999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

海洋站數據質量控制技術探討

2011-09-24 03:27:20史靜濤周智海
海洋技術學報 2011年1期
關鍵詞:方法質量

史靜濤,周智海

(國家海洋技術中心,天津300112)

海洋站數據質量控制技術探討

史靜濤,周智海

(國家海洋技術中心,天津300112)

介紹了幾種常用的數據質量控制方法,并分析了這些方法的使用條件;初步分析了海洋站數據質量控制過程;針對海洋站數據特點,對某一海洋站某月逐時數據分別采用3δ檢驗法和格拉布斯檢驗法進行整體檢驗和分組檢驗,并采用曲線擬合手段表現質量控制結果。結果表明,對海洋站數據進行質量控制以后,數據質量得到了明顯提高,同時也顯示出對數據進行分組檢驗的必要性。

質量控制過程;3δ檢驗法;格拉布斯檢驗法;曲線擬合;分組檢驗

隨著國家對海洋環境的重視,人們也認識到海洋站數據質量提高的重要性,數據質量需要數據質量控制才能提高。目前,數據質量控制主要是實時數據質量控制和延時數據質量控制兩種。實時數據質量控制是延時數據質量控制的基礎,實時數據質量控制做得好就能減輕延時數據質量控制的工作。兩種數據質量控制所控制的數據有一定的差別,所以采取的數據質量控制方法也不同,然而這兩種數據質量控制過程基本上是一致的。

本文首先探討了常用的數據質量控制方法,其次針對海洋站以及其數據特點初步分析了其數據質量控制過程,最后通過案例來了解具體的海洋站數據質量控制過程。

1 幾種數據質量控制方法簡介

數據質量控制方法的研究是數據質量控制的重點,控制方法的好壞直接影響到數據質量。目前,數據質量控制經常用的方法有極值控制、萊茵達檢驗法、狄克遜檢驗法、格拉布斯檢驗法以及Cochran檢驗法等。

1.1 極值控制方法

極值控制方法是根據各種海洋環境要素的物理特性、統計經驗給定各個要素的極大值和極小值。極值控制是普遍采用、簡單有效的方法,能夠有效地檢驗出極端異常的數據。然而極值控制方法不能很好地檢驗那些差異不是很大的異常數據,這就需要更加精準的控制方法來控制。

1.2 3δ檢驗法[1]

3δ檢驗法又稱萊因達檢驗法。根據誤差理論,一般情況下隨機誤差δ服從正態分布。δ為標準差,一般是未知的,通常用貝塞爾公式算得S代替δ,以xˉ代替真值。

xi為觀測值,i=1,2,…,N

對某個觀測數據 xi,若其殘差 vi滿足 vi=|xi-xˉ|>3S,i=1,2,…,N,則xi可疑,應該標記異常值。

1.3 狄克遜(Dixon)檢驗法[1-3]

狄克遜準則有一假定條件,那就是設定觀測數據總體是正態分布的,取1個樣本x1,x2,…,xn,將觀測數據按大小順序排列為x'1≤x'2≤x'3≤…≤x'n,檢驗高端值和低端值是否異常有如下4種方法:

以上的 r10,r'10,r11,r'11,r21,r'21,r22,r'22簡記為 rij和 r'ij。狄克遜導出了它們的概率密度函數。選定顯著性水平α,求得臨界值 D(α,n)。

若 rij>r'ij,rij>D(α,n)則判斷 x'n為異常值;若 rij<r'ij,r'ij>D(α,n)則判斷x'1為異常值;否則判斷沒有異常值。

狄克遜認為對不同的測量次數或不同的數據量,應選用不同的統計。狄克遜方法本身說明該方法適合數據量比較少的情況,對于數據量比較大的數據一般采用其他方法;而且這種方法公式比較多,判別過程相對比較繁瑣。

1.4 格拉布斯檢驗法[1-3](Grubbs)

格拉布斯準則是根據順序統計量的某種分布規律提出的一種判別標準。

設定一個正態獨立測量的樣本x1,x2,…,xn,對其中的一個可疑數據xi(它與ˉ的殘差絕對值最大),構造統計量為為樣本的平均值,S按公式(2)計算。 格拉布斯導出了它的理論分布。選定顯著性水平α,α通常取0.05或0.01,求得按下式意義的臨界值G(α,n)。

1.5 Cochran 檢驗法[1-3]

設有 L 組數據,每組測定 n 次,標準差 S1,S2,…,SL都由公式(2)得到;

(a)將L個標準差按大小順序排列,最大值記為Smax;

如果n=2,即每組只有兩次測定時,各組內差值分別為R1,R2,…,RL,則要按如下公式計算 C:

(10)

(c)根據選定的顯著水平α、組數L、測定次數n確定臨界值 Cα;

(d)若 C>Cα,則判斷 Smax為異常值,其對應的那組數據異常或者當中存在異常值。

Cochran檢驗法檢驗完成以后還需要對有異常數據的那組數據采用其他的質量控制方法,所以這種方法適用于數據量比較大的數據。

2 海洋站數據質量控制過程

根據海洋站觀測平臺的實際觀測,數據質量控制過程可以分為數據采集與傳送、數據轉化、根據采集到的數據特點對數據質量控制方法的選擇和處理,以及數據質量控制結果的顯示及存儲等。數據質量控制過程圖如圖1所示。

圖1 數據質量控制過程圖

2.1 數據采集與傳送

數據采集與傳送是數據質量控制的基礎,數據采集主要是讀取觀測儀器的實時數據或延時數據。現在的數據采集一般是觀測儀器自動記錄觀測數據,這樣可以消除部分人為造成的讀數誤差。數據傳送過程中可能會帶來部分的傳輸誤差,一般造成非碼錯誤,這就要求接收數據的時候應該對數據進行非碼檢驗,保證不必要數據的后期處理。

2.2 數據轉化

傳輸的數據往往不一定是我們所認知的數據形式或者數據量綱,這就要求對其進行數據轉換。轉換以后的數據才能更加清晰地反應當前海洋環境的狀況以及趨勢。

2.3 選擇適當的數據質量控制方法進行數據質量控制

選擇數據質量控制方法是海洋站數據質量控制過程中的核心。為了選擇合適的質量控制方法,首先必須對數據本身的特點進行分析,一般有數據正態性判斷、數據誤差正態性判斷以及數據量的大小,甚至數據分組處理等等。目前常用的數據質量控制方法有極值檢驗、一致性判斷、遞增性判斷、3δ方法檢驗、格拉布斯檢驗以及狄克遜檢驗等。

2.4數據質量控制結果顯示以及存儲

數據質量控制結果一般通過散點圖、擬合圖、點線圖等來分析當前海洋環境的狀況以及趨勢。數據質量控制的目的不單是為了顯示當前的海洋環境狀況,還要數據質量控制結果的存儲以達到通過數據積累了解海洋規律。

以上的4個階段是對實時數據質量控制過程的簡單概括,延時數據質量控制是在實時數據質量控制的基礎上進行的更加深入的數據處理過程,不過基本的數據質量控制過程只有上述的3,4兩個過程,因此這里不再詳細探討延時數據質量控制過程。

3 算例與分析

現以傳送過來的某一海洋站符合觀測規范格式的1個月的逐時表層海水溫度和表層海水鹽度數據文件為例。這類文件一般是每個月會產生1個文件報表,對該類文件的處理算是延時數據質量控制。

首先按照海濱觀測規范將數據文件轉化為實際認知的數據形式,并形成數據文件。

其次對數據進行質量控制。該文件數據量比較大,并且在忽略人為所造成的過失情況下認為數據是符合正態分布的。數據量不同,采用的方法往往也不同,同一數據在不同方法下判斷結果有時也不同,這時候應采用比較精確的方法得出的結論。對整個月的數據可以采用萊茵達檢驗法進行質量控制。為了提高數據的質量和對異常數據的剔除,我們對數據再采用按日分組進行處理。質量控制前的散點圖如圖2,從圖中能夠看出有些數據是偏離整體趨勢的。對整個月的數據采用萊茵達檢驗法后的散點圖如圖3,從圖中可以看出還是有些數據是偏離整體趨勢的,因此需要更精確的質量控制。按日分組采用Cochran檢驗法檢驗,然后對有異常數據的組用格拉布斯檢驗法檢驗后的散點圖如圖4,從圖中可以看出其中的表層海水溫度變化趨勢已經很明顯。

最后采用曲線擬合表現整個月的表層海水溫度變化趨勢,這里采用最小二乘方法擬合[4]以后的曲線如圖5。

圖2 質量控制前表層海水溫度散點圖

圖3 整體處理后表層海水溫度散點圖

圖4 按日分組處理后表層海水溫度散點圖

圖5 表層海水溫度擬合曲線圖

對于表層海水鹽度可以重復上述處理過程這里不再詳細說明。

4 總結與展望

通過實例簡單討論了海洋站數據質量控制,其中還有很多的問題需要更加深入的探討。今后可以開展的研究可以總結為以下幾點:

(1)質量控制方法需要更加細致的探討,需要針對海洋數據本身的特點分析出適合特定數據的質量控制方法。

(2)質量控制最終結果處理的探討,不僅是簡單的曲線擬合,還需要更加精確的表現數據趨勢的手段。

(3)更加深入的質量控制研究,本文只簡單分析了海洋站數據質量控制。有待于今后采用更加深入的數據處理方法,比如回歸分析、判別分析等。

[1]劉振學,等.實驗設計與數據處理[M].北京:化學工業出版社,2004:29-33.

[2]于振凡,等.數據的統計處理和解釋(第二版)[M].北京:中國標準出版社,2006:165-180.

[3]國家質量技術監督局.GB 17378.2.海洋監測規范 第2部分:數據處理與分析質量控制[S].1998.

[4]蘇金明,等.MATLAB使用指南(上冊)[M].北京:電子工業出版社,2005:49-55.

Abstract:Several commonly used quality control methods are described.The conditions of these methods are described then.The data quality control process of marine stations is preliminarily analyzed.According to the characteristics of the ocean station data,an overall month data of a marine station by 3δ verify method are inspected and the data group is tested by group using Grubbs verify method.The quality control results are performed by means of curve fitting.It can be seen from the results that the data quality has been improved using the data quality control process which is introduced.

Key words:quality control process;3δ verify method;Grubbs verify method;curve fitting;packet inspection

Study on Technology of Ocean Station Data Quality Control

SHI Jing-tao,ZHOU Zhi-hai
(National Ocean Technology Center,Tianjin 300112,China)

P71

A

1003-2029(2011)01-0114-04

2010-05-28

國家“十一五”863計劃——海洋立體實時監測信息服務技術系統資助項目(2006AA09A302)

猜你喜歡
方法質量
“質量”知識鞏固
質量守恒定律考什么
做夢導致睡眠質量差嗎
學習方法
關于質量的快速Q&A
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
質量投訴超六成
汽車觀察(2016年3期)2016-02-28 13:16:26
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
捕魚
主站蜘蛛池模板: 欧美成人日韩| 老司机精品一区在线视频| 久久亚洲欧美综合| 91精品国产麻豆国产自产在线| 日本欧美视频在线观看| 国产欧美精品一区二区| 美女裸体18禁网站| 91久久偷偷做嫩草影院电| 久久久久亚洲AV成人人电影软件| 亚洲男人天堂久久| 成年人免费国产视频| 亚洲一级毛片免费观看| 亚洲精品777| 亚洲第一视频区| 毛片大全免费观看| 色婷婷视频在线| 国产美女精品一区二区| 五月激情婷婷综合| 国产综合欧美| 亚洲天堂日韩在线| 中文毛片无遮挡播放免费| 国产视频a| 无码免费视频| 国产新AV天堂| 四虎国产永久在线观看| 特级欧美视频aaaaaa| 国产欧美精品专区一区二区| 久久黄色小视频| 成人欧美在线观看| 风韵丰满熟妇啪啪区老熟熟女| 亚洲人成色在线观看| 免费人成在线观看成人片| 亚洲无码免费黄色网址| 超薄丝袜足j国产在线视频| 人妻无码一区二区视频| 一级毛片网| 国内精品小视频在线| 真人免费一级毛片一区二区 | 日韩大片免费观看视频播放| 久久亚洲中文字幕精品一区| 草逼视频国产| 亚洲午夜天堂| 亚洲天堂成人| 国产成人永久免费视频| 亚洲综合片| 国产高清无码麻豆精品| 久久a级片| 国产91导航| 色偷偷一区| 亚洲欧美日韩中文字幕在线| 精品国产99久久| 国产玖玖玖精品视频| 美女无遮挡免费视频网站| 免费观看成人久久网免费观看| 国产网友愉拍精品| 精品一区二区三区四区五区| 又爽又黄又无遮挡网站| 国产精品一线天| 久久国产精品电影| 成人午夜免费观看| 人人妻人人澡人人爽欧美一区| 精品少妇人妻av无码久久| 中文字幕日韩久久综合影院| 国产精品黑色丝袜的老师| 午夜小视频在线| 91口爆吞精国产对白第三集| 99精品国产自在现线观看| 3D动漫精品啪啪一区二区下载| 日韩欧美91| 亚洲日本精品一区二区| 久操中文在线| 成年人国产视频| 欧美亚洲第一页| 国产日韩久久久久无码精品| 国产成年女人特黄特色毛片免| 欧美色视频网站| 99国产精品国产高清一区二区| 蜜臀AVWWW国产天堂| 久久人午夜亚洲精品无码区| 国产传媒一区二区三区四区五区| 热这里只有精品国产热门精品| a在线亚洲男人的天堂试看|