999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

絕對重力測量異常值的局部異常因子檢測算法

2019-11-20 06:21:04滕云田王曉美
中國慣性技術學報 2019年4期
關鍵詞:測量檢測

吳 瓊,滕云田,王曉美

(中國地震局地球物理研究所,北京 100081)

高精度絕對重力測量技術可以實現地球重力場及其隨時間變化和空間分布的μGal 量級測量(1 μGal= 10-8m/s2),是重力匹配導航[1]、深空探測[2]等領域最重要、最基本的測量技術之一。雖然現階段國內的絕對重力測量儀器還依賴進口,但隨著碘穩頻激光器研制、高精度時頻測量、真空技術以及精密機械加工等領域的不斷進步,自主研發的高精度絕對重力儀正逐漸成熟并向實際應用領域拓展[3]。

絕對重力儀一般采用分組多次測量求平均的方式獲得最終測量結果。在實際測量過程中,儀器自身的系統振動和測點的背景振動對測量結果的影響比較明顯,是引起測量結果離散度變大和導致測量結果中出現異常點的主要原因[4]。對單次測量的時間-位移坐標進行最小二乘擬合時,由于測量誤差的存在,同樣會導致測量結果出現異常點[5]。此外,激光器和銣原子頻標的電子系統長期連續工作時可能存在的瞬時擾動,使得提供的長度基準和時間基準會發生小概率的跳變,從而造成單個測量結果異常甚至突變。

目前針對測量過程中的異常點(離群程度較小)和突變點(離群程度較大),一般采用的處理方式是在組測量結果計算時,采用基于正態分布的一元異常點檢測算法進行異常點的檢測和舍棄。但實際測量結果表明,在單組100 次下落的絕對重力測量過程中,如果異常點出現的個數較多(大于5 個)或離群程度不一樣的時候,該算法會造成某些異常點的漏檢,降低組測量結果的測量精度并可能在最終測量結果中引入測量偏差。

隨著人工智能(AI)技術的不斷進步,異常點檢測作為一個特定的研究方向,在過程工業、金融業、通信領域得到普遍關注和廣泛應用[6]。異常點檢測算法一般基于某個存在的模型,定義一個區間,處于區間外的點被定義為異常點。根據模型的定義可以將異常值檢測算法分為基于概率分布模型[7]、基于距離和聚類[8]、基于數據分類[9]等。

考慮到在自主研發的絕對重力儀測量過程中,單組測量數據一般會被預先設定為50 或100 個,但要求快速在線完成異常值檢測,故本文利用基于歐式距離的局部異常因子LOF 算法(Local Outlier Factor)[10]對組內測量數據進行異常值檢測。通過對LOF 算法關鍵唯一參數——“鄰域寬度”的選取及模擬仿真,并與傳統的基于正態分布的一元異常點檢測算法進行對比確定,基于LOF 算法的異常值檢測可以實現對組內測量異常點在線、快速、精準檢測,同時還可以消除漏檢和誤檢現象,從而提高自主研發絕對重力儀測量的精度和準確度。

1 算法原理

1.1 一元正態分布異常值檢測算法存在的問題

目前絕對重力測量中,針對測量過程中出現的異常值一般采用一元正態分布異常值檢測算法進行判斷和排除,基本算法原理如下:

對于一次測量獲得的n個測量結果中,定義第i個測量結果xi的異常值Zi為:

其中,為本組測量結果的平均值,σ為本組測量的標準差。

如果Zi≥ 3,則認為該值為異常值,在本次測量結果中應予以舍棄。但是在自主研發的絕對重力儀測量過程中,這種檢測算法很容易造成異常值的漏檢。為了說明這一現象,首先構建一組測試用的數據集,包含異常點和突變點,具體如下:

1)構建數據集,包含100 個數據,分布區間為400~600,單位為μGal,服從標準正態分布;

2)在第10、30、49、51、90 位置的測量結果上分別疊加600、-600、-400、-400、400,構建異常點;

3)在50 和70 次測量結果上疊加-2500 和1500,構建突變點。

如圖1所示,當不考慮50、70 位置的突變點,對構建的數據集使用一元異常值檢測算法時,設置的異常點被正常檢出。但是當數據集的第50 和70 位置被設置為突變點后,第10、30、49、51、90 位置的異常點均被認為是正常值保留。可以說當測量的數據中出現突變點時,離群程度較小的異常點被漏檢并參與最終測量結果的計算。

這種現象出現在項目組自主研發絕對重力的測量 結果中,直接影響了最終測量結果的準確度和精度。故需要引入新的異常值檢測算法,不僅可以完成對離群程度較大的突變點進行檢測,同時還要避免對離群程度較小、連續出現的異常點的漏檢。本文選用計算速度快,檢測效果好的局部異常因子LOF 算法。

1.2 局部異常因子LOF 算法基本原理

局部異常因子LOF 算法的計算流程如下:

Step 1:定義測試數據集內的 p(x1,y1)點和 q(x2,y2)點之間的距離:

Step 2:定義點p 的鄰域 D { p} 寬度k:

對于點o ∈ D:

1)至少有k個點 o' ∈ D { p},滿足:

2)至多有k-1 個點 o' ∈ D { p},滿足:

Step 3:計算點p 的可達距離:

Step 4:計算點p 局部可達密度:

Step 5:計算點p 的局部可達因子LOF:

從LOF 的定義可以看出,在點p 的鄰域內,其他點的局部可達密度大,而點p 的局部可達密度小,則點p的局部異常因子就大,即點p是一個局部異常值。

Breunig 等[10]還證明了在測量結果組成的數據集 合中,正常值的LOF 一般在1 左右并小于2,因此可 以將LOF 值大于2 的作為異常值或突變值。

1.3 LOF 算法參數鄰域寬度k 選取

從1.2 節LOF 的定義可以看出,對測量數據的每個測點計算其LOF 時,只有1 個參數,即鄰域寬度k影響最終檢測結果。因此本部分通過數值模擬確定k在利用LOF 算法完成絕對重力測量數據檢測時的取值。

為了更好地測試k對最終檢測結果的影響程度,基于1.1 節構建的測試數據,主要針對以下幾方面進行LOF 算法的檢測效果測試:

1)存在突跳點的情況下離群程度較小的異常點檢測;

2)存在連續異常、突跳情況的異常點檢測;

3)原始數據標準差較大情況下異常點檢測。

不同k值對應的各個測點的LOF 計算結果如圖2所示。LOF 的大小以不同的顏色標識,可以看出隨著鄰域寬度k取值從0 到100 的變化,LOF 算法的檢測效果的變化:

k=1~4:漏檢率和誤檢率較高;

k=5~20:對1)、2)、3)項內容均可以正確檢測,各個異常點的LOF 值明顯可辨(均大于20);

k=21~100:出現不同程度的漏檢現象。

圖3顯示了不同的參數k對應的異常點檢測效果。其中第1 和第2 條曲線分別顯示了將檢測出的異常點刪除后得到的新數據集的均值和標準差,第3 條曲線顯示的是檢出的異常點個數。

測試數據集共設置7 個異常點,從圖2和圖3的第3 條曲線可以明顯看出,在5≤k≤60 的區間范圍內,7 個異常點可被準確檢出,包含第49、50 和51三個連續異常和突變點,異常點檢出后的均值和方差 與模擬數據預設的均值和方差相比均小于5 μGal。

圖2 不同k 值對應的各個測點的LOF Fig.2 Local outlier factor of each measurement point corresponding to different k values

圖3 不同k 值時異常點檢測效果 Fig.3 Effect of outlier detection under different k values

在實際的絕對重力測試過程中,每組測量次數一般設置為50~100,24 h 完成48 組測量。

綜合圖2、圖3,考慮運算的速度、異常點LOF 值的可辨識性和算法檢測的準確性,鄰域寬度k的取值設定為10,并要求測量時每組測量次數不少于20 次。

2 實測數據的LOF 與一元正態分布異常值檢測算法結果對比

自主研發的激光干涉絕對重力儀于2018年2月9日至4月1日,在中國計量科學研究院昌平園區2017國際絕對重力比對基地的8 號測點進行連續觀測。測試期間設置每組測量50 次,組間時間間隔是4 h,共完成14 650 次測量。測量結果的準確度和測量精度依據《中國大陸構造環境檢測網絡技術規程—絕對重力測量部分》之“成果計算”部分完成計算。

圖4所示為連續2 組,共100 個原始測量結果、一元異常值檢測結果和本文討論的LOF 算法完成的異常點檢測結果(k=10,LOF 大于2 認為是異常值[10])。

從圖4可以看出,LOF 算法將負向離群程度較大的第27 點作為異常值準確檢出,但是一元異常值檢測算法則將其作為有效值保留,這樣在計算這100 個測量結果的平均值時,基于一元異常值檢測算法的結果肯定小于基于LOF 算法檢測的結果,影響了測量結果的準確度。

圖4 實測數據的異常值檢測算法對比 Fig.4 Comparison on outlier detection algorithms based on measured data

圖5是分別利用一元異常值檢測算法和LOF 算法,按照50 個測量結果為一組計算絕對重力組測量結果的誤差棒圖對比。考慮到在測量過程中,2018年2月 12日河北廊坊永清縣Ms4.3 地震對儀器參考棱鏡的影響造成的測量結果異常,圖5中顯示的是本次連續測量期間震后2018年2月22日至4月13日共計50 天的連續測量數據。可以看到,LOF 算法完備地完成測量結果中異常值的檢測,組測量結果的誤差棒圖沒有出現異常結果,200 組的測量結果為980XXX783.0 μGal(儀器測量高度位置),測量精度為1.94 μGal。

基于一元異常值檢測的組測量結果中,第138 組 和152 組出現異常結果,表明這兩組內有較為明顯的離群點未被正確檢出,且參與了組結果的計算,200組的測量結果為980XXX782.39 μGal(儀器測量高度位置),測量精度僅為427.15 μGal,遠大于利用LOF算法進行異常值檢測后的計算結果。

圖6為200 組測量結果,利用一元異常值檢測算法和LOF 算法進行異常值檢測后單組測量精度,第138 組和152 組內由于存在未被檢出的異常點,造成 單組測量精度偏差。而對其他的單組測量精度對比,基于LOF 算法的組測量結果精度與一元異常值檢測算法的結果相比,平均小9.37 μGal。

圖5 兩種異常值檢測算法完成異常值檢測后組測量結果的誤差棒圖對比 Fig.5 Comparison on error bars of the two outlier detection algorithms

圖6 兩種異常值檢測算法完成異常值檢測后單組測量精度對比 Fig.6 Comparison on precisions of the two outlier detection algorithms

3 結 論

本文首先描述了目前自主研發絕對重力儀中普遍使用的基于正態分布的一元異常值檢測算法的漏檢現 象。然后引入LOF 算法,通過對同一組測試數據集進行計算的結果表明,LOF 算法規避了存在離群程度不同的異常點時的漏檢現象,同時對連續出現的異常點和突跳點均可以準確檢出。該算法非常適合自主研發絕對重力儀組測量結果的異常值檢測。

從LOF 算法的定義可以看出,影響該算法計算結果的唯一參數是鄰域寬度k。對此利用構建的數據樣本進行數值模擬計算的結果表明,對于100 個數據樣本組成的數據集,5≤k≤60 的區間范圍內可以檢出離群程度不同的全部異常點,無漏檢現象。考慮實際測量中單組測量次數一般為50~100 次,從計算時間和異常值檢測效果的綜合考慮,取k=10。

最后利用LOF 算法,取鄰域寬度k=10,對自主研發絕對重力儀長期連續觀測數據進行處理,對比了一元異常值檢測算法和LOF 算法的檢驗效果。結果表明,利用LOF 算法可以在線、快速、精準地完成異常值檢測,明顯提高總體計算結果的精度,同時不會影響測量結果的準確度。在下一步工作中考慮將LOF 算法代替一元異常值檢測,作為自主研發絕對重力儀單組異常值檢測的通用算法。

猜你喜歡
測量檢測
“不等式”檢測題
“一元一次不等式”檢測題
“一元一次不等式組”檢測題
“幾何圖形”檢測題
“角”檢測題
把握四個“三” 測量變簡單
滑動摩擦力的測量和計算
滑動摩擦力的測量與計算
測量的樂趣
小波變換在PCB缺陷檢測中的應用
主站蜘蛛池模板: 亚洲中文字幕在线观看| 日本高清视频在线www色| 四虎永久免费在线| 欧美中日韩在线| 精品视频一区二区观看| a级毛片免费播放| 一区二区三区四区在线| 精品福利视频网| 第一页亚洲| 国产国产人成免费视频77777| 亚洲精品手机在线| 女人18一级毛片免费观看| 欧美激情视频一区| 97在线视频免费观看| 91九色视频网| 亚洲视频免费播放| 色综合中文综合网| 国产香蕉在线| 欧美区国产区| 视频国产精品丝袜第一页| 国产18页| 亚洲精品免费网站| 婷婷99视频精品全部在线观看| 丰满人妻一区二区三区视频| 国内精品久久人妻无码大片高| 亚洲中文字幕国产av| 国产精品免费福利久久播放| 成年人福利视频| 国产日韩av在线播放| 欧美日韩激情在线| 国产一区二区三区在线无码| 日韩在线观看网站| 素人激情视频福利| 久久亚洲国产一区二区| 日韩精品成人在线| 成人毛片在线播放| 国产男人天堂| 成人午夜天| 亚洲午夜18| 欧美亚洲国产精品第一页| 欧美五月婷婷| 天堂在线www网亚洲| 中文字幕在线视频免费| 国产在线八区| 尤物在线观看乱码| 国产精品一线天| 亚洲日本一本dvd高清| 色视频国产| 亚洲第一视频网站| 亚洲日韩精品综合在线一区二区 | 亚洲色图欧美激情| 日韩免费视频播播| 国产成人调教在线视频| 久久国产精品麻豆系列| 午夜性爽视频男人的天堂| 久久国产黑丝袜视频| aa级毛片毛片免费观看久| 欧美有码在线观看| 亚洲中久无码永久在线观看软件| 欧美精品一二三区| 久久久久久久97| 色综合天天娱乐综合网| 四虎影院国产| 超级碰免费视频91| 欧美在线精品怡红院| 狠狠操夜夜爽| 99九九成人免费视频精品| 国产成人精品优优av| 成人在线第一页| 国产精品嫩草影院av| 久久无码av三级| 国产尤物在线播放| www精品久久| 亚洲av无码人妻| 白浆免费视频国产精品视频 | 国产91小视频在线观看| 国产高清在线观看| AV天堂资源福利在线观看| 中文字幕欧美日韩| 夜夜爽免费视频| 久久亚洲AⅤ无码精品午夜麻豆| 国产网友愉拍精品视频|