999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于機器學習的激光測距墻線目標自動分類方法*

2023-10-08 06:56:06蔡文郁劉一博吳培鵬盛慶華
傳感技術學報 2023年8期
關鍵詞:分類特征測量

蔡文郁,劉一博,吳培鵬,盛慶華

(杭州電子科技大學,電子信息學院,浙江 杭州 310018)

近年來,我國電網的基礎建設取得了迅速發展,電力巡檢的一項重要任務是檢測架空輸電線路的安全距離,巡檢常用的方法有激光測距[1-3]、圖像識別[4-5]等。 文獻[6-7]在巡檢無人機上使用圖像處理技術進行目標檢測和缺陷識別,但對于復雜環境或自然缺陷[8]樣本的識別較差。 文獻[9-10]通過GPS 定位獲得機載的位置后使用激光測距技術精確定位輸電線故障點位置,定位偏差約為0.1 m ~0.4 m。 由于激光測距具有精度高、測距時間快、測量結果直觀等特性,因此在線路巡檢量測中應用最為廣泛。

雖然目前激光測距的研究已較為成熟,但在遠距離電力巡檢等復雜環境下,易受到環境干擾,例如光學鏡頭引入的背景噪聲,天氣環境的影響,被測目標的反射面情況,這些因素仍會影響測距精度。 由于電線圓柱體的特性,電線表面上不同位置對應的反射角度不同,因此激光光斑打在電線反射面的不同位置,將導致回波信號強度和上升沿速度與墻目標存在差異。 文獻[11-14]研究了被測目標的距離、反射面,環境的光強、濕度等外部因素對激光測距誤差的影響。 文獻[15-17]使用了雙閾值時刻鑒別法、高通阻容時間鑒別法和多延遲觸發等方法消除回波強度變化引起的時間漂移誤差。 近年來,深度學習技術在激光測距領域有較多應用,胡善江等[18]使用LeNet 模型解算回波時刻,Xu 等[19]使用CNN 模型自動學習回波信號的特征,但其真實環境下數據集的建立以及泛化能力仍值得探討。 因此,可以發現,大小不同的測量目標特征對測距結果有明顯的影響,必須進行區分處理。 雖然上述研究對激光測距回波信號的反射特征進行了初步研究,但是并沒有對以墻為典型的大目標、以線為典型的小目標實現目標自動分類。

為了提高激光測距系統在電力巡檢場景下測量不同目標物體的精度,本文研究了數據預處理濾波和統計機器學習分析方法,提出了一種基于機器學習的激光測距墻線目標分類方法。 通過建立XGBoost+LR 墻線分類模型,使用XGBoost 模型進行特征組合重構訓練集,使用RF 模型對稀疏訓練集進行特征篩選降低維度,最后采用LR 模型進行線性區分,實現墻線等大小目標的自動分類。

1 基于機器學習的激光測距墻線目標分類方法

1.1 激光測距模型

為了實現遠距離測距,本文采用脈沖飛行時間(Time of Flight,TOF)激光測距技術,并且引入多閾值誤差擬合修正方法[20]和自動增益控制電路[21]以提高測距精度和測距量程。 本文所研究的激光測距系統模型如圖1 所示。

圖1 激光測距系統模型

圖1 所示的數據采集模塊從激光測距儀硬件中獲得測量數據,主要原理是控制電路觸發激光管發射脈沖并標定為起始時刻tstart,自動增益控制電路根據回波信號幅值自動調整接收電路增益q,使其滿足大于閾值電壓V1的條件,而且標定此時為停止時刻tend,時間測量模塊計算激光脈沖的飛行時間tend-tstart計算出離被測目標的距離dist =c×(tendtstart)/2,式中c為光在真空中傳播速度3×108m/s。如圖1 所示,設定閾值電壓V2、V3,假設V2對應時刻為t2,定義閾值時間差Δt用于修正補償距離,計算公式如下:

Δt值越小,波形上升沿時間越短,即更加接近于理想的高斯脈沖信號。 定義飽和度g用于判定波形是否飽和,當波形幅值達到閾值電壓V3,判定為波形飽和,反之判定為波形不飽和。

因此,激光測距儀數據即為分類模塊的輸入樣本空間T{x1,x2,…,xN},每個樣本xi包含增益q、測量距離dist、閾值時間差Δt和飽和度g四個變量值。 由于系統固有的干擾和噪聲具有隨機不確定性,因此必須進行數據預處理。 本文采用自適應k-Means 算法,從含有噪聲的數據中聚類出有效數據作為新的樣本空間T′。

測量墻面等大目標時,回波信號幅值較大;測量電線等小目標時,回波信號幅值較小且上升沿緩慢[22]。 雖然墻線不同目標的激光測距回波數據分布存在著差異,但是回波信號的差異經過自適應放大調理后,已經無法直觀顯示不同測量目標的區別。僅僅依靠電路增益、測量距離、閾值時間差等變量無法完全區分出測量目標,因此本文從樣本空間T′中計算了新的11 維特征向量f{X1,X2,…,X11},綜合使用XGBoost+LR 機器學習模型訓練由J個特征向量f構成的特征空間F{f1,f2,…,fJ},從而得到墻線二分類模型。 通過上述過程,輸出樣本空間T′和該樣本空間對應的測量目標標簽y,最終對墻和線不同測量目標進行不同的修正處理方法。

1.2 特征空間選擇

經實際數據測試與分析可以發現,墻和線目標主要存在以下差異:

①測量近距離墻等大目標時,回波信號基本飽和,即在較低增益下就可以得到較多的測距結果,測量出錯次數較少,距離、閾值時間差等波動較小且穩定。

②當測量目標為線等小目標時,回波信號幅值受實際測量距離、對準等因素影響,電路增益較高,測距結果數量較少,測量出錯次數相對較多。

根據以上測量差異,本文從樣本空間T′中提取出以下11 維數據特征,如表1 所示。

表1 特征數據

以下為各個特征數據在不同測試環境下的分布情況,圓形標注的數據為測量目標為線目標的實際測量數據,叉形標注的數據為測量目標為墻目標時的實測測量數據。 圖2 表明在不同維度特征下不同測量目標分布情況存在一定差異,但是單獨使用某一個維度特征無法完全實現墻線等目標的自動分類。

圖2 墻目標和線目標的不同特征測試數據

1.3 基于自適應k-Means 聚類的數據預處理方法

云霧、雨滴、粉塵等對回波信號產生散射效應,同時太陽光中包含了測距激光所在波長段的能量干擾。 這些散射噪聲具有隨機性和不確定性,因此本文提出了一種自適應k-Means 聚類算法,用以激光測距中噪聲數據的篩選與剔除。 圖3 為測試集1(100 m 測距情況)的閾值時間差數據分布情況,橫坐標為距離dist 值,縱坐標為閾值時間差Δt。 有效數據(label0,圖中圓形標注)的測試結果較多且密集度高,由云霧、雨滴、粉塵等因素引起噪聲(如label1,圖中下三角標注)的分布表現為局部密集,但數據量少于正常數據,由太陽光等因素引起的噪聲,分布表現為空間范圍內零散隨機出現。

圖3 測試集1(100 m 測距)數據分布圖

本文提出了一種自適應k-Means 聚類算法,從含有噪聲的樣本空間中提取出干凈的有效樣本,主要步驟如下所示:

①通過計算樣本空間的密度參數來確定初始的聚類中心位置,避免因隨機選取初始聚類中心而造成的震蕩。

②以最快降低誤差平方和(Sum of Squared Error,SSE)為目的,自適應調整聚類中心個數,降低離群點對迭代過程的影響。 具體地,算法首先使用RobustScaler 方法[23]對樣本空間T{x1,x2,…,xN}進行標準化處理,計算公式如下:

式中:Q(index)為數據x中索引index 的分位數,Q(50)表示數據x的中位數,Q(75)-Q(25)表示x的四分位距。 RobustScaler 方法相較于Min-Max 歸一化方法[24]降低了離群值對標準化的影響,相比ZScore 中心化方法[24]最大限度地保留了離群值特征。

③定義樣本xi局部密度函數Density(xi),其值為5 個最近鄰樣本距離xi的歐氏距離平均值。 將樣本空間中最密集點定義為第一個聚類中心C1,將最稀疏點定義為第二個聚類中心C2。

④迭代過程同K-Means,計算樣本xi與每個聚類中心的相似度(歐氏距離),并將樣本歸于最近的聚類中心Ck。 如果最大SSE 樣本的誤差大于設定閾值,則將該樣本定義為新的聚類中心,并更新此樣本的近鄰點,以快速降低SSE 并減少離群點對聚類效果的影響。

⑤重復迭代過程,直到聚類中心不再更新或滿足迭代條件,輸出樣本最多的簇作為新的樣本空間T′。

1.4 基于XGBoost+LR 機器學習的多特征融合分類方法

本文使用XGBoost+LR 機器學習算法建立多特征融合的墻線分類模型,以解決墻線目標之間的量化誤差問題和學習特征組合必要性的問題。 由于LR 模型對于特征組合上存在學習局限性,而GBDT模型正好可以用來挖掘特征之間的關聯,將回歸樹中每個節點的分裂看作是自然的特征選擇過程,多層節點的結構對特征進行了有效的自動組合。GBDT+LR 結合模型[25]將LR 和GBDT 兩個模型相結合完善分類模型,GBDT 進行特征組合,將數據高維化,使其變得線性可分,帶正則項的LR 線性模型對于高維的稀疏矩陣有很好的處理能力,并不容易過擬合。 XGBoost 使用牛頓法進行梯度更新,對損失函數進行了二階泰勒公式展開并加入了正則項,獲得了比GBDT 更優的運算速度和精度。 本文以XGBoost模型代替GBDT+LR 結合模型中的GBDT 模型,同時,由于XGBoost 輸出的特征組合向量高度稀疏,因此在LR 模型前加入一層RF 特征選擇層,以降低模型復雜度,圖4 為XGBoost+LR 結合模型框架。

圖4 XGBoost+LR 墻線分類模型

圖4 中XGBoost 模型對含有J個樣本的數據集T{(f1,y1),(f2,y2),…,(fJ,yJ)}進行訓練,得到含有M棵CART 決策樹的分類模型。 將樣本xi落在第m棵決策樹Tm的葉節點位置標記為1,其余葉節點標記為0,則可得到該棵樹的稀疏向量lm,組合M棵樹的稀疏向量構成該樣本xi特征組合向量(li1,li2,…,liM),最終組合所有樣本點獲得新的訓練數據集T{(l1,y1),(l2,y2),…,(lJ,yJ)}。

由上可知,對于復雜度(決策樹個數)為complexity,深度(決策樹大小)為depth 的XGBoost 模型,其最大葉結點個數為complexity×2depth,其中標記為1 的個數為complexity,構成的新訓練集高度稀疏,且這種稀疏程度受模型復雜度和深度影響,過大的特征維度將導致LR 分類器參數更新緩慢且易過擬合。 因此,在LR 分類模型訓練前,本文使用隨機森林RF 算法對特征組合向量l進行重要度評估,篩選出重要程度較高的部分特征,篩選閾值定義為:

篩選后的數據集縮小為T′,送入LR 分類器進行訓練得到墻線目標二分類模型。

2 實驗與測試結果

2.1 數據聚類去噪性能測試

為衡量自適應k-Means 算法相較k-Means、k-Means++對于激光測距對噪聲數據的剔除性能,本文使用輪廓系數Silhouette 和調整互信息AMI[26]作為評價指標。 Silhouette 為內部指標,反映了聚類內緊湊程度和聚類外分散程度的差異。 AMI 為外部指標,計算預測標簽和真實標簽的互信息分數來衡量相似程度。

表2 為三種k-Means 算法對3 個測試數據集聚類效果比較結果。k-Means++和自適應k-Means 相較于k-Means 算法有更快的運行時間,k-Means 采用隨機方式選取初始聚類中心位置,迭代后的聚類中心位置也存在一定隨機性,即陷入局部最優,這也造成了k-Means 算法在三個測試集下的調整互信息(準確率)最低。 自適應k-Means 相較于k-Means++能夠自適應地確定最優化的k值,從而調整聚類中心個數,同時聚類中心的選取以快速下降SSE 為目的,因此對離群噪聲有更好的處理效果。

表2 三種k-Means 算法聚類效果比較

圖5 為三種k-Means 算法對測試集1(100 m 測距情況)的聚類效果比較,圖5(d)中自適應k-Means設定了21 個聚類中心,因此同樣設定k-Means 和k-Means++的k值為21,另外增加了k值為10 的k-Means++對照組。 圖5(a)中k-Means 算法將有效數據(label0)分裂為多個簇,這與其隨機選取聚類中心有關,初始聚類中心大概率選取在密集處。k-Means++相較于k-Means,初始聚類中心設置更加合理,但是k值無法自主確定:選取較小k值(k=10)時(如圖5(b)所示),噪聲數據被歸為有效數據集;選取較大k值(k=21)時(如圖5(c)所示),能較好地將有效數據分離出來,但是k值需要依靠人工經驗確定。 自適應k-Means 算法在迭代中自動調整聚類中心個數,彌補了k-Means 和k-Means++算法的缺陷,同時對離群噪聲點有很好的處理效果。

圖5 三種k-Means 算法對測試集1(100 m 測距)聚類效果

2.2 目標自動分類性能測試

為了驗證XGBoost+LR 分類器在線墻目標分類的性能,本文通過k-Fold 交叉驗證方式[27],將數據劃分成k份,其中1 份作為測試集,其余k-1 分用于訓練模型。 分別使用邏輯回歸(Logistic Regression,LR)、隨機森林(Random Forest,RF)、梯度提升決策樹(Gradient Boosting Decision Tree,GBDT)、梯度提升決策樹+邏輯回歸(GBDT+LR)這4 種模型作為對比模型。

對于二分類問題,利用模型預測值和真實值計算混淆矩陣[28],以評價模型的性能,墻線二分類問題中混肴矩陣的描述如表3 所示。

表3 二分類問題判決表

評價二分類模型性能的指標常采用準確率Accuracy 和F1_Score 值[27],計算公式如下:

式中:Accuracy 表示預測的準確率,即預測正確的樣本占總樣本的比例。 F1_Score 是對精確度Precision和召回率進行綜合考慮得出的指標。

ROC 曲線是分類器性能直觀的評價工具[28],以假陽性率(FPR)為橫坐標,真陽性率(TPR)為縱坐標,將預測為陽性的概率作為閾值,通過遍歷所有預測的概率,得到多組FPR 和TPR 的坐標值,該曲線越靠近左上角延伸即曲線下方的面積AUC 值越大,表明分類器性能越好。 圖6 為不同模型對應的一次ROC 曲線,LR 模型的AUC 為最低的0.918,說明單一學習器模型的性能遠低于集成學習器模型。GBDT 模型相較于RF 模型,在建模策略上串行地擬合上一決策樹的殘差,因此它的損失函數在每次迭代中局部降低,能更好地提高模型精度。 GBDT+LR和XGBoost+LR 模型的AUC 曲線面積最大,分別為0.993 和0.999,驗證了在GBDT 或XGBoost 基礎上疊加LR 模型比僅使用GBDT 或XGBoost 模型獲得了更好的性能。

圖6 不同模型的ROC 曲線圖

表4 是不同模型的準確率Accuracy、精確度Precision、召回率Recall、F1_Score 值和AUC 的對比結果。 從表4 可以看出,XGBoost+LR 模型的分類效果總體上優于其他4 種模型,準確率達到了98.3%,召回率Recall 和F1_Score 值分別達到了98.1%和98.2%,說明此模型具有很好的預測性能。 LR 模型的5 項指標都最低,準確率僅為85.8%,證明單憑線性系統無法完全區分測距數據集。 GBDT+LR、XGBoost+LR 的結合模型將數據引向高維化,使其變得線性可分,一定程度上提高了分類模型性能。 同時本文使用XGBoost 替代GBDT+LR 中的GBDT 模型進行特征組合,并使用RF 篩選出重要的特征組合送入LR 分類器進行訓練,以期望提高模型精度和運算速度。

表4 不同模型評價指標對比

圖7 比較了GBDT+LR 和XGBoost+LR 模型的訓練時間開銷與最大葉節點數量(模型復雜程度)關系曲線。 由圖7 可知,XGBoost+LR 模型的運算速度優于GBDT+LR 模型,而且隨著模型復雜程度的提升愈加明顯。 其一是因為XGBoost 使用牛頓法二階逼近損失函數最優,獲得了更快的收斂速度,其二是使用RF 模型進行特征組合的篩選,很大程度降低了XGBoost 模型輸出的稀疏矩陣維度,當葉節點數為3 043 時,經RF 模型篩選后僅保留了64 維特征,LR 分類器也獲得了更快的收斂速度。

圖7 兩種模型的最大葉節點個數與時間開銷關系曲線

2.3 測距精度測試結果比較

為驗證墻線目標自動分類方法對激光測距系統精度的影響,本文以TruPulse200 型號激光測距儀[29]為標準,對比有無自動目標分類時的測量誤差。 本文選取不同測試環境和天氣下的2 067 個樣本,其中1 056 個樣本被分類為線目標,1 011 個樣本被分為墻目標,線目標樣本的測試范圍為20 m~120 m,墻目標樣本的測試范圍為0 ~1 000 m,測試環境如圖8 所示。

圖8 實際測試場景

本文使用最小二乘法擬合距離、增益、閾值時間差關于真實距離(TruPulse200 激光測距儀結果)的曲線,通過測試得到2 067 個樣本的標準差曲線如圖9 所示。

圖9 有無墻線分類時激光測距的標準差曲線圖

圖9(a)為未進行墻線分類時的測距標準差曲線,1 000 m 距離段的標準差維持在0 ~0.35 之間,圖9(b)和圖9(c)分別為進行本文提出的墻線目標自動分類方法后歸類為墻和線的測距標準差曲線,歸類為墻目標時前100 m 的標準差在0 ~0.1 之間,100 m~900 m 的標準差在0 ~0.2 之間,歸類為線目標時120 m 范圍內標準差在0.05~0.25 之間。 通過對比有無使用墻線分類方法時的標準差,可以發現本文提出的墻線自動分類方法能有效提高測距精度,減小測量誤差,同時一定程度上降低了測量的數據抖動。 墻線自動分類方法能根據測量數據自動區分出測量目標為墻或線,對墻目標和線目標采用不同的數據擬合方式,經測試測量目標為墻時,標準差低于0.2 m,測量目標為線時標準差低于0.25 m。

3 結論

為了提高激光測距系統在電力巡檢場景下測量不同目標物體的精度,本文提出了一種基于機器學習的激光測距墻線目標分類方法。 針對散射噪聲問題,在數據預處理階段提出了一種自適應k-Means聚類算法,基于密度確定初始聚類中心并在迭代過程自適應調整k值,實驗驗證本方法能較好處理離群噪聲數據,篩選出有用數據。 針對墻線目標分類問題,本文了建立了XGBoost+LR 墻線分類模型,使用XGBoost 模型進行特征組合重構訓練集,使用RF模型對稀疏訓練集進行特征篩選,降低維度,最后使用LR 模型進行線性區分。 經測試驗證,XGBoost+LR 墻線自動分類的準確率達到98.2%,較GBDT+LR 模型提高了1.3%,運算速度提升明顯。

猜你喜歡
分類特征測量
分類算一算
如何表達“特征”
把握四個“三” 測量變簡單
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
分類討論求坐標
滑動摩擦力的測量和計算
數據分析中的分類討論
滑動摩擦力的測量與計算
教你一招:數的分類
抓住特征巧觀察
主站蜘蛛池模板: 国产亚洲精品97在线观看| 久无码久无码av无码| 国产av色站网站| 九九久久99精品| 国产迷奸在线看| 国产第四页| 亚洲成a人片在线观看88| 激情六月丁香婷婷四房播| 2020国产免费久久精品99| 青青草原国产免费av观看| 毛片视频网址| 免费在线a视频| 毛片网站在线看| 中文字幕人成人乱码亚洲电影| 亚洲天堂视频在线观看免费| 久久久久中文字幕精品视频| 伊人久久婷婷| 手机成人午夜在线视频| 亚洲国产日韩视频观看| 日本成人在线不卡视频| 国产微拍一区二区三区四区| 国产精品9| 亚洲第一精品福利| 草逼视频国产| 色噜噜综合网| 日韩在线永久免费播放| 2019国产在线| 国产亚洲视频免费播放| 永久免费精品视频| 午夜高清国产拍精品| 亚洲丝袜中文字幕| 国产剧情伊人| 国产精品成人免费视频99| 亚洲人成影视在线观看| 亚洲一欧洲中文字幕在线| 国产69精品久久久久妇女| 在线观看91精品国产剧情免费| 婷婷亚洲综合五月天在线| 精品亚洲国产成人AV| 亚洲无码91视频| 日韩一区二区三免费高清| 夜夜高潮夜夜爽国产伦精品| 99成人在线观看| 午夜小视频在线| 激情无码字幕综合| 欧美精品成人一区二区在线观看| 日韩av无码DVD| 成人欧美在线观看| 三级视频中文字幕| 有专无码视频| 国产一区二区三区在线观看免费| 亚洲精品大秀视频| 国产高清精品在线91| 国产精品成人AⅤ在线一二三四 | 欧美成人手机在线观看网址| 国产精品乱偷免费视频| 国产大片黄在线观看| 乱色熟女综合一区二区| 丁香六月激情婷婷| 在线另类稀缺国产呦| 婷婷六月综合网| 蜜桃视频一区| 在线免费亚洲无码视频| 精品一区二区三区无码视频无码| 精品伊人久久久香线蕉| 亚洲人成网站在线观看播放不卡| av午夜福利一片免费看| 亚洲h视频在线| 国产精品成人一区二区| 欧美亚洲另类在线观看| 国产高颜值露脸在线观看| 国产特级毛片aaaaaaa高清| 国产成人亚洲欧美激情| 91在线一9|永久视频在线| 国内精品久久久久久久久久影视| a在线观看免费| 久久青青草原亚洲av无码| 美女免费精品高清毛片在线视| 视频二区欧美| 国产在线拍偷自揄观看视频网站| 国产精品自拍露脸视频| 91美女在线|