

摘要:在城市現(xiàn)代化建設進程中,地下管線分布與應用較為復雜,傳統(tǒng)測繪數(shù)據(jù)處理與誤差分析方式難以應對繁雜數(shù)據(jù)量及高精度要求。隨著人工智能興起,其數(shù)據(jù)挖掘、智能識別等能力為測繪管線領域精準作業(yè)、高效管理提供了全新技術路徑與發(fā)展契機。深入探索人工智能在測繪管線數(shù)據(jù)處理與誤差分析中的應用,為提升測繪管線數(shù)據(jù)處理效率與精度提供了理論與實踐參考。
關鍵詞:人工智能;測繪管線;數(shù)據(jù)處理;誤差分析
一、前言
在城市化進程不斷加快的背景下,地下管線網(wǎng)絡變得越來越復雜,測繪管線數(shù)據(jù)規(guī)模和復雜性也在成倍地增加。面對大量、多源異構測繪數(shù)據(jù),傳統(tǒng)數(shù)據(jù)處理和誤差分析方法逐漸表現(xiàn)出局限性。人工智能技術以其較強的研究、分析和決策能力給測繪管線數(shù)據(jù)處理和誤差分析等工作帶來新機遇和新突破,可望有效解決目前所面臨的難題,提升測繪工作質(zhì)量和效率。
二、人工智能在測繪管線數(shù)據(jù)處理與誤差分析中的應用價值
人工智能應用于測繪管線數(shù)據(jù)處理和誤差分析,其應用價值無法估量。在數(shù)據(jù)處理中,人工智能可以對大量測繪管線數(shù)據(jù)進行有效處理。傳統(tǒng)數(shù)據(jù)處理方式通常會消耗大量人力及時間,深度學習卷積神經(jīng)網(wǎng)絡等人工智能算法能夠快速提取管線測繪圖像數(shù)據(jù)并加以分析,自動識別各種管線結構及其附屬設施,大大提高數(shù)據(jù)處理速度。同時人工智能可以融合多源異構數(shù)據(jù),實現(xiàn)不同傳感器、不同測量時期以及不同形式數(shù)據(jù)的統(tǒng)一加工,使得數(shù)據(jù)更規(guī)范、更有秩序,提高其可用性和兼容性[1]。
在誤差分析領域中,人工智能的價值也是十分引人注目的。該技術能夠準確地鑒別誤差的根源,無論是由于測量設備自身的系統(tǒng)誤差,還是由于外部環(huán)境因素,如地形變化、電磁干擾等導致的隨機誤差,人工智能模型均可以通過海量數(shù)據(jù)的研究與分析進行精確判斷。以支持向量機模型為例,該模型能夠根據(jù)數(shù)據(jù)分布特點對誤差數(shù)據(jù)進行分類并識別誤差類型。
同時,人工智能還能進一步對誤差進行修正,利用神經(jīng)網(wǎng)絡構建誤差修正模型,依據(jù)歷史誤差數(shù)據(jù)與真實值的關系學習修正規(guī)律,從而有效地修正新增誤差數(shù)據(jù),顯著提高測繪管線數(shù)據(jù)準確性與可靠性,并為城市地下管線規(guī)劃、施工、養(yǎng)護等工作提供扎實數(shù)據(jù)基礎,確保相關項目的順利實施和安全運營,促進測繪行業(yè)向著智能化和精準化的方向持續(xù)發(fā)展和進步。
三、人工智能測繪管線數(shù)據(jù)處理的方法
(一)數(shù)據(jù)清洗和整合
測繪管線數(shù)據(jù)處理過程中數(shù)據(jù)清洗和整合是一個極其關鍵的開始,而人工智能技術的運用則給它帶來了有效性和準確性。傳統(tǒng)數(shù)據(jù)清洗方式多是依靠人工逐個篩選數(shù)據(jù),并根據(jù)有限經(jīng)驗、規(guī)則進行異常值判斷,該方式對于大規(guī)模測繪管線數(shù)據(jù)處理顯得捉襟見肘。以某測繪項目為例,該測繪項目涉及城市供水、排水、燃氣等各類管線,數(shù)據(jù)量可以達到上億數(shù)據(jù)點,傳統(tǒng)的人工清洗工作可能耗時幾個月,精度很難得到保障[2]。在人工智能領域,像K-Means聚類算法這樣的聚類分析方法,能夠根據(jù)相似度特點將數(shù)據(jù)分類為多個不同的集群。以管線坐標數(shù)據(jù)為例,通過設定合適的聚類數(shù)量(按管線種類估算量等),算法將具有相似坐標范圍的管線數(shù)據(jù)聚在一起。在具體的操作過程中,對于一個由5種主要管線類型組成,總共擁有3億個坐標數(shù)據(jù)點的數(shù)據(jù)集,K-Means算法有能力在幾小時之內(nèi)完成初步的聚類工作,能夠迅速地識別出那些明顯偏離聚類中心的數(shù)據(jù)點,這些數(shù)據(jù)點可能是由于測量誤差或數(shù)據(jù)輸入錯誤導致的異常數(shù)據(jù),異常數(shù)據(jù)的識別準確率可以達到96%以上。
在數(shù)據(jù)整合方面,由于測繪管線數(shù)據(jù)來源廣泛,包括不同的測量儀器(GPS接收機、全站儀等)、不同的數(shù)據(jù)格式(CAD格式、GIS格式等)以及不同的坐標系(大地坐標系、地方獨立坐標系等),傳統(tǒng)整合過程復雜且易錯。人工智能采用神經(jīng)網(wǎng)絡技術,構造智能數(shù)據(jù)整合模型。例如,在對不同坐標系下管線數(shù)據(jù)的處理中,神經(jīng)網(wǎng)絡就通過對不同坐標系間轉換關系的學習來構建自動化坐標轉換模型。在一個涉及將多個地方坐標系下的管線數(shù)據(jù)整合到大地坐標系的項目中,經(jīng)過對10萬條樣本數(shù)據(jù)的訓練,該模型能夠?qū)⒉煌鴺讼迪碌墓芫€數(shù)據(jù)準確轉換并整合,經(jīng)過整合,數(shù)據(jù)的坐標誤差平均值被限制在0.1米之內(nèi),極大增強了數(shù)據(jù)的一致性和實用性。
(二)特征提取和選擇
在測繪管線數(shù)據(jù)處理過程中,特征的提取和選擇起到了核心作用,表現(xiàn)直接決定了后續(xù)數(shù)據(jù)分析和應用的精確度和效率,人工智能在此領域展現(xiàn)了獨到的技術優(yōu)越性[3]。傳統(tǒng)特征提取往往是建立在人為建立的數(shù)學模型或者簡單統(tǒng)計方法上,對復雜測繪管線數(shù)據(jù)很難完全挖掘出其內(nèi)在特征。以管線點云數(shù)據(jù)特征提取為例,傳統(tǒng)方法或許僅能提取點坐標、距離等基本幾何特征,但很難捕獲深層次拓撲結構與語義特征。在深度學習領域,卷積神經(jīng)網(wǎng)絡(CNN)技術為特征抽取提供了一種高效的解決策略。以一個包含1000萬個點的三維管線點云數(shù)據(jù)為例,CNN模型通過多層卷積層和池化層的組合,能夠自動學習管線的復雜幾何特征,如管線的彎曲程度、管徑變化、連接方式等。在對不同類型管線(金屬管、塑料管等)的分類任務中,使用CNN提取特征后的分類準確率相比傳統(tǒng)方法提高了35%左右,達到了92%以上的準確率。
就特征選擇而言,方差閾值法和卡方檢驗這類常規(guī)特征選擇方法對于處理高維和相關性復雜的測繪管線數(shù)據(jù)有一定局限性。而以人工智能為基礎的隨機森林算法,在特征選擇方面具有優(yōu)異的性能。例如,在一個包含50個特征(其中包括管線的物理屬性、地理環(huán)境屬性)的測繪管線數(shù)據(jù)集上,隨機森林算法通過評估每個特征在構建決策樹過程中的重要性得分,篩選出最重要的10至15個特征。在進行管線老化程度的評估任務時,采用隨機森林選擇特征構建的模型,其評估誤差比使用全部特征構建的模型降低了大約20%,在降低數(shù)據(jù)處理計算量與時間成本的前提下,有效地增強了模型泛化能力與預測精度(見表1)。
四、人工智能在測繪管線數(shù)據(jù)誤差分析中的應用
(一)根據(jù)機器學習對誤差數(shù)據(jù)進行篩選
在對測繪管線數(shù)據(jù)進行誤差分析時,以機器學習為基礎對其進行甄別是至關重要的首要環(huán)節(jié)。傳統(tǒng)數(shù)據(jù)篩選方法通常依靠人為設置的固定閾值或者簡單統(tǒng)計規(guī)則來進行篩選,該方法很難處理復雜多樣的測繪數(shù)據(jù)環(huán)境和多樣化誤差來源。機器學習算法,如支持向量機(SVM)和決策樹算法,可以通過學習大量的已知樣本數(shù)據(jù),自動構建數(shù)據(jù)特征與誤差之間的復雜關系模型[4]。
以某大型測繪項目為例,該項目涉及各種地形及管線材質(zhì),采集自不同測量儀器、不同測量時段的管線測繪資料,數(shù)據(jù)量達上百萬個數(shù)據(jù)點。首先,將其中一部分數(shù)據(jù)經(jīng)過精確驗證。例如,將通過高精度實地測量進行復查的數(shù)據(jù)作為訓練集,這些數(shù)據(jù)包含了已知的誤差數(shù)據(jù)和正常數(shù)據(jù),并標記出誤差類型和程度。利用SVM算法對訓練集進行學習,SVM算法通過尋找一個最優(yōu)的超平面將不同類別的數(shù)據(jù)(誤差數(shù)據(jù)與正常數(shù)據(jù))分開,在此過程中要綜合考慮管線坐標值、測量時間間隔和周圍地理環(huán)境特征等多維因素。訓練好的SVM模型在用于對整個數(shù)據(jù)集進行篩選時對可能存在的錯誤數(shù)據(jù)進行精確辨識。在實際測試中,與傳統(tǒng)基于閾值的篩選方法相比,SVM算法對于小誤差(如果坐標的偏移范圍是0.1至0.5米)的檢出率提高了約30%,達到了85%以上的檢出準確率,對于大誤差(坐標偏差大于0.5米)的檢出準確率更是高達98%以上(見表2)。同時,決策樹算法又因其具有可解釋性,能直觀顯示數(shù)據(jù)特征和誤差判斷的邏輯關系,如能明顯顯示管線測量點處于山區(qū)和測量時間為下午時,某一類誤差發(fā)生的可能性較大,有利于進一步對其成因及規(guī)律進行深入分析,并為之后的誤差修正與防范提供了強有力的依據(jù)。
(二)神經(jīng)網(wǎng)絡的助力誤差種類區(qū)分
神經(jīng)網(wǎng)絡對于區(qū)分測繪管線數(shù)據(jù)的錯誤種類有著突出的表現(xiàn)。傳統(tǒng)誤差類型區(qū)分方法多依賴于人工經(jīng)驗及簡單統(tǒng)計分析,對復雜測繪管線數(shù)據(jù)誤差分類通常不精確、不全面。神經(jīng)網(wǎng)絡,特別是深度神經(jīng)網(wǎng)絡,有能力通過構建復雜的多層結構來模仿人類大腦的學習過程,進而能夠?qū)φ`差數(shù)據(jù)進行深度特征的提取和分類判斷[5]。
以一個包含多種管線系統(tǒng)(供水、排水、燃氣等)的城市測繪管線數(shù)據(jù)為例,數(shù)據(jù)集中存在系統(tǒng)誤差(測量儀器校準偏差等)、隨機誤差(環(huán)境干擾引起測量波動等)以及粗大誤差(人為操作失誤導致數(shù)據(jù)錯誤等)多種類型的誤差,數(shù)據(jù)總量約為千萬級別。構建一個多層感知機(MLP)神經(jīng)網(wǎng)絡模型,該模型的輸入層涵蓋了管線測量數(shù)據(jù)的多個特性,包括測量值、測量時間和測量地點坐標等,中間隱藏層通過設置不同數(shù)量的神經(jīng)元(如50至200個)來學習數(shù)據(jù)的抽象特征,輸出層則對應不同的誤差類型[6]。
在MLP神經(jīng)網(wǎng)絡的訓練階段,使用了大量標注誤差類型的樣本數(shù)據(jù)進行訓練,并通過反向傳播算法持續(xù)調(diào)整神經(jīng)網(wǎng)絡的權重和閾值,目的是最大限度地減少預測誤差。在經(jīng)歷了數(shù)十萬輪的訓練和迭代之后,該神經(jīng)網(wǎng)絡在測試數(shù)據(jù)集上能夠?qū)崿F(xiàn)90%以上的誤差類型識別準確率[7]。
(三)深度學習帶動誤差模型的建立
深度學習給測繪管線數(shù)據(jù)誤差模型的建立帶來創(chuàng)新解決思路。傳統(tǒng)誤差模型的建立大多是通過線性回歸模型或者簡單數(shù)學函數(shù)來進行擬合,很難處理測繪管線數(shù)據(jù)的非線性關系以及誤差分布的復雜性問題[8]。在深度學習領域,像卷積神經(jīng)網(wǎng)絡(CNN)和循環(huán)神經(jīng)網(wǎng)絡(RNN)這樣的技術可以有效地捕獲數(shù)據(jù)中的復雜模式和動態(tài)變化,從而構建出更加精確的誤差模型。
例如,在處理隨時間序列變化的管線測量數(shù)據(jù)(管線壓力、流量連續(xù)監(jiān)測資料等)時,數(shù)據(jù)具有明顯的時間相關性和非線性特征,數(shù)據(jù)長度可達數(shù)萬甚至數(shù)十萬時間步長。使用RNN和其衍生的長短期記憶網(wǎng)絡(LSTM)來建立誤差模型,LSTM網(wǎng)絡可以通過其記憶單元來保存和傳輸過去的時間序列信息,進而揭示數(shù)據(jù)中的長期依賴性。以一個包含50,000個時間步長的管線流量監(jiān)測數(shù)據(jù)為例,將數(shù)據(jù)分為訓練集(80%)和測試集(20%)。訓練時,LSTM網(wǎng)絡基于輸入歷史流量數(shù)據(jù)對當前時間步流量值進行預測,將計算誤差與實際測量值進行比較,通過持續(xù)調(diào)節(jié)網(wǎng)絡參數(shù)使誤差函數(shù)達到最小[9]。經(jīng)過長時間的訓練后,構建的誤差模型在測試集上的預測誤差均方根(RMSE)可控制在0.05以內(nèi),相比傳統(tǒng)的線性回歸模型,RMSE降低了約60%。對于卷積神經(jīng)網(wǎng)絡(CNN),在處理管線測繪圖像數(shù)據(jù)(管線鋪設地理影像、管線內(nèi)部結構影像)中的誤差建模時,CNN可以自動對圖像進行邊緣、紋理和其他空間特征提取,并且建立起和誤差分布的聯(lián)系。
(四)智能算法對誤差修正策略進行優(yōu)化
誤差修正部分智能算法起到了至關重要的作用。例如,利用遺傳算法對修正參數(shù)進行優(yōu)化,該算法將誤差最小化作為目標函數(shù)并對修正模型的各參數(shù)進行編碼。在測繪管線坐標誤差校正處理中,對校正參數(shù),如平移和旋轉,進行染色體編碼。通過選擇、交叉和變異的遺傳操作不斷地迭代尋找最優(yōu)的參數(shù)組合[10]。經(jīng)大量樣本數(shù)據(jù)檢驗,修正精度明顯提高。
例如,在粒子群優(yōu)化算法中,大量的粒子在解空間內(nèi)飛行,而每一個粒子都代表著一種用于誤差修正的解決方案。粒子依據(jù)自身經(jīng)驗及群體最優(yōu)經(jīng)驗,動態(tài)地調(diào)節(jié)飛行方向和速度,并迅速收斂到較優(yōu)修正策略。針對復雜管線網(wǎng)絡誤差校正問題,所提算法能夠有效地兼顧局部和全局搜索,使得校正后管線數(shù)據(jù)更加接近真實情況,提高整體測繪管線數(shù)據(jù)的質(zhì)量和可靠性。
五、結語
總之,人工智能對于測繪管線的數(shù)據(jù)處理和誤差分析顯示出了很大的潛力。盡管目前在算法優(yōu)化、數(shù)據(jù)需求等方面仍面臨挑戰(zhàn),但隨著技術的不斷演進,其應用前景十分廣闊,有助于測繪行業(yè)更加高效準確地進行數(shù)據(jù)處理,為城市地下管線進行科學規(guī)劃和安全運維提供了堅實的保障,促進測繪領域走向智能化發(fā)展的新時代。
參考文獻
[1]陳立娜,李真,宋輝.基于人工智能的無人機測繪遙感圖像信息提取方法[J].電子設計工程,2023,31(24):181-185.
[2]李嘎.人工智能下信息化測繪方法的思考[J].品牌與標準化,2023(03):165-167.
[3]吳健,魯啟峰.基于人工智能技術的測繪產(chǎn)品質(zhì)量檢驗系統(tǒng)設計[J].科技資訊,2023,21(23):32-35.
[4]劉惠祥.人工智能在測繪科技中的應用研究[J].江西測繪,2022(04):55-58+64.
[5]張華.人工智能2.0與測繪地理信息的融合發(fā)展研究[J].中國高新科技,2022(18):10-11.
[6]張偉.“多測合一”中若干關鍵測繪技術的應用與研究[J].西部資源,2024(05):96-99.
[7]單長城.測繪工程中三維城市測量技術的應用探究[J].智能建筑與智慧城市,2024(09):52-54.
[8]王磊.上海市地下管線全生命周期規(guī)劃管理機制和技術支撐體系建設研究[J].城鄉(xiāng)規(guī)劃,2024(03):82-90.
[9]陳安偉.地下管線測繪工作中北斗導航系統(tǒng)的實施[J].信息系統(tǒng)工程,2024(05):11-14.
[10]唐吉林.城市地下管線測繪測量技術方法[J].城市建設理論研究(電子版),2024(03):175-177.
作者單位:南通市測繪院有限公司
責任編輯:張津平 尚丹