






摘" 要: 針對(duì)海洋的現(xiàn)代化智能觀測(cè)需求,提出一種基于模糊SVM算法的海洋觀測(cè)數(shù)據(jù)智能處理算法。為了解決海洋多維指標(biāo)數(shù)據(jù)的線性不可分問(wèn)題,采用模糊隸屬度對(duì)訓(xùn)練樣本進(jìn)行模糊映射,并在此基礎(chǔ)上利用拉格朗日模糊偏導(dǎo)數(shù)方法將最優(yōu)化問(wèn)題轉(zhuǎn)化為二次規(guī)劃問(wèn)題,從而求解出最佳決策函數(shù)。此外,采用基于樣本鄰近密度的模糊隸屬度函數(shù)構(gòu)造方法,有效降低了異常樣本對(duì)決策函數(shù)訓(xùn)練的影響。仿真結(jié)果表明,相比于現(xiàn)有算法,所提算法對(duì)海洋觀測(cè)數(shù)據(jù)處理的正確率高于95%,且對(duì)于多種海洋觀測(cè)專(zhuān)業(yè)指標(biāo)均具有良好的適用性。
關(guān)鍵詞: 海洋智能觀測(cè); 模糊SVM算法; 模糊隸屬度; 決策函數(shù); 模糊映射; 二次規(guī)劃
中圖分類(lèi)號(hào): TN919.5?34" " " " " " " " " " " " " 文獻(xiàn)標(biāo)識(shí)碼: A" " " " " " " " " " " "文章編號(hào): 1004?373X(2025)08?0133?06
Design of intelligent processing algorithm for ocean observation data
QI Guangpeng1, 2
(1. School of Physics and Electronic Engineering, Northeast Petroleum University, Daqing 163318, China;
2. Inspur Yunzhou Industrial Internet Co., Ltd., Jinan 250000, China)
Abstract: In order to meet the needs of modern intelligent ocean observation, an intelligent ocean observation data processing algorithm based on fuzzy support vector machines (SVM) algorithm is proposed. In order to solve the linear indivisibility problem of marine multi?dimensional index data, the fuzzy membership degree is used conduct the fuzzy mapping for the training samples. On this basis, the Lagrange fuzzy partial derivative method is used to transform the optimization problem into a quadratic programming problem, so as to solve the optimal decision function. The influence of abnormal samples on the training of decision function is effectively reduced by means of the fuzzy membership function construction based on sample adjacent density. The simulation results show that, in comparison with the existing algorithms, the accuracy of the proposed algorithm for ocean observation data processing is higher than 95%, and it has good applicability for a variety of ocean observation professional indicators.
Keywords: marine intelligent observation; fuzzy SVM algorithm; fuzzy membership degree; decision function; fuzzy mapping; secondary planning
0" 引" 言
海洋數(shù)據(jù)的觀測(cè)對(duì)于海洋漁業(yè)、海底能源開(kāi)采等領(lǐng)域均具有重要意義。近年來(lái),針對(duì)海洋數(shù)據(jù)的處理技術(shù)得到了廣泛關(guān)注[1?3]。而陸??仗於嗑S一體全方位的海洋觀測(cè)平臺(tái)與數(shù)據(jù)融合處理系統(tǒng),也為海洋觀測(cè)數(shù)據(jù)智能處理技術(shù)的研究提供了基礎(chǔ)支撐[4]。針對(duì)海洋數(shù)據(jù)指標(biāo)復(fù)雜的特點(diǎn),文獻(xiàn)[5]提出了一種基于降維特征選擇的方法進(jìn)行數(shù)據(jù)分析。文獻(xiàn)[6]提出利用隨機(jī)森林(Random Forest, RF)法對(duì)指標(biāo)進(jìn)行二叉樹(shù)訓(xùn)練,然而該方法雖適用于多維指標(biāo),但靈活性較差。文獻(xiàn)[7]提出一種模糊綜合評(píng)價(jià)方法(Fuzzy Comprehension Evaluation Method),通過(guò)計(jì)算多維指標(biāo)的模糊隸屬度加權(quán),對(duì)海洋狀態(tài)進(jìn)行監(jiān)控。雖然上述算法的訓(xùn)練計(jì)算復(fù)雜度較低,但觀測(cè)準(zhǔn)確率仍無(wú)法滿(mǎn)足要求。為了進(jìn)一步提高觀測(cè)準(zhǔn)確率,文獻(xiàn)[8]提出一種基于粒子群優(yōu)化算法(Particle Swarm Optimization, PSO)的數(shù)據(jù)分類(lèi)方法,其可在一定程度上提高準(zhǔn)確率。類(lèi)似地,文獻(xiàn)[9?10]提出一種基于SVM(Support Vector Machines)的分類(lèi)算法對(duì)數(shù)據(jù)樣本進(jìn)行分類(lèi)。而在其他領(lǐng)域,一些SVM改進(jìn)算法也取得了一定的成果[11?12]。文獻(xiàn)[13]基于決策樹(shù)?SVM算法進(jìn)行了研究。上述算法雖在一定程度上提高了觀測(cè)準(zhǔn)確率,但在面對(duì)復(fù)雜線性不可分?jǐn)?shù)據(jù)時(shí),分類(lèi)準(zhǔn)確率明顯下降。因此,本文則基于模糊SVM(FSVM)算法提出一種海洋觀測(cè)數(shù)據(jù)處理方法。
1" 系統(tǒng)模型
為滿(mǎn)足海洋觀測(cè)數(shù)據(jù)智能處理的需求,本文使用的智能觀測(cè)系統(tǒng)模型由多源觀測(cè)模塊與數(shù)據(jù)智能處理模塊兩部分所組成,如圖1所示。
多源觀測(cè)模塊通過(guò)多種渠道觀測(cè)并收集海洋數(shù)據(jù),主要包括天基觀測(cè)、航空觀測(cè)、?;^測(cè)、水下觀測(cè)與岸基觀測(cè)等,通過(guò)全方位的渠道對(duì)海洋多指標(biāo)數(shù)據(jù)進(jìn)行觀測(cè)。而數(shù)據(jù)智能處理模塊則負(fù)責(zé)對(duì)所采集的海洋數(shù)據(jù)進(jìn)行建庫(kù),并實(shí)現(xiàn)綜合處理。同時(shí),對(duì)異常情況加以告警并協(xié)調(diào)系統(tǒng)資源進(jìn)行任務(wù)規(guī)劃,從而對(duì)其進(jìn)行重點(diǎn)關(guān)注。本文所采用的智能觀測(cè)框架綜合考慮了多源觀測(cè)所獲得的多維指標(biāo)信息,再進(jìn)行數(shù)據(jù)的融合分析。如圖2所示,海洋數(shù)據(jù)智能處理流程由數(shù)據(jù)融合、數(shù)據(jù)分析、海洋實(shí)況監(jiān)控以及海洋狀態(tài)預(yù)測(cè)等組成。其中,在對(duì)多源觀測(cè)數(shù)據(jù)進(jìn)行數(shù)據(jù)融合分析之后,可實(shí)現(xiàn)對(duì)海洋狀態(tài)的實(shí)時(shí)監(jiān)控。同時(shí),為進(jìn)一步提高海洋觀測(cè)的準(zhǔn)確率,還基于當(dāng)前數(shù)據(jù)分析結(jié)果進(jìn)行海洋狀態(tài)預(yù)測(cè),并將預(yù)測(cè)結(jié)果存入數(shù)據(jù)庫(kù)中,根據(jù)實(shí)時(shí)分析結(jié)果進(jìn)行修正。
2" 算法模型
本文對(duì)海洋狀況進(jìn)行了狀態(tài)監(jiān)測(cè),首先將問(wèn)題加以簡(jiǎn)化,先不考慮多維指標(biāo)的影響,則可將海洋狀況評(píng)估轉(zhuǎn)化為一個(gè)二元分類(lèi)問(wèn)題[14?15]。基于此,本文采用SVM算法對(duì)海洋狀況進(jìn)行分類(lèi)。SVM算法通過(guò)尋找一個(gè)最優(yōu)超平面,將不同類(lèi)別的數(shù)據(jù)隔開(kāi),并最大化兩類(lèi)數(shù)據(jù)之間的間隔,從而提高模型的泛化能力。SVM算法的基本架構(gòu)圖如圖3所示。
基于SVM算法的分類(lèi)模型如圖4所示。
設(shè)[T=x1,y1,x2,y2,…,xl,yl∈x×yl]為樣本訓(xùn)練集合,考慮到指標(biāo)的多維性,使用SVM算法進(jìn)行訓(xùn)練時(shí),需采用非線性模型,則最優(yōu)分類(lèi)平面A的表達(dá)式為:
式中:[w]表示權(quán)值;[c]表示懲罰因子;[l]表示樣本數(shù)量;訓(xùn)練樣本集合中的參數(shù)[xi∈x]表示訓(xùn)練樣本,[yi∈y],[y∈-1,1]表示訓(xùn)練樣本類(lèi)別;[b∈R]表示偏移量;[ζi]為松弛變量。[ζi]滿(mǎn)足:
則可以將式(1)轉(zhuǎn)化為:
式中[αi]表示拉格朗日系數(shù),滿(mǎn)足:
式中[l′]表示樣本i鄰近區(qū)域其他類(lèi)別數(shù)據(jù)的數(shù)量。利用鄰近樣本密度函數(shù)作為樣本的模糊隸屬度,即可進(jìn)行模糊SVM訓(xùn)練。
基于上述改進(jìn)SVM算法的設(shè)計(jì),改進(jìn)后的算法整體架構(gòu)如圖6所示。
SVM算法和模糊算法進(jìn)行融合,形成改進(jìn)SVM算法,提升了對(duì)海洋觀測(cè)數(shù)據(jù)的處理能力。改進(jìn)后的SVM算法通過(guò)引入模糊隸屬度函數(shù),有效降低了異常樣本數(shù)據(jù)對(duì)決策函數(shù)的影響,并且增強(qiáng)了模型對(duì)高頻噪聲數(shù)據(jù)的抗擾性和魯棒性。同時(shí),在處理多維目標(biāo)數(shù)據(jù)時(shí),改進(jìn)SVM算法還可有效融合不同數(shù)據(jù)指標(biāo),解決了數(shù)據(jù)復(fù)雜性導(dǎo)致的計(jì)算瓶頸問(wèn)題。改進(jìn)SVM算法的設(shè)計(jì)流程如圖7所示。
由圖7可知,在改進(jìn)SVM算法運(yùn)行過(guò)程中,通過(guò)優(yōu)化模糊隸屬度函數(shù)的構(gòu)造方法,進(jìn)一步提升了模型的性能?;跇颖距徑芏鹊碾`屬度函數(shù)構(gòu)造方法更好地反映了樣本數(shù)據(jù)在特征空間中的分布情況,從而提高了模型對(duì)負(fù)載數(shù)據(jù)的適應(yīng)性。同時(shí),改進(jìn)SVM算法將最優(yōu)問(wèn)題轉(zhuǎn)化為二次規(guī)劃問(wèn)題,進(jìn)一步提高了算法的計(jì)算效率。因此,改進(jìn)SVM算法不僅提高了模型的分類(lèi)精度,而且在處理多維指標(biāo)數(shù)據(jù)時(shí)具有較好的適應(yīng)性。
4" 仿真驗(yàn)證及數(shù)據(jù)分析
為驗(yàn)證本文所提改進(jìn)SVM算法對(duì)海洋觀測(cè)數(shù)據(jù)智能處理的有效性,本文對(duì)比了現(xiàn)有4種算法與本文算法對(duì)于海洋狀態(tài)監(jiān)控的準(zhǔn)確率。同時(shí),針對(duì)所監(jiān)控海洋數(shù)據(jù)7個(gè)指標(biāo)的觀測(cè)準(zhǔn)確率進(jìn)行分析對(duì)比,以此說(shuō)明本文算法對(duì)不同觀測(cè)指標(biāo)的適用性。在實(shí)驗(yàn)前,先對(duì)數(shù)據(jù)集進(jìn)行準(zhǔn)備,如數(shù)據(jù)來(lái)源、數(shù)據(jù)預(yù)處理和數(shù)據(jù)標(biāo)注。
1) 數(shù)據(jù)來(lái)源:選擇真實(shí)的海洋觀測(cè)數(shù)據(jù)集,其中包括多種海洋觀測(cè)指標(biāo),如溫度、鹽度、海流、海浪、潮汐、重力及磁力等。
2) 數(shù)據(jù)預(yù)處理:對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,去除數(shù)據(jù)缺失值和明顯異常值,并選擇數(shù)據(jù)集中的70%作為訓(xùn)練集,剩下的30%作為測(cè)試集。
3) 數(shù)據(jù)標(biāo)注:將實(shí)際海洋環(huán)境狀態(tài)分為正常狀態(tài)、異常狀態(tài)和特定狀態(tài),按照此三類(lèi)狀態(tài)對(duì)各類(lèi)別數(shù)據(jù)進(jìn)行分類(lèi)標(biāo)注。
實(shí)驗(yàn)的具體參數(shù)如表2所示。
不同算法的海洋狀態(tài)監(jiān)控的準(zhǔn)確率對(duì)比結(jié)果如表3所示。從表中可以觀察到:隨機(jī)森林方法和模糊綜合評(píng)價(jià)方法對(duì)海洋數(shù)據(jù)的誤判率較低,但二者的漏判率均較高,故對(duì)于多維指標(biāo)的適用性較弱;LS?SVM與粒子群算法在整體觀測(cè)準(zhǔn)確率上有所提高,但漏判率仍在3%以上;而本文算法在漏判率與誤判率上均大幅降低,且整體觀測(cè)準(zhǔn)確率均在95%以上,算法性能進(jìn)一步提高,說(shuō)明其更具實(shí)用性。
而針對(duì)所監(jiān)控海洋數(shù)據(jù)中7個(gè)指標(biāo)的觀測(cè)準(zhǔn)確率分析對(duì)比結(jié)果如表4所示。表中:本文算法對(duì)于7個(gè)海洋觀測(cè)指標(biāo)的觀測(cè)準(zhǔn)確率均在95%以上,說(shuō)明本文算法對(duì)于多種指標(biāo)均具有較優(yōu)的適用性。同時(shí),對(duì)于溫度、鹽度等指標(biāo)的觀測(cè)準(zhǔn)確率在96%以上,而對(duì)重力及磁力等指標(biāo)觀測(cè)的準(zhǔn)確率相對(duì)較低。這與實(shí)際觀測(cè)采集的數(shù)據(jù)準(zhǔn)確性有關(guān),通常數(shù)據(jù)采集準(zhǔn)確性越高,則智能處理分類(lèi)準(zhǔn)確率也越高。
高效的海洋觀測(cè)效率是快速獲取大量海洋數(shù)據(jù)、降低觀測(cè)成本、提升資源利用率的基礎(chǔ)。因此本文在觀測(cè)準(zhǔn)確率的基礎(chǔ)上,引入觀測(cè)效率,對(duì)本文所提算法和其他算法進(jìn)行了對(duì)比。不同算法的海洋觀測(cè)效率的對(duì)比情況如圖8所示。
從圖8中可明顯看出,在海洋觀測(cè)數(shù)據(jù)處理中,本文提出的基于模糊SVM的智能處理算法隨著迭代次數(shù)的增加,展現(xiàn)出了較高的觀測(cè)效率,顯著優(yōu)于其他傳統(tǒng)算法。該結(jié)果表明,模糊SVM算法在處理復(fù)雜海洋觀測(cè)數(shù)據(jù)時(shí),能夠快速收斂并找到最優(yōu)解,從而大幅減少計(jì)算時(shí)間,提升了整體的觀測(cè)效率。本文算法通過(guò)引入模糊隸屬度,有效降低了異常樣本對(duì)決策函數(shù)的影響,同時(shí)增強(qiáng)了模型對(duì)噪聲數(shù)據(jù)的魯棒性,不僅為多維數(shù)據(jù)的優(yōu)化與處理提供了重要技術(shù)支持,還為海洋資源開(kāi)發(fā)等實(shí)際應(yīng)用奠定了堅(jiān)實(shí)的基礎(chǔ)。
5" 結(jié)" 語(yǔ)
針對(duì)海洋狀態(tài)智能觀測(cè)的需求,本文提出了一種基于模糊SVM算法的海洋數(shù)據(jù)處理方法。首先,基于SVM算法,通過(guò)在訓(xùn)練集合中引入模糊隸屬度,對(duì)復(fù)雜、多維且不可分樣本進(jìn)行決策訓(xùn)練;然后,采用拉格朗日偏導(dǎo)數(shù)方法將最優(yōu)化問(wèn)題轉(zhuǎn)化為二次規(guī)劃問(wèn)題,以得到最佳決策函數(shù);最后為了去除異常數(shù)據(jù)對(duì)模糊SVM算法訓(xùn)練的影響,本文還采用了基于鄰近樣本密度的模糊隸屬度函數(shù)構(gòu)造方法。數(shù)據(jù)測(cè)試結(jié)果表明,本文所設(shè)計(jì)算法相對(duì)于現(xiàn)有算法的觀測(cè)準(zhǔn)確率和效率均得到了進(jìn)一步提高,且更具實(shí)用價(jià)值。后續(xù),將針對(duì)海洋狀態(tài)的預(yù)測(cè)與修正算法進(jìn)行進(jìn)一步研究。
參考文獻(xiàn)
[1] 熊金蓮,高志剛,胡鵬,等.基于區(qū)塊鏈的海洋觀測(cè)數(shù)據(jù)傳輸與共享方案[J].計(jì)算機(jī)應(yīng)用與軟件,2024,41(10):1?7.
[2] 熊金蓮,芮龍.海洋觀測(cè)數(shù)據(jù)規(guī)范化整理系統(tǒng)的設(shè)計(jì)[J].信息技術(shù),2024(2):121?127.
[3] 譚哲韜,張斌,吳曉芬,等.海洋觀測(cè)數(shù)據(jù)質(zhì)量控制技術(shù)研究現(xiàn)狀及展望[J].中國(guó)科學(xué):地球科學(xué),2022,52(3):418?437.
[4] 張由余,韓曉寧.陸??仗煲惑w化海事監(jiān)管指揮系統(tǒng)發(fā)展設(shè)想[J].指揮信息系統(tǒng)與技術(shù),2022,13(6):42?49.
[5] 郭政,趙梅,胡長(zhǎng)青.一種有效降維的特征選擇方法及其在水聲目標(biāo)識(shí)別中的應(yīng)用[J].聲學(xué)技術(shù),2021,40(1):14?20.
[6] 邱耀煒,沈蔚,惠笑,等.基于WorldView?2數(shù)據(jù)和隨機(jī)森林算法的遙感水深反演[J].遙感信息,2019,34(2):75?79.
[7] 秦麗,劉保占,王茂君.基于模糊綜合評(píng)價(jià)方法的海上溢油應(yīng)急能力評(píng)估技術(shù)研究[J].海洋環(huán)境科學(xué),2022,41(6):910?914.
[8] 陳佳兵,吳自銀,趙荻能,等.基于粒子群優(yōu)化算法的PSO?BP海底聲學(xué)底質(zhì)分類(lèi)方法[J].海洋學(xué)報(bào),2017,39(9):51?57.
[9] 張隨艷.基于SVM算法的海洋微生物種群多樣性信息自適應(yīng)分類(lèi)方法[J].海洋技術(shù)學(xué)報(bào),2024,43(5):36?42.
[10] 紀(jì)雪,唐秋華,陳義蘭,等.聯(lián)合支持向量機(jī)和增強(qiáng)學(xué)習(xí)算法的多波束聲學(xué)底質(zhì)分類(lèi)[J].測(cè)繪學(xué)報(bào),2021,50(7):972?981.
[11] 邵志慧,楊儉,袁天辰,等.基于排列熵和支持向量機(jī)的軌枕病害診斷[J].電子科技,2022,35(2):52?58.
[12] 劉云,李維嘉,趙子豪,等.基于改進(jìn)SVM的電力工程造價(jià)預(yù)測(cè)[J].沈陽(yáng)工業(yè)大學(xué)學(xué)報(bào),2024,46(4):367?372.
[13] 周妍,廖振良,周燦.基于決策樹(shù)支持向量機(jī)的地表水水質(zhì)評(píng)價(jià)研究[J].環(huán)境科技,2021,34(5):57?61.
[14] 李炳霖,司夢(mèng).二元分類(lèi)問(wèn)題的最優(yōu)分類(lèi)線性降維[J].中國(guó)電子科學(xué)研究院學(xué)報(bào),2022,17(4):404?410.
[15] 張代俐,汪廷華,朱興淋.基于模糊隸屬度函數(shù)的SVM樣本約簡(jiǎn)算法[J].山西大學(xué)學(xué)報(bào)(自然科學(xué)版),2024,47(1):18?29.
作者簡(jiǎn)介:齊光鵬(1981—),男,陜西寶雞人,碩士研究生,教授級(jí)高級(jí)工程師,研究方向?yàn)殡娮有畔⒐こ獭?/p>
收稿日期:2024?11?04" " " " " "修回日期:2024?12?12
基金項(xiàng)目:中華人民共和國(guó)科學(xué)技術(shù)部項(xiàng)目(2023YFF0905500)