劉逸飛
(交通運(yùn)輸部上海打撈局,上海 200090)
數(shù)據(jù)采集技術(shù)一般是在通信網(wǎng)絡(luò)中部署傳感器節(jié)點(diǎn),通過(guò)對(duì)傳感器節(jié)點(diǎn)采集到的數(shù)據(jù)進(jìn)行匯總,從而獲得該區(qū)域內(nèi)的數(shù)據(jù)分布情況,該技術(shù)目前已經(jīng)被應(yīng)用到不同領(lǐng)域中。例如,文獻(xiàn)[1]通過(guò)人機(jī)融合算法對(duì)工業(yè)物聯(lián)網(wǎng)進(jìn)行節(jié)點(diǎn)部署,并提出了一種高效的數(shù)據(jù)采集系統(tǒng)。文獻(xiàn)[2]以PLC 通信設(shè)備作為數(shù)據(jù)采集工具,對(duì)數(shù)據(jù)采集的整體流程進(jìn)行了討論與分析。而在艦船通信過(guò)程中,通信數(shù)據(jù)的采集質(zhì)量對(duì)后續(xù)的艦船調(diào)度決策起到重要作用,因此文中結(jié)合聚類(lèi)算法,通過(guò)引入平滑函數(shù)對(duì)冗余數(shù)據(jù)進(jìn)行處理,從而優(yōu)化數(shù)據(jù)采集效果,在此基礎(chǔ)上對(duì)最優(yōu)數(shù)據(jù)采集路徑進(jìn)行規(guī)劃,從而得到質(zhì)量更高的數(shù)據(jù)采集結(jié)果,為艦船航行提供可靠的數(shù)據(jù)支持[3]。
在艦船通信網(wǎng)絡(luò)正常運(yùn)行過(guò)程中,不完整節(jié)點(diǎn)通常有兩種類(lèi)型,分別為靜態(tài)通信節(jié)點(diǎn)以及動(dòng)態(tài)通信節(jié)點(diǎn)[4]。由于通信節(jié)點(diǎn)的不完整性,在進(jìn)行數(shù)據(jù)采集時(shí)通常需要對(duì)模糊聚類(lèi)中心進(jìn)行選定,在此基礎(chǔ)上提取通信數(shù)據(jù),并對(duì)其進(jìn)行模糊化處理。對(duì)此,文中首先定義節(jié)點(diǎn)傳輸數(shù)據(jù)的概率,在此基礎(chǔ)上結(jié)合聚類(lèi)閾值,選定不完整節(jié)點(diǎn)數(shù)據(jù)的模糊聚類(lèi)簇中心,具體實(shí)現(xiàn)流程如下。
設(shè)艦船通信網(wǎng)絡(luò)節(jié)點(diǎn)到網(wǎng)絡(luò)區(qū)域中心的距離為D,通過(guò)界定通信數(shù)據(jù)傳輸?shù)淖畲蠓秶约白钚》秶梢杂?jì)算節(jié)點(diǎn)向動(dòng)態(tài)網(wǎng)關(guān)節(jié)點(diǎn)傳輸數(shù)據(jù)的概率c,具體概率表達(dá)式如下所示:
其中,R和r分別代表通信網(wǎng)絡(luò)不完整節(jié)點(diǎn)通信覆蓋范圍的最大值以及最小值[5]。
在通信覆蓋范圍的限制下,通信網(wǎng)絡(luò)采集的總次數(shù)為T(mén),由此可以規(guī)定靜態(tài)節(jié)點(diǎn)和動(dòng)態(tài)節(jié)點(diǎn)的采集次數(shù),具體表達(dá)式如下所示:
其中,Tm代表靜態(tài)節(jié)點(diǎn)的采集次數(shù),Ts代表動(dòng)態(tài)節(jié)點(diǎn)的采集次數(shù)。
在此基礎(chǔ)上,文中設(shè)定了節(jié)點(diǎn)聚類(lèi)閾值,若艦船網(wǎng)絡(luò)通信節(jié)點(diǎn)隨機(jī)生成的數(shù)值低于聚類(lèi)閾值,則說(shuō)明該節(jié)點(diǎn)無(wú)法作為模糊聚類(lèi)中心;同理,若通信節(jié)點(diǎn)隨機(jī)生成的數(shù)值高于聚類(lèi)閾值,則說(shuō)明該節(jié)點(diǎn)的聚類(lèi)表現(xiàn)良好,因此可以將該節(jié)點(diǎn)作為通信區(qū)域內(nèi)的模糊聚類(lèi)中心[6]。聚類(lèi)閾值T(xi)的設(shè)定主要與循環(huán)次數(shù)以及中心節(jié)點(diǎn)與總節(jié)點(diǎn)之間的比值相關(guān),具體計(jì)算公式如下所示:
其中,P代表模糊聚類(lèi)中心在總通信節(jié)點(diǎn)數(shù)量中的占比,G代表單次循環(huán)條件下通信節(jié)點(diǎn)數(shù)量與總循環(huán)條件下通信節(jié)點(diǎn)數(shù)量的比值,xi代表通信節(jié)點(diǎn)隨機(jī)生成的數(shù)值。
計(jì)算出聚類(lèi)閾值后,觀察聚類(lèi)閾值的表達(dá)式可以看出,文中選定的聚類(lèi)閾值波動(dòng)范圍為0~1。因此在對(duì)不完整節(jié)點(diǎn)進(jìn)行數(shù)據(jù)生成時(shí),也需要將隨機(jī)生成的數(shù)值控制在0~1 范圍內(nèi),從而保證聚類(lèi)閾值對(duì)比的有效性[7]。
通過(guò)上述步驟即可完成艦船通信網(wǎng)絡(luò)不完整節(jié)點(diǎn)數(shù)據(jù)模糊聚類(lèi)中心的選定,結(jié)合通信節(jié)點(diǎn)的覆蓋范圍,規(guī)定數(shù)據(jù)采集次數(shù),在此基礎(chǔ)上設(shè)定聚類(lèi)閾值,選定模糊聚類(lèi)中心,為后續(xù)的數(shù)據(jù)模糊采集提供幫助[8]。
在選定艦船通信網(wǎng)絡(luò)節(jié)點(diǎn)數(shù)據(jù)的模糊聚類(lèi)中心后,求解不完整節(jié)點(diǎn)數(shù)據(jù)的邊緣頻率分布情況,從而實(shí)現(xiàn)對(duì)數(shù)據(jù)特征向量的提取[9]。在采集艦船通信網(wǎng)絡(luò)不完整節(jié)點(diǎn)數(shù)據(jù)時(shí),會(huì)受到來(lái)自艦船電氣設(shè)備的脈沖干擾ewer,因此文中引入濾波器ewep過(guò)濾數(shù)據(jù),對(duì)通信數(shù)據(jù)邊緣頻率的均方差σa進(jìn)行處理,從而得到的通信數(shù)據(jù)邊緣頻率分布表達(dá)式:
其中,ξ代表平滑函數(shù),Saˉ代表通信網(wǎng)絡(luò)不完整節(jié)點(diǎn)數(shù)據(jù)的局部特征均值,ai代表不完整節(jié)點(diǎn)數(shù)據(jù)的邊緣向量,Ea代表通信數(shù)據(jù)邊緣頻率分布密度。冗余數(shù)據(jù)在艦船通信網(wǎng)絡(luò)中的概率分布密度主要與誤差函數(shù)esg以及通信數(shù)據(jù)特征的樣本參數(shù)相關(guān)[10]。
設(shè)通信數(shù)據(jù)特征的樣本類(lèi)型以及樣本數(shù)量分別為λa和A,由此可以計(jì)算冗余數(shù)據(jù)的頻率分布密度Eb,具體計(jì)算公式為:
其中,ω代表相鄰?fù)ㄐ殴?jié)點(diǎn)之間的數(shù)據(jù)分配權(quán)重,da代表相鄰不完整節(jié)點(diǎn)之間的數(shù)據(jù)特征距離,-da代表特征距離均值。
采用平滑參數(shù)對(duì)艦船通信網(wǎng)絡(luò)數(shù)據(jù)中的冗余數(shù)據(jù)進(jìn)行處理,這會(huì)導(dǎo)致不完整節(jié)點(diǎn)數(shù)據(jù)的特征向量中也會(huì)存在一定的平滑特征,對(duì)此引入局部幅度平滑性kwer表征該特征,由此構(gòu)建出不完整節(jié)點(diǎn)數(shù)據(jù)的特征向量fi表達(dá)式,如下所示:
其中,τ代表特征向量所存在的局部矢量空間,bw代表去除冗余數(shù)據(jù)后的不完整節(jié)點(diǎn)數(shù)據(jù),bi代表冗余數(shù)據(jù)在通信網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)中的分布特征向量[11]。
通過(guò)上述步驟即可完成不完整節(jié)點(diǎn)數(shù)據(jù)的特征向量提取,通過(guò)引入濾波器,對(duì)數(shù)據(jù)采集過(guò)程中可能會(huì)產(chǎn)生的脈沖干擾進(jìn)行處理,并剔除冗余數(shù)據(jù)的特征向量,從而得到不完整節(jié)點(diǎn)的數(shù)據(jù)特征向量[12]。
針對(duì)上述求解出的模糊聚類(lèi)中心以及數(shù)據(jù)特征向量,分析艦船通信網(wǎng)絡(luò)節(jié)點(diǎn)的分布情況,對(duì)數(shù)據(jù)采集路徑進(jìn)行規(guī)劃及數(shù)據(jù)模糊化處理,從而實(shí)現(xiàn)數(shù)據(jù)模糊采集[13]。對(duì)此,文中以常規(guī)的艦船通信網(wǎng)絡(luò)節(jié)點(diǎn)分布情況作為研究對(duì)象,計(jì)算采集數(shù)據(jù)的比特序列開(kāi)銷(xiāo),從而規(guī)劃出最短采集路徑。常規(guī)的艦船通信網(wǎng)絡(luò)節(jié)點(diǎn)分布情況如圖1 所示。

圖1 艦船通信網(wǎng)絡(luò)節(jié)點(diǎn)分布情況
通過(guò)對(duì)上述艦船通信網(wǎng)絡(luò)節(jié)點(diǎn)的分布情況可以看出,數(shù)據(jù)模糊采集路徑的目標(biāo)在于實(shí)現(xiàn)數(shù)據(jù)的快速采集[14]。因此,以聚類(lèi)中心作為掃描半徑,掃描節(jié)點(diǎn)分布情況,并構(gòu)建目標(biāo)采集函數(shù),由此即可實(shí)現(xiàn)對(duì)最優(yōu)采集路徑的選取,具體目標(biāo)函數(shù)表達(dá)式如下所示:
其中,N代表傳感器總數(shù)量,Pi代表通信網(wǎng)絡(luò)節(jié)點(diǎn)i在進(jìn)行數(shù)據(jù)采集過(guò)程中的完整存活概率,Dr代表數(shù)據(jù)模糊聚類(lèi)中心的掃描半徑。
提取到的不完整節(jié)點(diǎn)數(shù)據(jù)特征向量為fi,計(jì)算數(shù)據(jù)采集過(guò)程中的比特序列開(kāi)銷(xiāo)C[15],則可規(guī)劃最小路徑,開(kāi)銷(xiāo)計(jì)算公式為:
其中,esum代表不完整節(jié)點(diǎn)數(shù)據(jù)采集總耗能,ebest代表能量調(diào)度函數(shù)的最優(yōu)解。
根據(jù)目標(biāo)函數(shù)對(duì)數(shù)據(jù)采集路徑最優(yōu)值進(jìn)行求解,如果計(jì)算得到的路徑規(guī)劃值低于比特序列開(kāi)銷(xiāo),則說(shuō)明目標(biāo)函數(shù)求解出的路徑規(guī)劃值為最優(yōu)采集路徑;反之則需要對(duì)算法進(jìn)行不斷迭代,直到求解出的路徑規(guī)劃值滿足比特序列開(kāi)銷(xiāo)的限制要求[16],從而輸出最優(yōu)采集路徑。在完成數(shù)據(jù)路徑的規(guī)劃后,文中對(duì)艦船通信網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行模糊化處理,具體如下:
其中,F(xiàn)″代表不完整節(jié)點(diǎn)的數(shù)據(jù)模糊化值,γfi代表去模糊化參數(shù)。
通過(guò)上述步驟即可完成艦船通信網(wǎng)絡(luò)不完整節(jié)點(diǎn)數(shù)據(jù)的模糊采集路徑規(guī)劃,通過(guò)構(gòu)建目標(biāo)函數(shù),求解路徑規(guī)劃結(jié)果。將數(shù)據(jù)采集比特序列開(kāi)銷(xiāo)值作為衡量閾值,判斷最優(yōu)路徑規(guī)劃值,最后對(duì)數(shù)據(jù)進(jìn)行模糊化處理[17-19]。結(jié)合數(shù)據(jù)模糊采集路徑規(guī)劃與數(shù)據(jù)特征向量提取以及數(shù)據(jù)聚類(lèi)中心選定等相關(guān)內(nèi)容,完成不完整節(jié)點(diǎn)數(shù)據(jù)模糊采集算法設(shè)計(jì)。
為驗(yàn)證提出的節(jié)點(diǎn)數(shù)據(jù)模糊采集算法在實(shí)際采集效果方面的有效性,實(shí)驗(yàn)選取了兩種常規(guī)的節(jié)點(diǎn)數(shù)據(jù)模糊采集算法作為對(duì)比對(duì)象,分別為基于神經(jīng)網(wǎng)絡(luò)的節(jié)點(diǎn)數(shù)據(jù)模糊采集算法,以及基于串行通信的節(jié)點(diǎn)數(shù)據(jù)模糊采集算法。構(gòu)建實(shí)驗(yàn)平臺(tái),采用三種數(shù)據(jù)采集方法對(duì)艦船通信網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行模糊采集,對(duì)比不同采集方法的實(shí)際效果。
選取的實(shí)驗(yàn)對(duì)象為某艦船通信系統(tǒng)中的網(wǎng)絡(luò)數(shù)據(jù)處理架構(gòu),對(duì)該數(shù)據(jù)處理架構(gòu)下的通信數(shù)據(jù)進(jìn)行分析,從中提取出不完整節(jié)點(diǎn)數(shù)據(jù)作為此次實(shí)驗(yàn)的提取對(duì)象,并對(duì)實(shí)驗(yàn)數(shù)據(jù)集進(jìn)行聚類(lèi)處理。文中所選取的艦船通信系統(tǒng)網(wǎng)絡(luò)數(shù)據(jù)處理架構(gòu)主要包括三個(gè)部分,分別為業(yè)務(wù)展示層、數(shù)據(jù)存儲(chǔ)層以及并行處理層,具體架構(gòu)如圖2 所示。

圖2 艦船通信系統(tǒng)網(wǎng)絡(luò)處理架構(gòu)
從通信網(wǎng)絡(luò)處理架構(gòu)中隨機(jī)抽取若干條通信數(shù)據(jù)作為基礎(chǔ)數(shù)據(jù)集,為了便于實(shí)驗(yàn)測(cè)試,文中按照數(shù)據(jù)大小將基礎(chǔ)數(shù)據(jù)集分為了10 個(gè)不同的子數(shù)據(jù)集,具體數(shù)據(jù)集劃分結(jié)果如表1 所示。

表1 實(shí)驗(yàn)數(shù)據(jù)集劃分結(jié)果
針對(duì)上述實(shí)驗(yàn)數(shù)據(jù)集的劃分結(jié)果,為了提高數(shù)據(jù)采集的真實(shí)性,文中分別從每個(gè)數(shù)據(jù)集中添加了不同數(shù)量的冗余數(shù)據(jù),用于模擬數(shù)據(jù)采集過(guò)程中產(chǎn)生的脈沖干擾,并對(duì)實(shí)驗(yàn)數(shù)據(jù)集進(jìn)行聚類(lèi)分析,由此得到的聚類(lèi)結(jié)果如圖3 所示。采用三種方法對(duì)艦船通信網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行采集時(shí),需要剔除掉冗余數(shù)據(jù),從而得到模糊聚類(lèi)采集結(jié)果。因此此次實(shí)驗(yàn)可以測(cè)試不同方法對(duì)于冗余數(shù)據(jù)的處理性能,從而比較出不同方法的實(shí)際數(shù)據(jù)采集效果。

圖3 數(shù)據(jù)聚類(lèi)分析結(jié)果
實(shí)驗(yàn)采用Matlab 軟件搭建出仿真實(shí)驗(yàn)平臺(tái),采用三種數(shù)據(jù)采集方法對(duì)實(shí)驗(yàn)數(shù)據(jù)集中的數(shù)據(jù)進(jìn)行模擬采集,待數(shù)據(jù)采集完成后,對(duì)采集結(jié)果進(jìn)行分析,并記錄下不同采集方法下的數(shù)據(jù)融合度。
對(duì)比實(shí)驗(yàn)選取的對(duì)比指標(biāo)為不同數(shù)據(jù)采集方法對(duì)于冗余數(shù)據(jù)的過(guò)濾性能,具體衡量指標(biāo)為采集結(jié)果中的數(shù)據(jù)冗余度,該值越低,代表方法對(duì)于冗余數(shù)據(jù)的過(guò)濾性能越好。為了提高實(shí)驗(yàn)結(jié)果的對(duì)比性,實(shí)驗(yàn)通過(guò)改變數(shù)據(jù)集隸屬度,從而調(diào)節(jié)數(shù)據(jù)集中的冗余數(shù)據(jù)分布情況,具體實(shí)驗(yàn)結(jié)果如圖4、5 所示。

圖4 聚類(lèi)隸屬度為0.4時(shí)的數(shù)據(jù)冗余度

圖5 聚類(lèi)隸屬度為0.8時(shí)的數(shù)據(jù)冗余度
通過(guò)圖4、5 實(shí)驗(yàn)結(jié)果可以看出,隨著數(shù)據(jù)聚類(lèi)隸屬度的提高,不同采集方法下得到的數(shù)據(jù)冗余度也隨之增大。通過(guò)數(shù)值上的對(duì)比可以明顯看出,兩種常規(guī)的數(shù)據(jù)模糊采集算法所得到的數(shù)據(jù)采集結(jié)果中,數(shù)據(jù)冗余度較高,且波動(dòng)情況較大。而文中提出的數(shù)據(jù)模糊采集算法能夠有效對(duì)冗余數(shù)據(jù)進(jìn)行過(guò)濾處理,得到的數(shù)據(jù)采集結(jié)果中,數(shù)據(jù)冗余度較低,由此可以證明文中方法的數(shù)據(jù)采集效果更好。
文中針對(duì)常規(guī)的不完整節(jié)點(diǎn)數(shù)據(jù)采集方法在冗余數(shù)據(jù)方面提取效果不佳的問(wèn)題,通過(guò)結(jié)合聚類(lèi)算法,提出了一種新型的數(shù)據(jù)模糊采集方法。在今后的研究工作中,還需針對(duì)不同的數(shù)據(jù)類(lèi)型進(jìn)行具體分析,從而優(yōu)化模糊采集效果。