姜廣坤,裴洲奇
(大連海洋大學應用技術(shù)學院,遼寧 大連 116300)
復雜網(wǎng)絡是描述復雜系統(tǒng)的重要工具,對研究復雜系統(tǒng)具有較大的推動作用[1-2]。通過復雜網(wǎng)絡的研究,人類可以更好地掌握和了解互聯(lián)網(wǎng)的發(fā)展特點。21世紀是信息時代,互聯(lián)網(wǎng)對國家的經(jīng)濟發(fā)展和國防建設等方面都產(chǎn)生了巨大的影響,更是與人類的生活密不可分。
現(xiàn)階段,復雜網(wǎng)絡的構(gòu)建成為當前的研究熱點,但是仍然存在很多問題需要相關(guān)專家進一步進行探索,例如加權(quán)復雜網(wǎng)絡聚類結(jié)果不準確以及運行速度較慢等。為此,國內(nèi)相關(guān)專家進行了大量研究,同時給出了一些較好的研究成果,例如郭圣等人[3]在深度自編碼器中加入空間聚類的“自我表示”特性以及加權(quán)稀疏表示,進而實現(xiàn)空間聚類。段佳勇等人[4]通過自適應算法組建無標度網(wǎng)絡改進模型,根據(jù)計算獲取關(guān)聯(lián)度的最優(yōu)值和網(wǎng)絡參數(shù)取值,進而獲取理想的網(wǎng)絡模型。同時進一步對自適應算法中的關(guān)聯(lián)度進行數(shù)據(jù)學分析,進而實現(xiàn)網(wǎng)絡模型聚類。在以上兩種模型的基礎上,提出一種基于空間關(guān)聯(lián)性的加權(quán)復雜網(wǎng)絡聚類模型。經(jīng)實驗測試結(jié)果表明,所提模型不僅可以有效提升聚類質(zhì)量和聚類精度,同時還可以提升聚類速度。
針對不規(guī)則的網(wǎng)絡構(gòu)建投影高度圖,建立局部三維坐標系,將鄰域點集投影至坐標系中,進而獲取投影高度。同時,對復雜網(wǎng)絡的幾何特征進行編碼,獲取較好的去噪效果[5-6]。
針對加權(quán)復雜網(wǎng)絡中隨機一個節(jié)點i而言,需要優(yōu)先對三維空間的局部領(lǐng)域進行檢索,使用K近鄰檢索,根據(jù)點的初始法向計算法向張量投票矩陣U(q(i)),如公式(1)所示:

(1)
上式中,Xn代表標準差;oi和oj分別代表節(jié)點i和節(jié)點j的高斯權(quán)重系數(shù);q(i)代表節(jié)點i的法向信息;N(i)代表特征值。
通過公式(1)對加權(quán)復雜網(wǎng)絡的特征進行分解,獲取對應的特征值,將全部特征向量進行兩兩相交。
當建立好局部坐標系之后,需要將鄰域點投影到平面xy上,同時計算各個節(jié)點i的投影高度以及投影坐標。為了有效避免投影高度出現(xiàn)負值的情況,需要將節(jié)點i和節(jié)點j的最大距離作為偏差加到高度值上。所以,采用公式(2)和公式(3)表示投影高度I(j)以及投影點坐標q(i,j):

(2)

(3)

當?shù)玫洁徲蛑腥奎c的投影高度之后,需要形成規(guī)則的高度圖像,優(yōu)先設定高度圖像的長和寬,同時將圖像放置到坐標系中,進而獲取坐標系原點的三維坐標qc,如公式(4)所示:

(4)
當?shù)玫较袼攸c的三維坐標以及投影點的三維坐標之后,需要采用高斯插值來計算高度圖像中各個像素的強度值I(c),如公式(5)所示:

(5)
上式中,β代表距離像素點。
將卷積神經(jīng)網(wǎng)絡應用到加權(quán)復雜網(wǎng)絡數(shù)據(jù)的噪聲濾除中[7-8],主要采用基于法向濾波的卷積神經(jīng)網(wǎng)絡,優(yōu)先將組建的高度圖作為網(wǎng)絡的輸入,高度圖對應的節(jié)點即為輸出。卷積神經(jīng)網(wǎng)絡學習是通過高度圖獲取法向映射,進而輸出濾波后的方向,使用L2損失對卷積神經(jīng)網(wǎng)絡進行優(yōu)化,具體的計算式如下:
loss=(O(p)-O(g))2
(6)
上式中,O(p)代表原始網(wǎng)絡數(shù)據(jù)中包含的噪聲;O(g)代表噪聲數(shù)據(jù)的法向。


(7)
上式中,α代表固定的權(quán)重系數(shù);(xa,xb)代表原始坐標位置。
另外,在網(wǎng)絡訓練的過程中,需要對訓練數(shù)據(jù)進行預處理操作。同時為了避免空間坐標產(chǎn)生的影響,需要將全部網(wǎng)格都平移到以質(zhì)心坐標為原點,同時對全部坐標進行標準化處理,將網(wǎng)格的平均邊長設定為單位長度,有效降低坐標尺度之間的差異性。
將加權(quán)復雜網(wǎng)絡中數(shù)據(jù)的空間相關(guān)性關(guān)系進行數(shù)字化描述,同時采用相關(guān)節(jié)點代表網(wǎng)絡中傳感器節(jié)點所在的坐標,通過相關(guān)系數(shù)描述不同感知數(shù)據(jù)之間的相關(guān)度,進而獲取加權(quán)復雜網(wǎng)絡中的空間相關(guān)性:

(8)
上式中,θi,j代表數(shù)據(jù)的空間相關(guān)性;cov(di,dj)代表傳感器節(jié)點坐標。
通過上述分析,需要對卷積神經(jīng)網(wǎng)絡結(jié)構(gòu)進行分析,獲取對應的編碼局部幾何結(jié)構(gòu),同時通過加權(quán)復雜網(wǎng)絡各個鄰居之間感知數(shù)據(jù)的關(guān)聯(lián)性進行噪聲過濾,并且采用坐標更新算法調(diào)整噪聲點位置,實現(xiàn)復雜網(wǎng)絡數(shù)據(jù)去噪[11-12],具體如公式(9)所示:

(9)

為了更好理解加權(quán)復雜網(wǎng)絡,以下給出網(wǎng)絡中的相關(guān)參數(shù):
1)度分布:
通過網(wǎng)絡中節(jié)點的度來對各個節(jié)點之間的關(guān)聯(lián)關(guān)系進行衡量,進而獲取節(jié)點總數(shù);度分布用來描述網(wǎng)絡度的具體分布情況。
2)平均路徑長度:
平均路徑長度主要用來描述網(wǎng)絡中隨機一個節(jié)點到其他節(jié)點的平均距離,具體的計算式如下:

(10)
上式中,L代表平均路徑長度;n代表路徑總數(shù)。
平均路徑長度在加權(quán)復雜網(wǎng)絡連通的情況下有效,但是在大部分情況下網(wǎng)絡并不是連通的。為了有效應對上述情況,以下采用一種全新的定義,具體如公式(11)所示:

(11)
上式中,F(xiàn)代表加權(quán)復雜網(wǎng)絡的全局效率;eij代表路徑上的邊集合。
3)聚類系數(shù):
聚類系數(shù)是用來描述加權(quán)復雜網(wǎng)絡中各個節(jié)點的聚集程度,其中節(jié)點i的聚類系數(shù)可以表示為公式(12)的形式:

(12)
上式中,D(i)代表聚類系數(shù);Ne(i)代表節(jié)點鄰居間的真實邊數(shù)。
4)度相關(guān)系數(shù):
代表度和度之間的相關(guān)性,主要用來描述節(jié)點之間的連接傾向,當大度節(jié)點更加傾向于連接大度節(jié)點,則說明網(wǎng)絡是正相關(guān)的;反之,則說明網(wǎng)絡是負相關(guān)的。其中,度相關(guān)系數(shù)對應的計算式如下:

(13)
上式中,s代表度相關(guān)系數(shù);m代表加權(quán)復雜網(wǎng)絡的總邊數(shù)。
5)節(jié)點強度:
節(jié)點強度主要用來描述有權(quán)網(wǎng)絡中節(jié)點連通情況。其中,節(jié)點強度計算式為:

(14)
將加權(quán)復雜網(wǎng)絡中的數(shù)據(jù)從輸入空間非線性映射到特征空間,與線性子空間相比,一個特征子空間可以使用一組正交基向量表示,則特征值可以表示為公式(15)的形式:

(15)
上式中,G(I)代表特征值;〈xi,I〉代表網(wǎng)絡參數(shù)。
多維獨立成分分析屬于一種線性生成模型[13-14],因此可以將加權(quán)復雜網(wǎng)絡數(shù)據(jù)的對數(shù)最大似然函數(shù)log2L(It(x,y),t(i)(x,y))表示為以下形式:
log2L(It(x,y),t(i)(x,y))

(16)
上式中,p〈xi,t〉代表可觀測網(wǎng)絡參數(shù);det(i,j)代表概率密度。
在多維獨立成分分析過程中,可以認為權(quán)值參數(shù)是正交的,所以需要選擇合適的概率密度構(gòu)建聚類模型,其中概率分布可以表示為公式(17)的形式:

(17)
當獨立空間分析被應用于加權(quán)復雜網(wǎng)絡中,同時將在子空間中投影的范數(shù)設定為網(wǎng)絡的輸出單元,其中網(wǎng)絡第一層神經(jīng)元的激活函數(shù)可以采用平方函數(shù);第二層神經(jīng)元的激活函數(shù)采用平方根函數(shù)。
近幾年,隨著高等教育、醫(yī)療衛(wèi)生、科學研究等事業(yè)的迅猛發(fā)展,國家和地方政府經(jīng)費的投入逐年增加,大量的資金被用于資源性基礎條件建設,通過購置、研制、改造等渠道,大型設備設施數(shù)量明顯上升。2018年5月,國家衛(wèi)生健康委員會、國家藥品監(jiān)督管理局印發(fā)了《大型醫(yī)用設備配置與使用管理辦法》,從配置、使用、監(jiān)督等方面,對促進大型醫(yī)用設備合理配置和有效使用提出要求;財政部、教育部、科技部等部門也通過聯(lián)合評議、工作評比等形式,不斷推動規(guī)范和加強大型設備的使用。大型設備都比較昂貴、緊缺,普及率低,如何在保證設備安全使用的前提下,加強大型設備使用績效管理,提高使用效率,是各單位共同關(guān)注的話題。
設定復雜網(wǎng)絡的隨機樣本輸入數(shù)據(jù)為Jt,則加權(quán)復雜網(wǎng)絡的帶權(quán)輸入可以表示為公式(18)的形式:

(18)



(19)
上式中,wij代表網(wǎng)絡參數(shù)權(quán)值。
通過多維獨立成分分析可以有效提取加權(quán)復雜網(wǎng)絡的特征,為了獲取更加滿意的性能,需要將原始網(wǎng)絡數(shù)據(jù)的先驗子空間信息加入到網(wǎng)絡中,進而獲取網(wǎng)絡數(shù)據(jù)的本質(zhì)特征。其中,加權(quán)復雜網(wǎng)絡對應的損失函數(shù)可以表示為公式(19)的形式:

(20)
在對公式(20)進行求解的過程中,需要優(yōu)先獲取加權(quán)復雜網(wǎng)絡的先驗空間子信息。同時采用譜聚類算法構(gòu)建加權(quán)復雜網(wǎng)絡聚類模型,通過模型進行聚類[15],詳細的操作步驟如圖1所示:

圖1 加權(quán)復雜網(wǎng)絡聚類模型建立流程圖
1)設定網(wǎng)絡參數(shù),同時將數(shù)據(jù)集輸入到加權(quán)復雜網(wǎng)絡中。
2)對網(wǎng)絡中的權(quán)值進行初始化處理。
3)通過計算構(gòu)建先驗信息矩陣。
4)將數(shù)據(jù)輸入到加權(quán)復雜網(wǎng)絡中。
5)計算網(wǎng)絡輸出和梯度,如公式(21)所示:

(21)
上式中,r(i)代表網(wǎng)絡輸出值;c(i)代表梯度值。
6)對梯度值進行更新。
7)通過譜聚類算法構(gòu)建加權(quán)復雜網(wǎng)絡聚類模型。
8)采用隨機梯度下降法對加權(quán)復雜網(wǎng)絡聚類模型進行訓練,進而輸出加權(quán)復雜網(wǎng)絡的聚類結(jié)果。
為了驗證所提基于空間關(guān)聯(lián)性的加權(quán)復雜網(wǎng)絡聚類模型的有效性,需要進行仿真實驗測試。將文獻[3]模型和文獻[4]模型作為對比方法,將聚類精度作為測試指標,分析三種聚類模型在不同數(shù)據(jù)集上的聚類性能,詳細的實驗測試結(jié)果如圖2所示:

分析圖2中的實驗數(shù)據(jù)可知,與另外兩種聚類模型相比,所提模型可以獲取更高的聚類精度,主要是因為所提模型對加權(quán)復雜網(wǎng)絡數(shù)據(jù)進行了去噪處理,有效濾除數(shù)據(jù)中的噪聲,使聚類精度得到有效增加。
為了進一步驗證不同聚類模型的性能,選取聚類實際運行時間作為測試指標,詳細的實驗測試結(jié)果如圖3所示:

圖3 實際運行時間對比結(jié)果
分析圖3中的實驗數(shù)據(jù)可知,隨著迭代次數(shù)的不斷增加,各個聚類模型的實際運行時間也開始呈上升趨勢。但是與另外兩種模型相比,所提模型的實際運行時間明顯更低,說明所提模型可以以更快的速度完成網(wǎng)絡聚類。
為了驗證所提模型的收斂性能,選取聚類質(zhì)量(Q-value)作為測試指標,分析三種不同模型的聚類性能,詳細的實驗測試結(jié)果如表1所示:

表1 不同模型Q值測試結(jié)果對比
通過對表1中的實驗數(shù)據(jù)進行分析可知,Q值會隨著迭代次數(shù)的增加而增加。所提模型的Q值明顯高于另外兩種模型,說明所提模型可以獲取較高的聚類質(zhì)量。
為了獲取更加滿意的聚類結(jié)果,提出一種基于空間關(guān)聯(lián)性的加權(quán)復雜網(wǎng)絡聚類模型。和已有模型相比,所提模型可以有效提升聚類結(jié)果的準確性,同時還能夠減少聚類實際運行時間,增強聚類質(zhì)量。
所提模型現(xiàn)階段已經(jīng)得到十分廣泛的應用,但是仍然存在很多問題需要進一步改進:
1)對先驗信息矩陣維度進行改進,全面提升計算結(jié)果的準確性。
2)將其應用到多視角的任務分析中,檢驗是否可以獲取滿意的聚類結(jié)果。