柯建波
(廣東工業大學 華立學院, 廣州 511325)
隨著網絡通信技術的發展,在信息中心網絡中的數據規模不斷增大,需要對信息中心網絡源數據進行有效的識別和檢測,提取源數據的關聯規則集,根據網絡通信的輸出特征量進行自適應特征檢測和識別,濾除源數據的干擾信息,提高信息中心網絡的數據管理能力,研究信息中心網絡源數據的優化檢測方法,在實現信息中心網絡的數據信息集成管理和調度中具有重要意義[1]。
對信息中心網絡源數據的檢測是建立在對數據的優化挖掘和融合聚類處理基礎上,建立信息中心網絡源數據的關聯規則分布特征集,結合模糊相關性約束控制方法,進行信息中心網絡源數據的自適應特征分離和檢測。當前,對信息中心網絡源數據的檢測方法主要有譜特征檢測方法、模糊相關性檢測方法、融合聚類檢測方法等。其中,文獻[4]中提出一種基于非平穩數據融合的信息中心網絡源數據的高效定位挖掘的檢測方法,采用點掃描方法在傳輸鏈路層進行信息中心網絡的傳輸數據采樣,結合特征分離和自適應的信息融合技術,實現信息中心網絡的源數據檢測和挖掘,但該方法的計算開銷較大,實時性不好[2];一種基于交互式信息融合的信息中心網絡源數據檢測模型,進行信息中心網絡的鏈路傳輸信道分析和特征重構,根據數據檢測結果進行模糊聚類和挖掘,提高網絡數據檢測的準確性,但該方法在進行數據檢測中的均衡性不好[3];基于模糊PID信息融合和可達標識的信息中心網絡源數據檢測方法,采用PID神經網絡檢測器進行數據檢測,結合關聯信息挖掘方法,提高數據檢測的準確性,該方法在進行大規模數據挖掘的實時性和抗干擾性不好[4]。
針對上述問題,本文提出一種基于多分類器融合的信息中心網絡源數據檢測方法,首先,構建信息中心網絡源數據的統計序列重組模型,建立基于模糊C均值聚類的多模級聯分類器;其次,采用數據特征的融合法和分裂法進行數據聚類中心尋優控制,實現網絡源數據檢測優化;最后,進行仿真實驗分析。仿真結果說明本文方法在提高信息中心網絡源數據檢測準確性方面的性能優越。
為了實現對信息中心網絡源數據檢測設計,首先構建網絡源數據的相空間重構模型,結合對原始數據的五元組特征分析結果,進行源節點定位和子圖模式分析,建立網絡源數據的連通圖模式結構,根據源節點模式的匹配結果進行關聯規則挖掘和端口結構分析,構建網絡源數據的節點匹配模式,根據多分類器融合結果進行信息分類,實現網絡源數據的優化檢測,實現結構如圖1所示。

圖1 信息中心網絡源數據檢測的實現結構圖
根據圖1所示的信息中心網絡源數據檢測結構模型,進行檢測算法設計,構建網絡源數據分布的有限數據集模型為式(1):
X={x1,x2,…,xn}?Rs.
(1)
信息中心網絡中對源數據采樣集合中含有n個樣本,信息中心網絡源數據的有限論域內,數據的統計樣本序列為xi,對應數據的特征采樣序列為i=1,2,…,n,特征矢量為式(2):
xi=(xi1,xi2,…,xis)T.
(2)
在信息中心網絡節點連通圖中,構建信息中心網絡源數據的高維特征空間分布結構模型,采樣相空間重構技術,構建反映信息中心網絡源數據關聯特征的本體模型,相空間重構的關聯權重為式(3):
ω=((ω1,a1′), (ω2,a2′),…,(ωn,an′))T,
ωj∈[0,1].
(3)
在高維相空間中,信息中心網絡源數據的嵌入維特征量和主成分特征集為式(4):
(4)
式中,m為關聯權重指數;(dik)2為相似度特征集,結合語義本體映射方法源數據的樣本特征分布式重構,根據xk與Vi的測度距離,得到第i個信息中心網絡源數據的特征分布子圖,由此實現信息中心網絡源數據重組,結合重組模型進行特征挖掘和信息融合聚類[5]。

(5)
(6)
根據信息中心網絡源數據的有限論域的特征匹配模型進行信息融合,得到關聯規則調度集滿足式(7):
|Δfx(X,t)|≤Fx(X,t)|Δfθ(X,t)|≤Fθ(X,t).
(7)
對信息中心網絡源數據的關聯規則集進行自動排序,得到數據的特征融合分量描述為式(8)~式(10):
(8)
(9)
(10)
取sinθp=θp, cosθp=1,進行網絡源數據的特征挖掘和屬性歸集,描述為式(11):
(11)



(12)
K(xi,xj)=
(13)
K(xi,xj)=(
(14)
K(xi,xj)=exp(‖xi-xj‖2/2σ2).
(15)
式(15)中σ=0.707。根據網絡源數據的特征分布屬性進行分類融合,得到融合結果為式(16)~式(19):
(16)
(17)
(18)
(19)
在源數據的檢測過程中,得到源數據分類的迭代加速公式為式(20):
(1-ω)xi(k)+ωxi-(k+1)=xi(k+1),
i=1,2,…,n.
(20)
采用決策樹信息融合方法進行網絡源數據的多分類器融合,實現信息融合優化。
構建基于模糊C均值聚類的多模級聯分類器,采用數據特征的融合法和分裂法進行數據聚類中心尋優控制,令p=R(r)Θ(θ)Z(z)ejwt,在置信度α下提取信息中心網絡源數據的譜特征量為式(21):
(21)
在云計算環境下的信息中心網絡源數據堆棧模型表示為式(22):
(22)
結合模糊相關性的約束控制方法,構建信息中心網絡源數據的統計特征量,表示為式(23):
eR,j=(|yR,j(n)|2-R2,R)×yR,j(n)*.
(23)
以特征提取結果為輸入參考量,得到信息中心網絡源數據的分布式差異特征提取結果為式(24):
(24)
分別對i(i=1,2)條網絡源數據的檢測通道進行信息融合,濾除干擾信息,由此確定網絡源數據多維特征檢測值為式(25):
u=[u1,u2,…,uN]∈RmN.
(25)
構建網絡源數據統計特征分布模型,式(26):
(26)
其中,GX(x,y)是網絡源數據的特征指向性函數,m,n分別是網絡源數據的嵌入維數和延遲,結合定量遞歸分析方法,實現網絡源數據檢測,得到檢測輸出為式(27)~式(29):
(27)
(28)
(29)
其中,P(X)、P(Y)表示網絡源數據的聯合關聯規則分布集,X、Y為網絡源數據的采樣延遲,P(X∩Y)是網絡源數據的互信息函數,X、Y為網絡源數據的模糊特征序列分布集。綜上分析,實現基于多分類器融合的網絡源數據檢測。
為了測試本文方法在實現信息中心網絡源數據檢測中的應用性能,結合MATLAB進行仿真實驗,網絡源數據庫采用Deep Web 200G,數據樣本集為2 000,測試集為100,對信息中心網絡源數據采集的時間長度為1 024,離散采樣頻率為fs=10*f0Hz=10 KHz,數據包的數量設置為N=1 000,根據上述仿參量設定,進行網絡源數據檢測,首先進行網絡傳輸數據采樣,得到采集的數據波形如圖2所示。

圖2 信息中心網絡的數據采樣
采用相空間結構重組方法進行源數據的信息特征挖掘和重構,得到重構結果如圖3所示。
在高維相空間中實現網絡源數據的關聯規則挖掘,對提取的網絡源數據的關聯特征集分類融合,實現數據的優化檢測,得到檢測輸出如圖4所示。
分析圖4得知,采用本文方法能有效實現信息中心網絡源數據檢測,輸出數據的抗干擾性較好,特征分辨能力較強,采用不同方法測試信息中心網絡源數據檢測的準確性,得到對比結果見表1,分析得知,采用本文方法進行信息中心網絡源數據檢測的準確概率較高。因為本文方法通過對提取的網絡源數據進行了關聯特征集合并和分類融合,提高了數據檢測的精度,相比其他方法在抗干擾性和檢測的準確性方面具有優越性。

圖3 數據的相空間重構結果

圖4 檢測輸出

表1 準確性對比
對信息中心網絡源數據進行有效的識別和檢測,提取網絡源數據的關聯規則集,濾除網絡源數據的干擾信息,提高信息中心網絡的數據管理能力,本文提出一種基于多分類器融合的信息中心網絡源數據檢測方法。首先,構建網絡源數據的節點匹配模式,采用最小均方誤差估計方法,進行網絡源數據的
子圖特征匹配,采用語義特征融合方法,在高維相空間中實現網絡源數據的關聯規則挖掘,構建基于模糊C均值聚類的多模級聯分類器,實現數據檢測優化。研究得知,采用本文方法進行網絡源數據檢測的抗干擾性較好,檢測準確概率較高,提高了數據的融合調度能力。