童 星
(青島理工大學,山東 臨沂 273400)
數據采集是計算機應用的重要領域,通過數據處理與采集能夠改善復雜信息量激增的問題。常見的數據采集方法為利用ADC多通道系統實現采集過程,但該方法無法確保數據同步采集的時間間隔合理性,會對后續數據分析造成影響,并且對計算機系統的運行速度利用不夠充分,占用大量CPU時間,采集效率較低,不能實現高速采集。因此,如何實現多通道通信網絡數據跨層高速采集,已經成為該領域急需解決的問題。
為滿足通信數據采集的精準性與實時性,相關學者提出如下研究。文獻[1]提出基于FPGA的多通道實時高速數據采集方法。對采集系統的信號監測、前端數據處理、核心控制與數據顯示等結構進行設計,并分析該系統的工作原理;把獲取的數據儲存到FPGA儲存器中等待處理,此時設計信號調制電路,使調整后的電路能夠確保電壓信號的平穩;另外設置軟件功能,降低數據與時鐘之間的偏斜程度,待系統判讀生效后,將上述待處理的數據傳輸到控制器進行處理,從而實現了數據的采集功能。文獻[2]針對現有方法無法有效匹配事件序列的不足,提出基于TCN的量化時序約束表示模型,運用該模型將事件轉化為簡單的時序約束問題,使復雜事件檢測方法更加高效,從而實現數據采集的有效控制。
上述采集方法在一定程度上減少了數據沖突,達到了延長系統使用壽命的目的,但不能實現采集精度與效率之間的平衡。因此,本文在時序控制的基礎上,對多通道通信網絡數據跨層采集方法進行研究。在許多領域中存在按照時間順序發生的具有概率特征的隨機事件,根據先后順序將發生的事件記錄下來,就形成了時間序列。本文通過對多層數據的挖掘,確定數據采集原理,根據該原理對時序進行設計,實現對時序的控制,最后通過對比實驗驗證了所提方法的優越性能。
在多通道跨層冗余通信網絡數據挖掘過程中,不同通道與層次的取值和閾值存在密切關系,取值數量和閾值大小存在反比關系,將通道最底層的不同數值當作先驗知識,在此基礎上對所有通道中最底層的閾值進行定義,每個通道的高層閾值根據對比所在層中的不同取值產生,并對其閾值上限進行限定,確保閾值小于等于1。因此獲取第i個通信到最底層最小支持度與最低可信度[3,4]的表達式分別為

(1)

(2)
因此第i個通道j層的閾值表達式為

(3)

(4)
式中,n表示多通道多層數據的通道數量,dij代表第i通道j層具有的不同取值數量;X表示集合規則結構。
利用免疫遺傳算法[5],將關聯原則作為依據對跨層數據進行挖掘,挖掘過程包括最小支持向量的頻繁規則選擇與強度關聯原則的發生兩部分。
假設一個多通道跨層數據集合{Ai,Bj},Ai與Bj分別代表決策與任務屬性,集合規則結構生成一串編碼X={b1…bm.x1…xn},b1…bm與跨層數據的任務屬性相對應,x1…xn與決策屬性相對應,則適應度函數表達式為

(5)
對式(5)進行遺傳操作,將免疫原則選取策略作為基礎,結合濃度概率[6]Pd與適應度概率Pf確定跨層數據的選取機率P,個體濃度d通過群體中相同個體數目q與數據群體規模M之比獲得,因此,Pd與Pf可以通過以下描述進行表示

(6)

(7)
式中,fij表示多通道跨層群體中個體的適應值;ftotal表示群體中全部個體適應值之和。
根據上述公式獲得跨層數據的選擇機率P的表達式為
P=aPf+(1-a)Pd
(8)
式中,a為一個常數,滿足a∈(0,1)的條件。
由于會產生濃度較高的抗體,因此必須對濃度群體進行更新,確保適應度較好的個體被選擇出來的機率更高,假設抗體濃度為W,它代表群體中適應度最強的抗體數量和全部抗體數量的比值,則調控個體的選擇機率p(i)的表達式為

(9)
式中,β表示可以調整的參數,并且β∈[0,1]。通過上述分析得出抗體最大程度的適應性,因此完成多通道數據無冗余跨層挖掘[7]。
根據數據挖掘結果,依據最短路徑原則對數據進行跨層采集。在對通信網絡數據采集的過程中,獲取通信網絡實際傳輸數據的總數量,并取得數據采集總數量最大化的限制條件和全部網絡節點接收信息總量與跳數存在的關系。將通信網絡數據采集問題轉變成最大數據量采集的最優路徑選擇問題,確定通信數據采集的目標函數,在此基礎上實現對通信網絡數據的采集。具體過程如下:

(10)


(11)



(12)



(13)



(14)



(15)
根據上述通信網絡數據采集原理實現對多通道通信網絡數據的跨層采集,但是采集過程耗能較高,容易出現延時現象,下面結合時序控制方法對其進行改善。
結合上述對數據采集原理的描述,時序控制應該提供和接收下述時序信號內容:
主機系統存在的啟動脈沖TTR;信息緩沖帶發生器原始脈沖TRS;定時脈沖TSH;轉換器的啟動脈沖TST;轉換器的結束信號EOC;通道地址的統計數量脈沖TCA;信息緩沖帶脈沖TWE,地址記錄脈沖TBA,采集結束脈沖TCE。
結合采集原理,上述信號的時序關系圖如圖1所示。

圖1 數據采集工作時序圖
定時采集脈沖TSH的時間間隔Δt可以根據具體程序設置,從上圖中可以看出Δt不能小于ΔT。ΔT由采集系統的工作速度決定,它可以體現采集系統的時序關系操控采集過程所達到的最快速度,根據圖1的工作時序圖實現通信網絡數據采集。
根據圖1中顯示的工作時序,獲取多通道通信網絡數據跨層采集的控制原理圖,如圖2所示。

圖2 時序控制原理實現圖
圖2中,主系統利用一條輸出命令就可以觸動啟發器脈沖TTR,它將主系統數據總線DBO中的數據“1”傳輸到觸發器D1的Q端,因此能夠啟動系統中的定時器與計數器的控制信號GATE,表明此時這兩個程序開始工作,觸發器D1的Q端啟動了單穩3,令其出現一個初始歸零脈沖TRS,此時脈沖信息緩沖帶地址發生器為清零狀態,并將DMA請求信號同時清零。
采集系統啟動后,定時器發生的定時脈沖TSH控制每個通道數據的自動采集過程。每條通道地址發生器是通過一個3bit的二進制計數工具完成的,在被定時脈沖每進行一次清零時,所有的統計數量脈沖都會加1,此時輸出的計數情況可以當作每條通道地址。按照上述過程,每個定時脈沖實現一個時間段的數據采集,同時定時脈沖還會觸發單穩2,經過與單穩2的聯通,產生ADC的啟動脈沖,此時該通道的A/D轉換也被啟動。在轉換結束后,ADC將產生轉換結束信號EOC,該信號不但出現各通道地址的統計數量脈沖,使通道地址加1,并連接下一通道,而且啟動單穩1出現數據緩沖帶的脈沖信號,將轉換結果記錄在緩沖帶中。信息緩沖帶脈沖結束時出現的地址記錄脈沖信號會使緩沖帶的地址啟動器加1,并指向下一個緩沖區。此時,緩沖區地址啟動器同樣通過二進制計數器實現,它的計數位數和緩沖區的容量相對,將計數狀態當作緩沖帶地址,并利用信息緩沖區啟動器的原始脈沖將其清零,再由地址記錄脈沖令其加1。
同時,地址記錄脈沖觸發單穩2,獲取下一通道的轉換啟動信號。按照上述過程,實現高速通信網絡數據采集的信號轉換與結果儲存。當每層數據的最后通道采集結束后,地址計數器輸出Q2變為“1”,此時結束信號TGE,禁止產生轉換啟動信號,直到下一個定時脈沖啟動下一通道的數據采集。此時實現了時序控制的多通道通信網絡數據采集的全部過程。
在實驗過程中,為更好驗證基于時序控制的通信網絡數據采集方法的可行性,進行對比實驗。選取模擬數據集My-Sea作為基礎數據集,并通過在線數據分析軟件MOA進行數據處理。
由于多通道跨層數據采集是基于計算機網絡實現的,因此,會造成網絡擁塞現象,降低計算機運行效率,所以,首先利用所提方法與文獻[1]、文獻[2]方法對網絡運行的擁塞率進行對比實驗,計算公式如下所示

(16)
式中,v表示數據采集過程中計算機運行速度;v0表示原始計算機運行速度。
三種方法實驗結果對比圖如圖3所示。

圖3 不同方法的擁塞率對比圖
從上圖可以看出,所提方法在進行數據采集時,擁塞率保持在25%以下,而文獻[1]方法的擁塞率最高值達到了47%,文獻[2]方法的擁塞率最高值達到了36%,從上述數據可以看出,現有方法的擁塞率明顯高于所提方法,說明該方法對網絡的依賴程度不高,運行速度較快。這是由于所提方法在進行數據采集時序控制之前,采用免疫遺傳算法對通信數據中的冗余數據進行了剔除,實現了跨層無冗余數據挖掘,因此擁塞率較低。
為了突出所提方法的全面性與合理性,將數據采集延時作為評價指標,進行對比實驗,實驗對比圖如圖4所示。

圖4 不同方法數據采集延時對比圖
根據圖4可以看出,隨著數據采集量的不斷增多,與其它兩種方法相比,所提方法的數據采集延時更短,說明該方法具有很好的采集效率,能夠滿足對數據采集的要求。這是由于所提方法在數據挖掘的基礎上,參考最短路徑原則,將數據采集問題進行了轉變,轉換為最優路徑選擇問題,并通過設計時序控制邏輯,繪制工作時序圖,設計時序控制方案等步驟實現對多通道通信網絡數據跨層采集的時序控制。
為提升通信數據采集能力,本文對多通道通信網絡數據跨層采集時序控制方法進行研究。首先通過免疫遺傳算法去除大量的冗余數據,完成跨層信息挖掘;其次將最短路徑理論與數據采集相結合,分析采集原理;最后在該原理基礎上對時序進行設計,并實現高速采集通信數據的目的。測試結果表明,所提方法可以在保證數據安全的基礎上,大幅度提升多通道通信網絡數據跨層采集的能力,可以實現對整個采集程序的有效管理。