李弘揚, 史令飛, 張利龍
(海軍工程大學, 武漢 430033)
隨著5G 和物聯網技術的發展,采用數字化云平臺體系構造的方法進行軍隊院校的數字化管理,構建智慧化的校園管理體系,通過對智慧教學支持平臺構建,結合大數據分析方法,實現對軍隊院校管理過程中的數字化信息調度。 軍隊院校管理的運維數據主要有科研管理數據、教學管理數據、學生畫像數據以及師資分析數據等多源數據,這些多源數據的種類分布主要分為教學管理類、學生管理類和科研管理類以及資產管理類等[1]。 采用大數據的云融合技術,結合對海量數據的采集、清洗和調度處理,提高軍隊院校的數字化信息管理水平。 在進行軍隊院校的多源管理數據處理中,處理數據存在冗余,需要采用數據清洗技術提高對數據分析的針對性,因此,研究軍校多源數據融合清洗技術,對提高數據調度和共享能力方面具有重要意義[2]。
對數據清洗是建立在對數據的融合濾波和抗干擾設計基礎上,構建濾波檢測模型,通過動態參數融合和線性化調度,結合數據行為特征參數分析和提取,實現對信息化管理數據的清洗處理,傳統方法中,對信息化管理數據的清洗技術主要有基于protocol buffers 調度的數據緩存清洗技術、基于PSO粒子群調度的數據聚類清洗技術以及基于網格調度的數據清洗技術等[3],通過對待清洗數據的非線性時間序列分析和包絡幅值檢測,通過線性預測方法實現對數據的動態清洗和優化調度,但傳統方法對復雜平臺體系下的數據清洗聚類性好。 針對上述問題,本文提出基于聯通公有云平臺調度的軍隊院校多源數據融合清洗技術。 首先構建軍隊院校的信息化管理數據的大數據挖掘模型,然后采用冗余數據濾波技術實現對多源管理數據的濾波處理和數據強化跟蹤,結合優化的數據聚類算法,實現數據融合清洗,最后進行仿真測試分析,展示了本文方法在提高軍隊院校多源管理數據動態清洗融合能力方面的優越性。
為了實現聯通公有云平臺下軍校多源數據融合清洗,構建基于CiteSpace V 的軍隊院校多源數據融合調度模型,構建軍隊院校多源數據動態融合清洗數據庫,結合AD 信息采樣進行軍隊院校多源數據采樣,在聯通CMP 多云管理平臺體系下,通過聯通機房控制,結合動態融合的分布式云數據清洗技術[4],采用交叉編譯和PCI 總線協議進行軍隊院校多源數據融合清洗的平臺體系構建,將軍隊院校的信息化管理系統分為管理資源數據庫模塊、網絡模塊、人機交互模塊和接口控制模塊等,通過對管理員的權限配置和動態參數分析,結合管理用戶分配,建立底層數據庫,信息管理平臺的底層結構如圖1 所示。

圖1 平臺底層結構模型Fig. 1 Platform bottom structure model
根據圖1 的底層結構模型,采用嵌入式的BS 總線調度下進行軍隊院校多源數據動態融合清洗的數據庫體系結構設計,對軍隊院校多源數據融合清洗平臺設計分為數據采集輸入單元、數據庫模型調度單元、數據集成加工單元、數據三維可視化處理單元以及人機交互輸出單元等[5],得到聯通公有云平臺下軍校多源數據融合調度模型的實現結構如圖2 所示。

圖2 平臺實現結構流程Fig. 2 Platform implementation structure flow
通過ADO.NET 組件庫建立軍隊院校多源數據融合清洗平臺的3D 可視化處理模型, 采用ModelBuilder 3D 中間件技術進行軍隊院校多源數據動態融合過程中的私有云平臺調度,在上述總體結構設計的基礎上,進行數據清洗算法設計[6]。
構建以科研管理數據、教學管理數據、學生畫像數據以及師資分析數據等為一體的大數據挖掘模型,根據對數據采集的活躍狀態節點分布式部署,結合傳感信息融合跟蹤識別[6],建立軍隊校園多源分布大數據分布的樣本集,得到K個近鄰樣本值為:
其中,x表示多源數據調度節點匯聚鏈路增益;di表示科研管理數據的動態調度特征分布集;Cj表示聯合自相關分配參數;Sim(x,di) 為相似度;y(di,Cj) 為校園全域感知的動態信息特征分配參數。 基于可視化的數據特征重構技術,建立軍隊院校數字化信息管理的云平臺處理模型,得到數字孿生的動態稀疏特征分配模型表示為:
其中,
采用線性化的均衡調度方案,實現軍校多源數據融合過程中的邊緣分布式檢測,得到邊緣特征分布檢測模型為:
其中,
通過稀疏性特征重組,結合線性均衡調度和分塊特征匹配,實現對軍隊校園多源分布大數據挖掘,根據數據挖掘結果進行樣本特征點匹配[7]。
在構建了大數據挖掘模型的基礎上,結合對分配數據的聯合關聯相似度分析,采用模糊自相關特征匹配技術,建立軍隊校園多源管理數據時間序列的檢測統計量,得到檢測統計特征分配模型參數表示為:
其中,a0為數據融合調度過程中的特征匹配系數;xn-i為任意某時刻點p處的語義相似度分配的條件概率密度;bj為每個節點采集的軍校信息化管理的匹配數據。 采用回歸分析方法,建立數據異構特征匹配模型,得到特征匹配函數為:
其中,xa,b,d,p為第m類匹配數據的邊緣聯合特征分配特征向量;Vp為整合移動平均自回歸參數;為軍隊院校多源管理數據融合的聯合加權;(S) 為大數據模糊隸屬度;B為學習行為的多維特征分布集。 根據上述分析,采用基于物聯網模型的數字孿生技術建立智慧校園動態管理數據的可視化調度模型,采用冗余數據濾波技術實現對多源管理數據的濾波處理和強化跟蹤數據。
采用模板匹配技術,對軍隊院校多源數據進行動態增益控制,構建雙向鏈路管控模型,表示為(k,i),提取軍隊院校多源數據融合相關性特征量,采用聯通公有云平臺調度方案,結合3DStudio MAX 軟件進行軍隊院校多源數據融合清洗的過程分配,得到清洗過程的過程分配特征子集:
其中,pdrop為軍隊校園多源分布大數據清洗的冗余特征分量;k1為自相關特征匹配系數;l為數據分布的長度;Ecomm是動態約束參數。 在重連通圖中,通過數據融合聚類處理,結合聚類中心的強化跟蹤學習,實現對數據冗余濾波[8]。
采用無線傳感器網絡的共享調度的方法,建立軍隊校園多源管理數據匹配模型,通過模糊C均值聚類進行節點的參數動態調節[9],得到模糊C均值聚類中心分別為p和q,鏈路l的聯合特征匹配模型參數通過頻率間隔指數TL×1(l <L) 調節,數據清洗的動態調節模型表示如下:
其中,Fp1和Fq1為軍隊院校多源數據分布節點的能量匹配系數。 在N個簇首節點中,通過大數據融合、預測和自適應處理,得到冗余濾波系數為p∈[0,p1,p2,…,pmax]。 根據計算數據的狀態差異度函數,得到匹配周期矩陣PN×1,數據清洗輸出為:
其中,i為數據清洗的冗余參數配置節點;G為連通圖;λi為冗余數據的分布網格單元;σ為協方差。 基于沖突調節機制,采用模糊C 均值聚類,得到數據特征參數提取和信息融合輸出為:
其中,σ為sink 節點周圍的統計分析數據;G為模糊C 均值聚類簇;hi為最大跳數;γi=γth為閾值。 根據上述算法設計,實現對數據模糊C 均值聚類及清洗,提高數據的調度和檢索能力[10]。
為了驗證本文方法在實現軍隊院校多源管理數據動態融合清洗的性能,數據采樣的動態分布覆蓋范圍為240×120 個網格節點,數據采樣的頻譜分布特征量為Pe=0.12;種子節點集分布概率Pd=0.09,云平臺虛擬機初始能量為90 KJ,吞吐量為23.4 B/S/HZ,多源數據管理平臺任務分配參數分布見表1。

表1 多源數據管理平臺任務分配參數Tab. 1 Task allocation parameters of multi-source data management platform
根據上述仿真條件設定,進行軍隊院校多源管理數據采樣,得到原始采集的數據如圖3 所示。

圖3 原始采集的數據Fig. 3 Original collected data
以圖3 的軍隊院校多源管理數據為測試對象,采用本文方法進行多源數據融合清洗調度冗余數據并封裝后返回到docker 中,得到輸出的數據如圖4所示。

圖4 冗余清洗輸出Fig. 4 Redundant cleaning output
分析圖4 得知,本文方法能有效實現對軍隊院校多源管理數據冗余數據,提高了數據的動態提取能力。 測試數據清洗過程收斂性,得到測試結果如圖5 所示。

圖5 收斂性測試Fig. 5 Convergence test
圖5 采用多元回歸聯合自相關分析方法進行數據清洗性能的收斂性測試,分析得知,隨著嵌入維的增大,清洗過程逐步收斂,測試數據的查準性,對比結果見表2。 分析得知,本文方法對數據的查準率比傳統方法提升12.3%,

表2 查準性測試Tab. 2 Comparison of precision test
采用大數據的云融合技術,結合對海量數據的采集、清洗和調度處理,提高軍隊院校的數字化信息管理水平。 本文提出基于聯通公有云平臺調度的軍隊院校多源數據融合清洗技術。 構建軍隊院校的信息化管理數據的大數據挖掘模型,結合動態融合的分布式云數據清洗技術,將軍隊院校的信息化管理系統分為管理資源數據庫模塊、網絡模塊、人機交互模塊和接口控制模塊等,通過數據融合聚類處理,結合聚類中心的強化跟蹤學習,實現對數據冗余濾波和清洗。 分析得知,本文方法提高了對多源數據的動態清洗能力,數據調度過程的抗干擾性較強,數據采集和檢索的查準率較高,在構造軍校多源數據管理平臺和數字化建設中具有很好應用價值。