肖楠
(西安交通工程學(xué)院公共課部,陜西西安 710300)
大數(shù)據(jù)檢測是一種相對有效的機器學(xué)習(xí)型信息處理手段,可在已知數(shù)據(jù)存儲行為的基礎(chǔ)上,將信息參量整合成全新的應(yīng)用傳輸形式[1-2]。傳統(tǒng)的數(shù)據(jù)檢測手段可在局部離群因子的作用下,確定局部異常點所處的實際位置,再通過信息復(fù)雜度對比的方式,實現(xiàn)對異構(gòu)型數(shù)據(jù)參量的反饋與對比[3],如基于兩級分段模型的異構(gòu)數(shù)據(jù)處理與檢測方法[4],但此方法并不能完全規(guī)避大數(shù)據(jù)網(wǎng)絡(luò)中的風險性信息傳輸行為,易導(dǎo)致數(shù)據(jù)穩(wěn)定抵抗能力的持續(xù)下降。
數(shù)據(jù)轉(zhuǎn)換服務(wù)(Data Transformation Service,DTS)特指DTS 解碼原理,可以直接對數(shù)字信號源進行分類處理,然后再按照既定順序?qū)⑿畔⒘堪l(fā)送至核心應(yīng)用主機之中。與其他數(shù)據(jù)處理手段相比,DTS 解碼可在無接入設(shè)備作用的前提下,將原始信息參量直接轉(zhuǎn)存至數(shù)據(jù)庫結(jié)構(gòu)體中,再借助輸入、輸出信道,將這些文件參量轉(zhuǎn)換成其他存儲形式,從而滿足與多模態(tài)異構(gòu)數(shù)據(jù)相關(guān)的檢測處理需求[5-6]。
因此,針對傳統(tǒng)方法存在的不足,提出基于DTS的多模態(tài)異構(gòu)大數(shù)據(jù)檢測方法,在深度置信網(wǎng)絡(luò)的基礎(chǔ)上,建立必要的線性映射條件,再通過數(shù)據(jù)參量清洗的方式,實現(xiàn)對異構(gòu)數(shù)據(jù)的降維處理。
基于DTS的多模態(tài)異構(gòu)大數(shù)據(jù)提取由深度置信網(wǎng)絡(luò)搭建、異構(gòu)數(shù)據(jù)編碼、DTS 線性映射條件設(shè)置3 個環(huán)節(jié)共同組成。
深度置信網(wǎng)絡(luò)結(jié)構(gòu)如圖1 所示。

圖1 深度置信網(wǎng)絡(luò)結(jié)構(gòu)圖
深度置信網(wǎng)絡(luò)由RBM1、RBM2、RBM3 3 個模塊單元結(jié)構(gòu)共同組成。其中,RBM1 單元負載一列y0節(jié)點和一列y1節(jié)點,前者能夠判斷DTS 環(huán)境下,多模態(tài)異構(gòu)大數(shù)據(jù)是否具備繼續(xù)傳輸?shù)哪芰Γ笳呖筛鶕?jù)既定檢測指令的傳輸行為,將已打包的信息參量由頂層異構(gòu)結(jié)構(gòu)體反饋至底層異構(gòu)結(jié)構(gòu)體之中[7-8]。RBM2 單元負載一列y1節(jié)點和一列y2節(jié)點,兩者互相聯(lián)合,形成完整的異構(gòu)型大數(shù)據(jù)傳輸單元,并可在DTS 解碼原理的作用下,實現(xiàn)對信息參量的整合與處理。RBM3 單元位于深度置信網(wǎng)絡(luò)底層,可在多模態(tài)節(jié)點的作用下,將散亂分布的大數(shù)據(jù)信息整合成異構(gòu)型傳輸形式。
異構(gòu)數(shù)據(jù)編碼可在深度置信網(wǎng)絡(luò)的基礎(chǔ)上,對DTS 型信息參量進行初步的整合處理,一般情況下,需要原編碼節(jié)點、過度法則、多模態(tài)結(jié)構(gòu)體三類執(zhí)行結(jié)構(gòu)的共同配合[9]。原編碼節(jié)點同時存在于深度置信網(wǎng)絡(luò)的兩端,可在過度法則的作用下,變更多模態(tài)異構(gòu)體的現(xiàn)有連接形式,并可遵照DTS 信道傳輸行為,將這些信息參量反饋至核心數(shù)據(jù)庫存儲單元之中。過度法則對異構(gòu)數(shù)據(jù)編碼原則進行了集中化約束,可在聯(lián)合原編碼節(jié)點與多模態(tài)異構(gòu)體的同時,感知DTS 環(huán)境中大數(shù)據(jù)信息參量的現(xiàn)有傳輸形態(tài),并可按照信息檢測機制的作用形式,對各項大數(shù)據(jù)結(jié)構(gòu)體進行集中化處理[10]。
異構(gòu)數(shù)據(jù)編碼原理如圖2 所示。

圖2 異構(gòu)數(shù)據(jù)編碼原理
DTS 線性映射條件是與多模態(tài)異構(gòu)大數(shù)據(jù)相關(guān)的信息檢索標準,可在已知數(shù)據(jù)存儲權(quán)限值的基礎(chǔ)上,對待檢測信息存儲形式進行重新安排,從而實現(xiàn)對大數(shù)據(jù)異構(gòu)模態(tài)行為的規(guī)劃與協(xié)調(diào)。數(shù)據(jù)存儲權(quán)限值可表示為λ,在既定檢測時長內(nèi),該項物理量的實值水平越高,多模態(tài)異構(gòu)大數(shù)據(jù)的待處置應(yīng)用量也就越大。xn代表最后一個輸入的大數(shù)據(jù)異構(gòu)體參量,n代表與該指標匹配的多模態(tài)系數(shù)指標。x1代表第一個輸入的大數(shù)據(jù)異構(gòu)體參量,聯(lián)立上述物理量,可將大數(shù)據(jù)網(wǎng)絡(luò)中的DTS 線性映射條件定義為:

其中,χ代表DTS 環(huán)境下與多模態(tài)大數(shù)據(jù)相關(guān)的異構(gòu)處理應(yīng)用量,Δq代表單位檢測時長內(nèi)大數(shù)據(jù)檢測行為指標的實際變化量。
在DTS 提取原理的支持下,按照數(shù)據(jù)參量清洗、二值化轉(zhuǎn)換、異構(gòu)數(shù)據(jù)降維的處理流程,實現(xiàn)新型多模態(tài)異構(gòu)大數(shù)據(jù)檢測方法的順利應(yīng)用。
數(shù)據(jù)參量清洗流程如圖3 所示。

圖3 數(shù)據(jù)參量清洗流程圖
數(shù)據(jù)參量清洗是與多模態(tài)異構(gòu)大數(shù)據(jù)檢測相關(guān)的重要信息處理流程,常以獲取DTS應(yīng)用背景作為起始執(zhí)行環(huán)節(jié)。一般情況下,隨著信息多模態(tài)異構(gòu)形式復(fù)雜度的增加,數(shù)據(jù)信息的存儲參量值也會隨之增大,直至將檢測數(shù)據(jù)庫的存儲空間完全填滿11-12]。若多模態(tài)異構(gòu)大數(shù)據(jù)的連接形式始終保持不變,最終信息檢測結(jié)果的有效性只與參量之間的編碼原則相關(guān),且在DTS 線性映射條件的作用下,待處理的大數(shù)據(jù)總量越多,最終所獲得的參量清洗結(jié)果也就越明顯,反之則難以獲取到理想化的信息檢測結(jié)果[13-14]。
二值化轉(zhuǎn)換是一種有效的多模態(tài)異構(gòu)信息處理行為,可在大數(shù)據(jù)網(wǎng)絡(luò)中聯(lián)合所有待編碼的DTS 節(jié)點,一方面降低異構(gòu)數(shù)據(jù)之間的關(guān)聯(lián)度水平,另一方面縮短信息與信息之間的實際傳輸距離[15-16]。在不考慮其他干擾條件的情況下,二值化轉(zhuǎn)換結(jié)果只受數(shù)據(jù)參量清洗基向量、數(shù)據(jù)存儲方向權(quán)值兩項物理量的直接影響。
將數(shù)據(jù)參量清洗基向量表示為αn,在既定檢測條件下,隨著已輸入信息數(shù)量級水平的提升,該項物理指標的實際數(shù)值等級也會隨之增大。數(shù)據(jù)存儲方向權(quán)值可表示為Kˉ,一般情況下,若該項指標的表現(xiàn)實值不超過自然數(shù)1,則可認為最終的檢測執(zhí)行結(jié)果可取。聯(lián)立式(1),可將多模態(tài)異構(gòu)大數(shù)據(jù)的二值化轉(zhuǎn)換結(jié)果表示為:

其中,s0代表最小的信息多模態(tài)異構(gòu)系數(shù),sn代表最大的信息多模態(tài)異構(gòu)系數(shù),f代表兩個相鄰大數(shù)據(jù)信息參量間的實際傳輸距離值,ξ代表冪次項應(yīng)用指標,d代表常性轉(zhuǎn)換系數(shù)。
異構(gòu)數(shù)據(jù)降維是多模態(tài)異構(gòu)大數(shù)據(jù)檢測方法應(yīng)用的末尾處理環(huán)節(jié),可在DTS 環(huán)境中,根據(jù)二值化轉(zhuǎn)換原理的作用權(quán)限,確定數(shù)據(jù)信息在單位時間內(nèi)的實際存儲數(shù)量值。規(guī)定ΔT代表一個單位檢測時長,隨著多模態(tài)異構(gòu)信息輸入量的增加,與之相關(guān)的檢測時間消耗實值也會逐漸增大,直接與大數(shù)據(jù)應(yīng)用主機的處置權(quán)限完全相符。設(shè)L~ 代表符合DTS 環(huán)境存儲標準的數(shù)據(jù)消耗權(quán)限值,一般情況下,如果不出現(xiàn)明顯的差異化數(shù)據(jù)異構(gòu)行為,該項物理量的實際數(shù)值水平也不會出現(xiàn)明顯的變化狀態(tài)。在上述物理量的支持下,聯(lián)立式(2),可將多模態(tài)異構(gòu)大數(shù)據(jù)的降維處理結(jié)果表示為:

其中,a0代表與多模態(tài)大數(shù)據(jù)參量相關(guān)的最小連接異構(gòu)條件,an代表多模態(tài)大數(shù)據(jù)參量相關(guān)的最大連接異構(gòu)條件,gn、g1分別代表兩個非同時輸入的待檢測信息參量指標。至此,實現(xiàn)各項參量系數(shù)指標的計算與處理,在DTS 解碼原理的支持下,完成新型多模態(tài)異構(gòu)大數(shù)據(jù)檢測方法的搭建。
為驗證基于DTS 多模態(tài)異構(gòu)大數(shù)據(jù)檢測方法的實際應(yīng)用價值,設(shè)計如下對比實驗。
在大數(shù)據(jù)網(wǎng)絡(luò)中,截取兩組等長的傳輸數(shù)據(jù)參量,分別作為實驗組、對照組檢測處理對象。令實驗組執(zhí)行主機搭載基于DTS 多模態(tài)異構(gòu)大數(shù)據(jù)檢測方法,對照組執(zhí)行主機搭載傳統(tǒng)的基于兩級分段模型的異構(gòu)數(shù)據(jù)處理與檢測方法,在確保其他干擾條件保持不變的情況下,記錄各項實驗指標的實際變化情況。
出于實驗公平性考慮,除所用檢測方法不同外,實驗組、對照組所有應(yīng)用指標全部保持一致。實驗參數(shù)設(shè)置情況如表1 所示。

表1 實驗參數(shù)設(shè)置
IID 指標能夠反映與檢測主機匹配的信息傳輸行為風險性規(guī)避能力,一般情況下,指標數(shù)值越大,檢測主機所具有的規(guī)避能力也就越強,反之則越弱。表2 記錄了實驗組、對照組IID 指標的具體變化情況。

表2 IID指標對比表
分析表2 可知,隨著實驗時間的延長,實驗組IID 指標始終保持先上升、再穩(wěn)定的變化趨勢,全局最大值能夠達到95%,且能夠出現(xiàn)10 min的數(shù)值穩(wěn)定狀態(tài)。對照組IID 指標則在20 min的穩(wěn)定狀態(tài)后,開始不斷下降,全局最大值僅能達到70%,與實驗組極值相比,下降了25%。綜上可知,應(yīng)用基于DTS 多模態(tài)異構(gòu)大數(shù)據(jù)檢測方法,可大幅提升IID 指標的數(shù)值水平,從而增強與檢測主機匹配的信息傳輸行為風險性規(guī)避能力。
PEI 指標能夠反映多模態(tài)異構(gòu)數(shù)據(jù)的穩(wěn)定抵抗能力,一般情況下,前者的數(shù)值指標越大,后者的穩(wěn)定抵抗能力也就越強,反之則越弱。表3 記錄了實驗組、對照組PEI 指標的實際數(shù)值變化情況。
分析表3 可知,隨著實驗時間的延長,實驗組PEI 指標始終保持上升、下降交替出現(xiàn)的變化趨勢,全局最大值能夠達到82%。對照組PEI 指標則保持先上升,再穩(wěn)定,最后下降的變化趨勢,全局最大值僅能達到56%,與實驗組極值相比,下降了26%。綜上可知,應(yīng)用基于DTS 多模態(tài)異構(gòu)大數(shù)據(jù)檢測方法,可使PEI 指標數(shù)值得到有效提高,滿足增強多模態(tài)異構(gòu)數(shù)據(jù)穩(wěn)定抵抗能力的實際應(yīng)用需求。

表3 PEI指標對比表
與傳統(tǒng)的異構(gòu)數(shù)據(jù)檢測手段相比,新型多模態(tài)異構(gòu)大數(shù)據(jù)檢測方法可在DTS 編碼原理的作用下建立必備的線性映射條件,也可在聯(lián)合深度置信網(wǎng)絡(luò)的同時,確定與異構(gòu)數(shù)據(jù)相關(guān)的實際編碼原則。若能夠保障數(shù)據(jù)參量的清洗能力,則能夠在二值化轉(zhuǎn)換技術(shù)的作用下,實現(xiàn)對異構(gòu)數(shù)據(jù)的降維處理。從實用性角度來看,IID 指標與PEI 指標數(shù)值的提升,能夠大幅加強與檢測主機匹配的信息傳輸行為風險性規(guī)避能力,且可實現(xiàn)對多模態(tài)異構(gòu)數(shù)據(jù)穩(wěn)定抵抗能力的有效保障。