鄒 洪,劉家豪,陳 鋒,農彩勤,王 斌
(南方電網數字電網研究院有限公司網絡安全公司,廣東廣州 510663)
遞歸神經網絡是一種具有樹狀階層結構的人工型神經應用網絡,在實際執行環境中,可按照節點連接順序對輸入信息進行遞歸性安排,是深度學習算法的必要表現形式之一。一般情況下,這種網絡結構體同時保持權重共享與拓撲結構可變的應用能力,可同時面對多種較為復雜的機器學習任務,在自然語言處理方面具有較強的實用性價值[1-2]。由于階層分布原則的存在,高階層節點只能被定義為父節點,而低階層節點只能被定義為子節點,二者之間的信息傳輸關系始終保持不可逆狀態。
訓練數據是指在數據挖掘處理過程中,可直接用于訓練數據挖掘模型的傳輸型應用信息,在實際選擇時,遵循樣本空間盡可能大、數據類型盡可能多的原則[3]。隨著待處理訓練數據總量的增大,信息傳輸安全性會出現明顯下降的變化趨勢。為避免上述情況的發生,傳統進程監控型編碼系統利用非可變譯碼腳本對訓練數據樣本進行處理,再利用傳輸密鑰控制信息的實際傳輸速率。但此方法所需的譯碼等待時間相對較長,很難完全滿足信息應用文件的及時性編碼需求。為解決此問題,設計基于遞歸神經網絡的原始訓練數據防泄漏密碼生成系統,聯合數據收發器及源、譯碼文件等結構完成系統的軟硬件執行環境搭建,再借助既定編碼原則,實現對訓練數據樣本的及時處理。
原始訓練數據防泄漏密碼生成系統的硬件執行環境由遞歸神經網絡框架、訓練數據收發器、信息防泄漏加密模塊三部分共同組成,具體搭建方法如下。
遞歸神經網絡框架由輸入頭結點、數據遞歸結點、神經性應用節點、源碼輸出節點4 部分共同組成。其中,輸入頭結點負責整合運用傳輸的原始訓練數據,并將其按需分配至各級網絡設備元件之中。數據遞歸結點可在接收數據信息參量的同時,建立與神經性應用節點的信號傳輸關系,并可將原始訓練信息參量整合成多極化傳輸的表現形式[4-5]。在此過程中,源碼輸出節點始終保持相對較為活躍的占用狀態,可完整接收網絡環境中的所有遞歸信號,并將其分別轉存至不同的數據遞歸節點中。

圖1 遞歸神經網絡框架結構
訓練數據收發器描述了遞歸神經網絡在狀態空間中的信息軌跡行為變化狀態,一般情況下,隨待傳輸原始訓練數據樣本的增大,遞歸信號的連接狀態也會由面型轉變為線型,且在遞歸神經網絡中,該類型結構元件中的數據傳輸行為不會隨樣本軌跡的延長而出現發散性行為狀態[6-7]。由于網絡促進作用的影響,訓練數據收發器一般可被看作具有初始化能力的信號處理元件,且由于訓練性傳輸行為的存在,遞歸神經網絡框架可直接對該原件中的信息傳輸行為進行控制,直至原始訓練數據樣本的編碼執行速率逐漸趨于穩定。設s0代表神經網絡中原始訓練數據樣本的最小遞歸傳輸系數,sn代表神經網絡中原始訓練數據樣本的最大遞歸傳輸系數,n代表樣本信息的遞歸處理次數,聯立上述物理量,可將訓練數據收發器的連接行為定義為:

其中,代表原始訓練數據樣本的傳輸均值,w1、w2分別代表兩個不同的樣本數據參量。
信息防泄漏加密模塊是原始訓練數據防泄漏密碼生成系統中的核心執行設備,由文件緩存、樣本信息讀寫、緩存數據處理等多個應用元件共同組成。其中,文件緩存設備位于信息防泄漏加密模塊的頂層執行單元中,可在緩沖讀寫指令的作用下,實現對原始訓練數據樣本的防泄漏編碼處理,并可借助輸出信道,將這些信息參量存儲于系統數據庫單元之中[8-9]。緩存數據處理設備位于信息防泄漏加密模塊的底層執行單元中,可隨待讀寫樣本信息總量的增加,更改設備結構體中的信息存儲權限值,從而使模塊的實際執行需求得到滿足。

圖2 信息防泄漏加密模塊結構圖
在遞歸神經網絡的支持下,按照源碼文件建立、譯碼文件建立、編碼原則制定的處理流程,實現系統的軟件執行環境搭建,兩相結合,完成基于遞歸神經網絡的原始訓練數據防泄漏密碼生成系統設計。
源碼文件是原始訓練數據樣本防泄漏編碼處理的核心依據條件,一般情況下,編碼原則的制定,必須完全依賴該信息參量的實際存在形式[10-11]。在遞歸神經網絡中,原始訓練數據樣本的實際存儲值越大,最終解碼生成的信息參量樣本數量級水平也就越高,且在既定編碼時間內,相關譯碼參量的指標數值基本始終保持穩定[12]。設Δp代表原始訓練數據樣本防泄漏編碼條件在單位時間內的實值變化量,一般情況下,若編碼指令的傳輸消耗時長不發生改變,則該項物理量的數值水平也會始終保持穩定。λ代表與原始訓練數據樣本相關的密碼編譯條件,在上述物理量的支持下,聯立式(1),可將遞歸神經網絡中的源碼文件定義為:

式中,e0代表防泄漏數據密碼的最小傳輸條件,en代表防泄漏數據密碼的最大傳輸條件,u1、u2分別代表兩個不同的原始訓練數據轉碼條件。
譯碼文件是與原始訓練數據樣本相關的密碼轉錄樣本,通常情況下,該類型參量的存在形式受到源碼文件的直接影響,且二者之間的作用關系始終可表示為,前者作為跟隨變量、后者作為主動變量[13-14]。規定x0代表遞歸神經網絡中最小的數據信息防泄編碼條件,xn代表遞歸神經網絡中最大的數據信息防泄編碼條件,一般情況下,x0、xn之間的物理空間實值越大,譯碼文件所覆蓋的數據傳輸范圍也就越大。聯立式(1),可將原始訓練數據的譯碼文件定義為:

式中,r1代表原始訓練數據的初級防泄漏編碼條件,r2代表原始訓練數據的引申級防泄漏編碼條件,代表數據樣本信息的訓練編碼均值量。
編碼原則建立是基于遞歸神經網絡原始訓練數據防泄漏密碼生成系統設計的末尾處理環節,可在已知數據信息存儲樣本條件的情況下,確定譯碼指令生成所需的實際消耗時長,從而抑制非主觀訓練數據信息的錯誤傳輸行為[15-16]。將第一個原始訓練數據樣本的防泄漏編碼參量命名為f1,將第n個原始訓練數據樣本的防泄漏編碼參量命名為fn,若不考慮遞歸神經網絡中其他信息參量指標對原始訓練數據傳輸行為的影響,則可認為fn>f1的數值限制關系恒成立。設β代表既定的數據密碼轉錄系數,聯立式(3),可將系統所執行的編碼原則定義為:

式中,k0代表原始訓練數據輸入量為0 時的信息防泄漏編碼條件,kn代表原始訓練數據輸入量為n時的信息防泄漏編碼條件,X代表密碼樣本中的信息轉錄實值。至此,完成各項軟硬件執行環境的搭建,在遞歸神經網絡的支持下[17-18],實現原始訓練數據防泄漏密碼生成系統的順利應用。
為驗證基于遞歸神經網絡原始訓練數據防泄漏密碼生成系統的實際應用價值,設計如下對比實驗。搭建如圖3 所示的原始訓練數據防泄漏編碼處理網絡,分別將實驗組、對照組編碼主機接入終端服務器設備之中,其中實驗組主機搭載基于遞歸神經網絡原始訓練數據防泄漏密碼生成系統,對照組主機搭載傳統進程監控型編碼系統,在確保其他實驗環境保持不變的情況下,分析相關實驗指標的數值變化情況。

圖3 數據防泄漏密碼生成原理
以20 min 作為一個單位時長,分別記錄在3 個單位時長內,實驗組、對照組系統可同時處理原始訓練數據總量的具體數值變化趨勢,實驗詳情如表1所示。

表1 單位時間內的原始訓練數據處理量
分析表1 可知,實驗組原始訓練數據處理量在每一個單位時長內均呈現不斷上升的變化趨勢,但在相鄰兩個單位時長內,卻呈現小幅下降的變化狀態。對照組原始訓練數據處理量在實驗前期一直不斷上升,從第2 個單位時長開始,這種數值變化狀態的上升能力明顯減弱,綜上可知,所設計系統單位時間內的原始訓練數據處理量水平明顯增大,符合加強原始訓練數據傳輸安全性的實際應用需求。
表2 記錄了當數據信息總量不斷增大時,系統譯碼等待時間的具體變化情況。
分析表2 可知,隨著數據信息總量的增大,實驗組系統譯碼等待時間保持先上升、再穩定、最后下降的變化狀態,而對照組系統譯碼等待時間則始終保持不斷上升的變化狀態。從極值角度來看,實驗組最大值0.50 s 與對照組最大值0.88 s 相比,下降了0.38 s。綜上可知,所設計系統的數據信息的譯碼等待時間得到了有效控制,可實現對信息應用文件的及時性編碼與處理。

表2 系統譯碼等待時間對比表
從實用性角度來看,基于遞歸神經網絡原始訓練數據防泄漏密碼生成系統可在縮短數據信息譯碼等待時間的同時,擴充單位時間內的信息數據處理量[19],不僅能夠實現對信息應用文件的及時性編碼,也可大幅加強原始訓練數據的傳輸安全性。