徐佳麗, 羅 麗
(江西科技師范大學理工學院,江西 南昌 330038)
數據無損隱藏技術主要是將秘密信息采用不可告知的方式嵌入到公開的數字載體中進行傳輸[1,2],有效實現隱蔽通信和版權保護等。隨著各種通訊設備和網絡技術的飛速發展,文本信息十分適合作為信息隱藏的載體[3],所以流式文檔數據無損隱藏技術受到了越來越多的研究者關注。
國內外相關專家給出一些較為顯著的研究成果,例如熊祥光等人[4]通過改進的插值算法獲取圖像待隱藏秘密數據的圖像載體,將其劃分為多個大小相同的分塊,計算分塊的基準像素方差,同時對其進行排序,獲取不同的分塊索引。采用自適應數據隱藏算法進行秘密數據隱藏。夏穎慧等人[5]針對醫學圖像像素的分布特點,采用最大累積方差法將背景區域進行分離,確定邊緣像素。通過改進的預處理算法,自適應選取最優預處理區間,減少視覺失真,完成信息隱藏。
以上兩種方法雖然現階段取得了較為滿意的研究成果,但是由于未涉及流式文檔數據的研究,導致流式文檔數據采用此方法進行隱藏時,傳輸時延大幅度上升,流式文檔數據正確接收率和生命周期降低。為此,提出一種基于排序學習的流式文檔數據無損隱藏方法。仿真結果表明,所提方法能夠有效提升生命周期和流式文檔數據準確接收率,減少傳輸時延。
在排序學習算法中,假設共有n個帶標簽的訓練查詢集合{qn,Xn,Yn},則流式文檔數據對應的特征集合為
Xn={x1,x2,…,xM}
(1)
查詢檢索出的文檔相關性標簽為
Yn={y1,y2,…,yM}
(2)
采用強化學習解決流式文檔數據的排序問題,主要通過一個連續狀態的馬爾可夫決策過程進行描述[6]。馬爾可夫決策過程是由五個不同的元素組成,如式(3)所示
U={S,A,T,R,π}
(3)
1)S代表狀態集,主要描述系統環境中的一組狀態集合。將狀態集設定為一個二元組,主要由排序位置信息和候選文檔集合組成。
2)A代表動作集,是整個智能體Agent可選擇的全部動作離散集合。其中,全部可選動作集合主要取決于當前的狀態st,將其表示為A(st)。
3)T(S,A)代表狀態轉移函數,是描述環境狀態轉移的函數[7],完成動作選擇后,說明文檔需要放置在這個位置,同時將動作選擇的文檔在候選文檔集中剔除,避免將文檔重復進行排序。其中最新狀態st+1的表達式為

(4)
4)R(S,A)代表激勵函數,屬于即時激勵。在排序問題中,將激勵作為對動作選擇的評價。所以,將激勵函數設定為信息檢索的評價指標。當執行完動作ai之后,環境給予的激勵被定義為信息檢索的評價指標,經過歸一化處理后獲取的累積增益[8,9]。其中激勵函數的表達式為

(5)
5)π(a|s)代表策略函數,主要是描述Agent行為,即從環境狀態到動作文檔的映射。其中策略函數能夠表示為:

(6)
上式中,θ代表策略參數,θ的維度和文檔向量的特征維度相等。
為了更加精準地對流式文檔數據進行查詢,因此對文章進行排序。同時排序結果的多樣性也能夠豐富查詢結果,避免出現數據冗余的情況。
在采用排序學習算法進行流式文檔數據排序時,因為受到復雜度與查詢結果數據集A的限制,所以采用控制數據集A大小的方式,在滿足多樣性的同時降低排序算法的復雜度。數據集A的約束條件如下:
1)刪除數據集A中相似度較高的數據;
2)刪除數據集A中可以進行替代的原始數據集合。
由于排序學習算法是一種多樣性策略,需要降低算法搜索的空間復雜度。由于各個文檔向量十分長且是稀疏的,通過余弦相似度計算動作at的K個最近鄰動作。設定相似度閾值衡量候選動作集中動作at的近鄰動作,即

(7)
利用強化學習中的策略進行策略參數學習,排序學習就是目標最大化每一時間步的累積期望激勵J(θ),具體的計算公式如下
J(θ)=EL~πω[G(L)]
(8)
式中,G(L)代表文檔列表的累積激勵,具體的計算公式如下:

(9)
式中,γ代表折扣因子;rk代表激勵回報。
根據梯度調整策略參數,獲取如下的參數更新式
θt=θ+η?θJ(πθ)
(10)
在每次迭代過程中,通過當前策略函數選取一個序列。在各個取樣序列的時間步中,策略參數主要利用策略梯度調整不同參數[11],其中從時間步t開始的累積獎勵回報能夠設定為

(11)
通過將排序學習行為建模為馬爾可夫決策過程,同時在每一次迭代過程中采用全部排序位置信息作為各個排序位置選取最優的文檔,即:

(12)
隨著計算機硬件技術的不斷創新與發展,傳統的數據加密技術難以抵擋更加惡劣的攻擊情況,一味地通過延長密碼長度的方法來對文件數據進行加密,并不能滿足日益增長的加密需求,反而能夠暴露出文件數據的重要性,導致文件數據更容易受到攻擊。因此,信息隱藏技術應運而生。
流式文檔數據無損隱藏是一種高效安全的隱藏算法,在不影響載體信息感知效果和使用價值的情況下,將需要加密的信息隱藏在文檔數據中。基于信息隱藏的特殊性,也可將信息隱藏過程稱為嵌入隱藏,則需要隱藏的信息為隱蔽信息,文檔數據則為信息隱藏的載體,信息隱藏通用模型如圖1所示。
整個嵌入過程和提取過程能夠表示為以下的形式

(13)
式中,K代表隱藏密鑰;K′代表提取密鑰。由于算法不同,隱藏密鑰和提取密鑰兩者可以相同,也可以不同;假設信息在傳輸的過程中沒有被破壞,則說明提取到的隱藏信息等于嵌入的秘密信息。

圖1 信息隱藏通用模型
流式文檔數據無損隱藏主要具有以下幾方面的優勢:
1)隱蔽性:
當信息嵌入載體之后并不會影響原始載體的使用,數據的質量也不會下降,同時也不會產生明顯的嵌入痕跡。假設沒有軟件,很難發現信息的存在,使用者是無法感知的。
2)魯棒性:
需要采用專用軟件提取或者檢測載體中的標記信息,進而確定歸屬權。
3)安全性:
隱蔽載體和載體信息緊密結合且融為一體,加密數據和初始數據分布相同,對大量數據進行分析也難以提取或者確定隱秘信息的存在。
由于網絡中共包含N個待定位節點,根據3個已知節點計算當前節點所在的位置。假設A、B、C均為已知位置節點,其中定位誤差對應的計算公式為

(14)
通過兩點之間的直線距離組建方程組,解方程組能夠獲取節點N的位置(Nx,Ny),即

(15)
在信息嵌入的過程中,引入誤差方程以完成信息嵌入,并將隱秘信息的值定義為誤差方程系數。操作過程如圖2所示。

圖2 根據定位誤差引入嵌入信息
完成信息嵌入后,根據操作者的需求進行信息提取時,需要采用三邊測量法計算嵌入節點的位置與測量誤差。
為了在信息隱藏技術下能夠完整地提取出加密數據,需要采用數據過濾機制對數據來源進行驗證,對非法數據進行濾除,具體操作流程如圖3所示。

圖3 CSFM認證過程
在CSFM機制中,由于執行的任務不同,節點劃分為三種不同的類型,具體如下:
1)采集節點:
采集節點所采集到的數據用于形成原始數據集,并將需要隱藏的數據進行標記,形成隱藏數據包。在進行嵌入時,統計數據包的數據與順序,以保證加密的質量。
2)中繼節點:
中繼節點需要進行隱藏標記的識別、驗證與數據包的中繼傳輸工作。將收到前一跳節點發送的數據包時,提取數據包的排序地址數,并對數據包的來源進行驗證。
3)匯聚節點:
匯聚節點將接收到的全部數據包進行來源驗證,以保證加密數據全部為可靠數據。
在上述分析的基礎上,采用基于曼徹斯特碼的信息隱藏算法MSHA,通過改變數據某些位置的跳變進行信息嵌入,最終實現流式文檔數據無損隱藏

(16)
為了驗證所提基于排序學習的流式文檔數據無損隱藏方法的有效性,在64位的Win10的系統,i7-9700KF,CPU3.6GHz的計算機下進行實驗測試。
1)流式文檔數據正確接收率/(%):
流式文檔數據正確接收率即正確數據和接收到全部數據之比,具體的計算公式為:

(17)
其中,ARDR的值越高,說明采用的方法具有較高的安全性,利用圖4給出三種不同方法的數據正確接收率對比結果:

圖4 正確接收率
分析圖4中的實驗數據可知,所提方法的流式文檔數據正確接收率最高,說明所提方法能夠更好隱藏流式文檔數據。
2)生命周期/(s):
生命周期越長,說明衡量指標更加有效。由于網絡的主要目標就是進行數據采集,假設采集到的有用數據較少,則說明生命周期長也沒有實際意義,以下實驗對比三種不同方法在不同規模網絡中的生命周期,具體結果如表1所示。

表1 生命周期
分析表1中的實驗數據可知,傳輸過程中對非法數據進行過濾有效延長了網絡生命周期。如果網絡不存在惡意節點,進行流式文檔數據無損隱藏會消費較低的能量,同時延長生命周期。相比另外兩種方法,所提方法的生命周期明顯高于另外兩種方法,且一直處于穩定的狀態。
3)傳輸時延/(s):
傳輸時延越低,說明網絡性能越好,同時安全機制對網絡的影響也就越好,具體的實驗對比結果如表2所示。

表2 傳輸時延
分析表2中的實驗數據可知,所提方法的傳輸時延在三種方法中為最低,主要是因為所提方法排序學習算法對流式文檔數據進行排序,進而達到降低傳輸時延的目的。
為了更進一步驗證所提方法的優越性,以下對比數據嵌入前后的不同統計指標,具體結果如表3所示:

表3 數據嵌入前后統計對比
分析表3中的實驗數據可知,數據嵌入后誤差在可接受范圍內。由此可見,由于數據嵌入標記所引發的數值變化是可接受的。
隨著網絡技術的飛速發展及在不同領域的廣泛應用,各種安全問題被越來越多的研究者所關注。為此,提出一種基于排序學習的流式文檔數據無損隱藏方法。仿真結果表明,所提方法能夠有效提升流式文檔數據正確接收率和生命周期,同時降低傳輸時延,有效預防各類型的攻擊。雖然所提方法現階段取得了一些較好的研究成果,但是仍然存在一定的弊端,后續將重點針對以下幾方面的問題進行研究:
1)進一步提升感知精度,同時達到網絡全面覆蓋,使其能夠適應各類型的網絡。
2)進一步完善當前已有的安全策略,確保流式文檔數據的安全性。