管延軍+柳晶+時津



摘 要 電子文檔的數據通信傳輸和存儲過程中容易導致泄密,提出對應的電子文檔加密算法,實現電子文檔的保密通信和存儲。提出了基于SF-MAX-Log-MAP并行譯碼算法,實現對電子文檔的信息加密和泄密風險評估。構建電子文檔的數據特征分析模型,采用檢錯碼數據結構分析方法進行相似度特征提取,SF-MAX-Log-MAP并行譯碼,實現對電子文檔的泄密風險評估和預測算法改進。仿真結果表明,采用該模型能有效實現對電子文檔的加密傳輸和存儲,預測準確度較高,檢測概率高,展示了較好的性能。
關鍵詞 電子文檔 加密 信息安全 泄密風險
中圖分類號:TP309.2 文獻標識碼:A ? DOI:10.16400/j.cnki.kjdkx.2015.11.030
Study and Simulation on Risk Estimation Model of Electronic Documents
GUAN YanJun[1][2], LIU Jing[1][2], SHI Jin[1][2]
([1]Beijing HaiTaiFangyuan High Technology Co Ltd, Beijing 100193;
[2]Laboratory of Electronic Records Authenticity Identification and Preservation, Beijing 100193)
Abstract Electronic document data communication can easily lead to leak during the process of transmission and storage, put forward the corresponding electronic document encryption algorithm, realization of electronic documents secret communication and storage. Is proposed based on SF - MAX - Log - MAP decoding algorithm, the parallel implementation of the electronic document information encryption and leak risk assessment. Build a data analysis model of electronic document, using data check wrong words.if structure analysis method for feature extraction, similarity of SF - MAX - Log - MAP parallel decoding, realize the electronic document leak risk assessment and prediction algorithm is improved. The simulation results show that this model can effectively implement encryption transmission and storage of electronic documents, prediction accuracy is higher, high detection probability, shows the better performance.
Key words electronic documents; encryption; information security; risk of leakage
0 引言
隨著信息化對抗與反對抗技術的發展,電子文檔的安全性受到人們關注。電子穩定的數據通信傳輸和存儲過程中容易導致泄密,研究電子文檔泄密風險估計模型,提出對應的電子文檔加密算法,實現電子文檔的保密通信和存儲及相關的算法研究受到人們的重視。
傳統方法中,對電子文檔的泄密風險估計和電子文檔的加密傳輸方法主要有Turbo碼編碼算法,傳統的Turbo碼通常采用串行譯碼算法,一方面,若信息幀較大,會帶來較大時延,不利于未來移動通信中信息的有效性傳輸,另一方面,該算法也存在計算復雜度與Turbo碼性能不可兼顧的缺點,文獻[3]提出了Turbo碼的并行譯碼方式,即將接收碼字分成M個子塊,各子塊進行并行譯碼。如若交織器設計不當,會造成兩個或多個子譯碼器同時訪問同一個內存,此時便需要設計比較復雜的硬件以解決內存爭用問題。針對上述問題,本文提出了基于SF-MAX-Log-MAP并行譯碼算法,提高電子文檔Turbo碼的糾錯性能,降低誤碼率。首先構建電子文檔的數據特征分析模型,進行并行譯碼,實現對電子文檔的泄密風險評估和預測算法改進,仿真實驗證明,改進算法在提高電子文檔的泄密風險預測性能和文檔數據加密性能方面的實用價值。
1 電子文檔信息特征提取和編碼設計
首先進行了電子文檔信息特征提取。本文此采用Turbo碼的進行電子文檔加密,主要來源于兩部分:一是譯碼等待時延,串行譯碼器要等到整個數據塊結束后方可譯碼,二是譯碼計算時延,計算量越大,時延越大。得到電子文檔的泄密概率密度特征為:
= [, ], ?= 2,3,…, ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?(1)endprint
上述為每個電子文檔算法編碼碼元的分布概率,在相空間中得到算術編碼的Turbo碼,通過參數來得到編碼序列的特征函數為:
= () ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? (2)
根據經典信息傳遞的量子理論,測量的結果可能為四種可能結果中的一個,概率為1/4。因此,一般情況下,Jam可以通過經典通道將他的探測結果告Jack,也可以選擇其他的量子通道,從而實現對電子文檔的編碼設計。
2 電子文檔的信息加密和泄密風險估計算法
在上述進行電子文檔信息特征提取和編碼設計的基礎上,提出了基于SF-MAX-Log-MAP并行譯碼算法,實現對電子文檔的信息加密和泄密風險估計。本文采用量子編碼理論,有以下兩個方面的優點:
(1)量子力學的測不準原理,測不準,也就無法實現破解解密了;
(2)量子不可克隆定理,無法克隆就保證了量子不被二次使用,所以保密性能大大提高。
傳統方案中采用基于門限的訪問控制策略,把電子文檔數據加密算法首先置頂與用戶端,本文基于CSBDLP公鑰加密協議的多元線性回歸隱私保護,現取明文空間矩陣和,經CSBDLP加密協議加密后得混疊譜跨層補償規則為: () = ( + )·及 () = ( + )·。
得到電子文檔的信息加密多維向量模型為:
= {,,,…,} ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?(3)
通過反編譯結果中特定變量的反向數據關聯集,在時頻空間中的同在一條直線上的兩點(,)和(,)都滿足直線方程式,把Tri-training迭代訓練過程中和共同標記為(),得到相關函數為:
= {,,…,}{,,…,} ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?(4)
通過上述設計,實現了電子文檔的信息加密和泄密風險估計的優化模型構建。
3 仿真實驗
為了測試本文設計的電子文檔泄密風險估計的性能,進行仿真實驗。構建辦公自動化中的電子文檔文本信息絡分布式組合設備。利用TAG算法建立信息加密和泄密分析估計路徑。采用垂直分層策略對文件格式進行CDC劃分,其中SC定長分塊大小為16 KB,平均大小為8 KB (最小長度為 2 KB,最大長度為 16 KB)。得到電子文檔的信息特征加密編碼輸出結果如圖1所示。從圖可見,采用本算法能有效實現對電子文檔的信息加密,編碼輸出具有規律性特征,避免了泄密風險。
為了對比算法在實現泄密風險估計的性能,計算不同算法下的電子文檔的泄密數據檢測命中率對比結果如圖2所示。從圖2可見,采用本文算法有效實現了對電子文檔的數據風險評估和泄密數據的檢測,提高了電子文檔的安全性能。
4 結論
本文提出了基于SF-MAX-Log-MAP并行譯碼算法,提高電子文檔Turbo碼的糾錯性能,降低誤碼率。首先構建電子文檔的數據特征分析模型,采用檢錯碼數據結構分析方法進行電子文檔的語義相似度特征提取,
進行SF-MAX-Log-MAP并行譯碼,實現對電子文檔的泄密風險評估和預測算法改進,仿真結果表明,采用本文算法能有效提高對電子文檔的泄密風險預測性能,對泄密數據的檢測概率較高,優化了泄密風險評估。
參考文獻
[1] 黃佳慶,陶少國,熊志強等.網絡編碼關鍵理論問題研究[J].計算機應用研究,2008.25(8):2260-2264.
[2] 陳立山.網絡編碼的安全性分析與研究[D].西安:西安電子科技大學,2010.
[3] 尹恒,吳陳.混沌偽隨機序列的產生及在網絡安全中的應用[J].江蘇船舶,2003.20(1):32-34.
[4] 付曉.防竊聽和抗污染的低能耗安全網絡編碼方案研究[D].葫蘆島:遼寧工程技術大學,2012.
[5] 劉瓊,潘進,劉炯.基于信息論安全的防竊聽網絡編碼方案[J].計算機工程,2012.38(22):107-110.
[6] 張雁,呂丹桔,吳保國. 基于Tri-Training半監督分類算法的研究[J].計算機技術與發展, 2013.23(7):77-79.endprint