劉小都 趙慧奇



摘要 傳統大數據隱匿性特征安全提取技術忽略了大數據密文的公鑰及密鑰封裝,且大數據隱匿性特征類別混亂,導致該技術的提取精度偏低、冗余度較高.為此,本文提出一種基于混合密碼體制的大數據隱匿性特征安全提取方法.通過混合密碼體制中的公鑰封裝以及密鑰封裝機制生成大數據密文;根據密文內容設計對稱加密方法和非對稱加密方法,基于此分類隱匿性特征,利用不同類的隱匿性特征構建大數據隱秘性特征相空間,計算大數據間的關聯維值,實現大數據隱匿特征的安全提取.實驗結果表明,與傳統方法相比,所提出的大數據隱匿特征提取方法冗余度低,大數據隱匿特征平均分類正確率高達95%,且特征安全提取誤差低,驗證了所提方法具有更好的應用性能.關鍵詞 混合密碼體制;大數據;隱匿性特征;安全提取;混合算法;關聯維數
中圖分類號TP393文獻標志碼A
0 引言
為了保證大數據傳輸安全,應對大數據實施加密處理[1-2].因數據量劇增,大數據隱匿性特征類別混亂,導致原有的加密技術無法達到大數據加密要求[3].目前,各種網絡入侵行為加劇,如不法黑客收取、復制、發布信息等.為了規避大數據信息發生上述風險,必須采用大數據隱匿性特征安全提取技術保證大數據交互安全[4].而傳統大數據隱匿性特征安全提取技術,已經無法滿足大數據發展的要求.傳統大數據隱匿性特征安全提取方法具有局限性.王安琪[5]討論了網絡用戶協議語言存在的專業術語堆砌、表達模糊、文本語句不規則、子語言信息隱藏陷阱等問題,并提出了加強網絡用戶協議監管的特征安全提取方法.在大數據隱匿性特征安全提取過程中,該方法主要解決的是用戶協議語義中存在的數據監管及提取問題,計算過程非常復雜,忽略了大數據密文的公鑰及密鑰封裝,導致大數據隱匿性特征安全提取效果不佳.蔡柳萍等[6]基于稀疏表示和特征加權的大數據挖掘方法,采用求解線性方程稀疏解的方法對大數據進行特征分類,在稀疏解的求解過程中利用向量的范數將此過程轉化為最優化目標函數的求解.在完成特征分類后進行特征提取以降低數據維度,最后充分結合數據的分布情況進行有效加權來實現大數據挖掘.在大數據隱匿性特征安全提取過程中,該方法主要通過特征提取降低數據維度來實現大數據挖掘,但未考慮大數據中的冗余特征數據,使得大數據隱匿性特征安全提取效率低.同時,上述兩種方法均忽略了大數據密文的公鑰及密鑰封裝,提取精度較低、冗余度較高.混合密碼體制是對稱加密方法和非對稱加密方法的綜合技術.因此,本文基于混合密碼體制的大數據隱匿性特征安全提取技術,通過混合算法提高大數據的加密速度,實時提取關聯維數,并利用不同種類的大數據隱匿性特征構建大數據隱匿性特征相空間.密鑰對稱與公鑰封裝機制相融合,提升了大數據隱匿性,通過橢圓加密算法對數據摘要實施加密處理,提高了密鑰傳輸的安全性.實驗結果表明,本研究能夠提升大數據隱匿性特征安全提取效率,滿足大數據時代的要求.1 混合密碼體制的大數據隱匿性特征安全提取技術建立混合密碼體制,設計對稱加密方法和非對稱加密方法,選擇大數據隱匿性特征,構建大數據隱匿性特征相空間,引入關聯的隱匿性特征安全提取.
1.1 混合密碼體制研究混合密碼體制的建立融合了密鑰對稱與公鑰封裝機制,提升大數據隱匿性.混合密碼體制建立原理如圖1所示.
由圖1可知,為了生成安全性高的大數據混合密文,混合密碼體制在接收待處理的大數據信息之后[7],實施如下操作:部分大數據密文的生成通過公鑰封裝機制實施大數據初級處理實現,其他大數據密文通過密鑰封裝機制實施深度處理實現.
1.2 混合算法為了提高大數據的加密速度,采用混合密碼體制中混合算法實現,流程如圖2所示.
由圖2可知,高級加密算法的密鑰通過哈希算法將大數據明文生成一個數據摘要.為了增強密鑰傳輸的安全性,采用橢圓加密算法對數據摘要實施加密處理.在搜尋有效數據域的基礎上,采用高級加密AES算法生成大數據密文.經過加密后的密鑰和密文[8-10],通過數據傳輸至指定對象.根據上述加密后的密文內容,設計對稱加密方法和非對稱加密方法,兩種加密方法分類構建,如圖3所示.
2 實驗分析
選取某公司的大量財務數據作為實驗數據集,選用 Matlab 軟件為實驗平臺,硬件配置為 3.20 GHz CPU、4.00 GB 內存,軟件配置為Windows7 SP1 的電腦,運行環境為Visual Studio 2010.在 Matlab平臺搭建實驗環境,數據參數如表1所示.實驗對比方法為文獻[5]加強網絡用戶協議監管的特征安全提取方法和文獻[6]基于稀疏表示和特征加權的大數據挖掘方法.
2.1 冗余度測試采用本文方法和文獻[5]加強網絡用戶協議監管的特征安全提取方法、文獻[6]基于稀疏表示和特征加權的大數據挖掘方法提取實驗數據集中的大數據隱匿特征冗余度,對比結果如圖4所示.
由圖4可知,本文方法提取的大數據隱匿特征冗余度平均值僅為1.5%,相比其他兩種特征安全提取方法,本文方法特征提取的冗余度較低,表明本文方法可有效去除大數據隱匿特征內的冗余特征量,提取出更加有效的大數據隱匿特征.這是因為本文方法采用關聯維數實時提取,利用不同種類的大數據隱匿性特征構建大數據隱秘性特征相空間.
2.2 魯棒性測試為了進一步驗證大數據隱匿特征安全提取性能,測試了3種方法的大數據隱匿特征安全提取的魯棒性.魯棒性越高,表明提取過程越穩定,具體對比結果如圖5所示.
由圖5可知:本文方法大數據隱匿性特征安全提取效果較好,特征提取魯棒性接近100%,而其他兩種方法僅達到85%,表明本文方法大數據隱匿性特征安全提取過程更加穩定.這是因為本文方法采用混合密碼體制中混合算法實現,并采用橢圓加密算法對數據摘要實施加密處理,增強了密鑰傳輸的安全性.
2.3 精度測試為驗證本文方法的有效性,對比分析不同迭代次數情況下,3種方法進行大數據隱匿特征安全提取的誤差對比結果(表2).分類正確率實驗結果如圖6所示.提取誤差越小,分類正確率越高,表明安全提取精度越高.由表2可知,本文方法的平均誤差為2.69%,分別比其他2種方法的平均標準差低11.09個百分點和5.51個百分點,表明本文方法具有更好的應用性能.這是因為本文方法中混合密碼體制的建立融合了密鑰對稱與公鑰封裝機制,提升了大數據隱匿性,降低了特征安全提取誤差.
由圖6可知,其他2種方法平均分類正確率分別為73%、80%,而本文方法平均分類正確率為95%,表明本文方法提取精度高且能迅速地達到高收斂狀態.這是因為本文方法在搜尋有效數據域的基礎上,采用高級加密AES算法生成大數據密文.經過加密后的密鑰和密文,通過數據傳輸至指定對象.
2.4 運行時間測試采用3種方法對實驗數據實施大數據隱匿特征安全提取,測試3種方法運行時間.運行時間越短,表明大數據隱匿特征安全提取效率越快,具體對比結果如圖7所示.
由圖7可知,本文方法的運行時間低于15 ms,其他2種方法的運行時間超過40 ms,表明本文方法提取效率更高.這是因為本文方法在對稱加密方法和非對稱加密方法對大數據隱匿性安全特征信息實施分類的基礎上,大數據隱匿性特征選擇通過對特征集合實施評價實現.3 結論為解決傳統方法大數據隱匿性特征類別混亂、提取精度偏低以及冗余度較高的問題,本文提出基于混合密碼體制的大數據隱匿性特征安全提取方法.實驗結果表明,本文方法大數據隱匿性特征安全提取誤差低,數據提取效果較好、冗余度較低,提取精度高,且運行時間低于15 ms,提取效率高.在進行大數據隱匿性特征安全提取后,運用更先進的技術精細化處理大數據以及算法安全性,是下一步主要的研究方向.
參考文獻 References
[1]楊國強,丁杭超,鄒靜,等.基于高性能密碼實現的大數據安全方案[J].計算機研究與發展,2019,56(10):2207-2215YANG Guoqiang,DING Hangchao,ZOU Jing,et al.A big data security scheme based on high-performance cryptography implementation[J].Journal of Computer Research and Development,2019,56(10):2207-2215
[2] 徐超,陳勇,葛紅美,等.基于大數據的審計技術研究[J].電子學報,2020,48(5):1003-1017XU Chao,CHEN Yong,GE Hongmei,et al.Audit technology research based on big data[J].Acta Electronica Sinica,2020,48(5):1003-1017
[3] 王永坤,羅萱,金耀輝.基于私有云和物理機的混合型大數據平臺設計及實現[J].計算機工程與科學,2018,40(2):191-199 WANG Yongkun,LUO Xuan,JIN Yaohui.A hybrid big data platform based on private cloud VMs and bare metals[J].Computer Engineering & Science,2018,40(2):191-199
[4] 楊麗麗.船用物聯網大數據加密的混合密碼體制[J].艦船科學技術,2020,42(4):196-198YANG Lili.Mixed cryptography system encrypted by big data on marine internet of things[J].Ship Science and Technology,2020,42(4):196-198
[5] 王安琪.大數據戰略下網絡用戶協議語言問題與監管建議[J].遼東學院學報(社會科學版),2019,21(3):69-73WANG Anqi.Network user agreement language under big data strategy:problems and suggestions[J].Journal of Eastern Liaoning University (Social Sciences),2019,21(3):69-73
[6] 蔡柳萍,解輝,張福泉,等.基于稀疏表示和特征加權的大數據挖掘方法的研究[J].計算機科學,2018,45(11):256-260CAI Liuping,XIE Hui,ZHANG Fuquan,et al.Study on big data mining method based on sparse representation and feature weighting[J].Computer Science,2018,45(11):256-260
[7] Zhang C,Liu X J.Feature extraction of ancient Chinese characters based on deep convolution neural network and big data analysis[J].Computational Intelligence and Neuroscience,2021,2021:2491116
[8] 張啟星,付敬奇.基于信道特征提取的物理層安全密鑰生成方法[J].電子測量與儀器學報,2019,33(1):16-22ZHANG Qixing,FU Jingqi.Physical layer security key generation method based on channel feature extraction[J].Journal of Electronic Measurement and Instrumentation,2019,33(1):16-22
[9] 王妍,李俊,曾輝,等.一種基于互信息的實時特征提取算法[J].小型微型計算機系統,2019,40(6):1242-1247WANG Yan,LI Jun,ZENG Hui,et al.Real-time feature extraction algorithm based on mutual information[J].Journal of Chinese Computer Systems,2019,40(6):1242-1247
[10] 段大高,趙振東,梁少虎,等.基于條件變分自編碼的密碼攻擊算法[J].計算機應用研究,2020,37(3):821-823,837DUAN Dagao,ZHAO Zhendong,LIANG Shaohu,et al.Password cracking algorithm using conditional variational auto-encoders[J].Application Research of Computers,2020,37(3):821-823,837
[11] 吳穎,李曉玲,唐晶磊.Hadoop平臺下粒子濾波結合改進ABC算法的IoT大數據特征選擇方法[J].計算機應用研究,2019,36(11):3297-3301WU Ying,LI Xiaoling,TANG Jinglei.Internet of things big data feature selection method based on particle filter and improved ABC algorithm on Hadoop platform[J].Application Research of Computers,2019,36(11):3297-3301
[12] Cole J M.A design-to-device pipeline for data-driven materials discovery[J].Accounts of Chemical Research,2020,53(3):599-610
[13] 劉波濤,彭長根,吳睿雪,等.基于MILP方法的LED密碼安全性分析[J].計算機應用研究,2020,37(2):505-509,517LIU Botao,PENG Changgen,WU Ruixue,et al.Based on MILP method for security analysis of LED[J].Application Research of Computers,2020,37(2):505-509,517
[14] Zhang F,Yang Y H.Feature vector extraction algorithm based on big data in engineering quality[J].E3S Web of Conferences,2021,257:02029
[15] Elaggoune Z,Maamri R,Boussebough I.A fuzzy agent approach for smart data extraction in big data environments[J].Journal of King Saud University:Computer and Information Sciences,2020,32(4):465-478
Secure extraction of hidden big data featuresbased on hybrid cryptosystem
LIU Xiaodu ZHAO Huiqi
1Information Center of China Association for Science and Technology,Beijing 100863
2College of Intelligent Equipment,Shandong University of Science and Technology,Taian 271019
Abstract The chaotic categories of hidden big data features,combined with the ignorance of the public key and key encapsulation of big data ciphertext,result in low extraction accuracy and high redundancy of traditional hidden big data feature extraction methods.Here,a secure extraction approach of hidden features of big data is proposed based on hybrid cryptosystem.First,the big data ciphertext is generated through public key encapsulation and cryptographic key encapsulation mechanisms in hybrid cryptosystem.Second,the hidden big data characteristics are categorized based on symmetric encryption and asymmetric encryption designed according to the content of big data ciphertext,which are then used to construct the phase space of big data hidden features and calculate the correlation dimension between big data,thus realize the secure extraction of hidden big data features.The experimental results show that,compared with traditional methods,the proposed approach has low redundancy,high accuracy of classification rate for big data hidden features up to 95%,and low error of feature extraction,verifying the feasibility and application prospect of the proposed approach.
Key words mixed cipher system;big data;occult characteristics;secure extraction;hybrid algorithm;correlation dimension