田桂申 白雪嬌 章達(dá)英


摘要:為解決信息審計(jì)系統(tǒng)在用戶登錄操作識(shí)別上存在的自動(dòng)化程度差、智能化等級(jí)低等現(xiàn)實(shí)問(wèn)題,通過(guò)引入一種基于人機(jī)認(rèn)證的數(shù)據(jù)挖掘算法,采用人臉識(shí)別技術(shù)與賬號(hào)密碼配合提供用于身份認(rèn)證的身份令牌,將用戶信息預(yù)存儲(chǔ)在身份庫(kù)中,保證賬號(hào)僅對(duì)持有者本人提供登錄操作權(quán)限,并支持對(duì)16925個(gè)IP地址進(jìn)行動(dòng)態(tài)追蹤、自動(dòng)獲取關(guān)鍵崗位信息,輔助數(shù)字化審計(jì)平臺(tái)監(jiān)控及預(yù)警功能的實(shí)現(xiàn),具有顯著經(jīng)濟(jì)及社會(huì)效益。
關(guān)鍵詞:信息審計(jì);人機(jī)認(rèn)證;數(shù)據(jù)挖掘;算法設(shè)計(jì)
一、引言
在當(dāng)前數(shù)字經(jīng)濟(jì)時(shí)代,工信部、網(wǎng)信辦與公安部于2021年7月聯(lián)合印發(fā)《網(wǎng)絡(luò)產(chǎn)品安全漏洞管理規(guī)定》,標(biāo)志著企業(yè)數(shù)據(jù)安全、網(wǎng)絡(luò)安全問(wèn)題已正式上升至國(guó)家安全戰(zhàn)略高度,開(kāi)展信息系統(tǒng)審計(jì)成為維護(hù)數(shù)據(jù)安全、推動(dòng)審計(jì)全覆蓋、實(shí)現(xiàn)“科技強(qiáng)審”目標(biāo)的客觀需要。但現(xiàn)有信息系統(tǒng)仍存在出借賬號(hào)辦理業(yè)務(wù)、缺乏全流程追溯機(jī)制、未落實(shí)“不相容崗位分離”、多個(gè)IP可同時(shí)登錄一個(gè)賬號(hào)等問(wèn)題,導(dǎo)致在資金支付、業(yè)務(wù)審批環(huán)節(jié)面臨系統(tǒng)性風(fēng)險(xiǎn),亟需規(guī)劃一種身份管理作業(yè)系統(tǒng)方案,用于解決現(xiàn)有技術(shù)手段有限的難題,實(shí)現(xiàn)審計(jì)監(jiān)督全覆蓋。
二、研究背景
(一)國(guó)外研究綜述
美國(guó)早在計(jì)算機(jī)進(jìn)入使用階段即提出信息系統(tǒng)審計(jì)的概念,1969年成立電子數(shù)據(jù)處理審計(jì)師協(xié)會(huì),1994年該協(xié)會(huì)正式更名為ISACA,并制定頒布一系列準(zhǔn)則、指南等文件,用于指導(dǎo)信息系統(tǒng)審計(jì)工作的規(guī)范化開(kāi)展。現(xiàn)階段由ISACA協(xié)會(huì)頒布的《國(guó)際信息系統(tǒng)審計(jì)指南CISA》已在全球范圍內(nèi)推廣,信息系統(tǒng)審計(jì)步入智慧化階段[1]。
(二)國(guó)內(nèi)研究綜述
國(guó)內(nèi)在20世紀(jì)90年代開(kāi)始信息系統(tǒng)審計(jì)方面的研究與探索,中國(guó)內(nèi)部審計(jì)協(xié)會(huì)于2020年12月發(fā)布《第3205號(hào)內(nèi)部審計(jì)實(shí)務(wù)指南——信息系統(tǒng)審計(jì)》文件,為信息系統(tǒng)審計(jì)實(shí)踐提供指導(dǎo)。2021年3月,內(nèi)蒙古自治區(qū)科技廳向公司下發(fā)關(guān)于科技計(jì)劃項(xiàng)目的任務(wù)書(shū),加快推動(dòng)公司信息系統(tǒng)審計(jì)工作的發(fā)展,現(xiàn)已完成信息系統(tǒng)審計(jì)方案的編制,梳理編寫(xiě)126個(gè)信息系統(tǒng)審計(jì)模型清單,并計(jì)劃采用數(shù)據(jù)挖掘、區(qū)塊鏈等人工智能技術(shù)進(jìn)行系統(tǒng)漏洞的技術(shù)攻關(guān),為信息系統(tǒng)審計(jì)的智慧化探索打下良好基礎(chǔ)[2]。
三、研究?jī)?nèi)容與方案
(一)研究?jī)?nèi)容
為規(guī)劃身份管理作業(yè)系統(tǒng)方案,擬引入人臉識(shí)別技術(shù)與人機(jī)認(rèn)證數(shù)據(jù)挖掘算法,為身份管理引擎提供一種支持人臉識(shí)別、賬號(hào)密碼的身份令牌,用于對(duì)用戶身份進(jìn)行認(rèn)證,并存儲(chǔ)至身份信息數(shù)據(jù)庫(kù)中,同時(shí)記錄用戶姓名、登陸時(shí)間、登陸地點(diǎn)、登陸方式以及訪問(wèn)客體等信息,便于后續(xù)信息追溯及責(zé)任界定。項(xiàng)目建設(shè)目標(biāo)在于利用生物識(shí)別方式進(jìn)行用戶賬號(hào)的自動(dòng)控制,僅支持賬號(hào)擁有者本人執(zhí)行賬號(hào)登錄操作,同時(shí)解決項(xiàng)目公司16925個(gè)IP的自動(dòng)追蹤問(wèn)題,支持自動(dòng)獲取各關(guān)鍵崗位信息,并利用數(shù)字化審計(jì)平臺(tái)對(duì)同一個(gè)賬號(hào)在相同時(shí)段內(nèi)利用多個(gè)電腦終端登錄行為進(jìn)行監(jiān)控和預(yù)警,維護(hù)系統(tǒng)數(shù)據(jù)與信息安全[3]。
(二)建設(shè)需求分析
在業(yè)務(wù)需求方面,主要需解決信息系統(tǒng)賬號(hào)出借共用問(wèn)題,嚴(yán)格執(zhí)行業(yè)務(wù)辦理的全流程追溯,遵循“不相容崗位分離”原則進(jìn)行系統(tǒng)審批流程管控,滿足信息系統(tǒng)的人機(jī)認(rèn)證功能需求。在集成需求方面,需完成信息系統(tǒng)認(rèn)證開(kāi)發(fā),與i國(guó)網(wǎng)、統(tǒng)一權(quán)限系統(tǒng)采用接口調(diào)用方式實(shí)現(xiàn)部分?jǐn)?shù)據(jù)集成與雙向流動(dòng)。在非功能需求方面,需圍繞兼容性、可靠性、可維護(hù)性和易用性四個(gè)方面對(duì)審計(jì)移動(dòng)作業(yè)終端進(jìn)行功能升級(jí)[4]。
(三)項(xiàng)目實(shí)施方案
基于信息審計(jì)系統(tǒng)建設(shè)需求,在規(guī)劃身份管理系統(tǒng)作業(yè)方案時(shí),其核心技術(shù)要點(diǎn)在于應(yīng)用人臉識(shí)別技術(shù)進(jìn)行人機(jī)認(rèn)證,用戶可選擇通過(guò)人臉識(shí)別或輸入用戶名和密碼登錄系統(tǒng),且該系統(tǒng)需與國(guó)網(wǎng)統(tǒng)一權(quán)限系統(tǒng)對(duì)接,還需將用戶信息提前錄入,并通過(guò)認(rèn)證后存儲(chǔ)在身份庫(kù)中。在整體方案設(shè)計(jì)上,以用戶身份為中心,對(duì)網(wǎng)絡(luò)中的人、設(shè)備和應(yīng)用均賦予邏輯身份,基于身份進(jìn)行細(xì)粒度權(quán)限設(shè)置及判定,并且在用戶身份認(rèn)證環(huán)節(jié)增加人臉識(shí)別的生物特征。在人機(jī)認(rèn)證功能實(shí)現(xiàn)上,基于OpenCV視覺(jué)和機(jī)器學(xué)習(xí)庫(kù)引入級(jí)聯(lián)分類(lèi),運(yùn)用局部二值模式直方圖LBPH算法建立一種對(duì)人臉的面部、眼睛、微笑等進(jìn)行預(yù)訓(xùn)練的分類(lèi)器;通過(guò)Haar級(jí)聯(lián)檢測(cè)找到人臉,并將檢測(cè)到的人臉位置返回為Rect(x,y,w,h);待獲取位置信息后即可為面部創(chuàng)建像素采集模塊ROI,并在此ROI模塊上進(jìn)行眼睛檢測(cè),通過(guò)人臉識(shí)別后即可使用戶成功登錄系統(tǒng)。
四、數(shù)據(jù)挖掘算法設(shè)計(jì)及應(yīng)用
(一)算法設(shè)計(jì)
1.信息系統(tǒng)認(rèn)證功能
該功能主要通過(guò)調(diào)用i國(guó)網(wǎng)二維碼掃描組件實(shí)現(xiàn),在系統(tǒng)模塊設(shè)計(jì)上,包含用戶注冊(cè)、人臉識(shí)別、數(shù)字簽名、二維碼四個(gè)功能模塊,具體設(shè)計(jì)如下:
(1)用戶信息注冊(cè)模塊,基于“開(kāi)始→輸入用戶名和密碼→判斷是否存在該用戶→確認(rèn)后輸入基本信息→記錄、存儲(chǔ)→結(jié)束”的流程完成用戶登錄操作。當(dāng)用戶登錄系統(tǒng)后顯示login.jsp頁(yè)面,輸入用戶名、密碼信息或啟用人臉識(shí)別功能提交至login_conf.jsp頁(yè)面,調(diào)用后臺(tái)數(shù)據(jù)庫(kù)檢索用戶預(yù)先錄入的身份信息,跳轉(zhuǎn)至handle_success.jsp或login_failure.jap頁(yè)面執(zhí)行后續(xù)操作,并將信息提交后跳轉(zhuǎn)至handle.java頁(yè)面,將用戶的姓名、登錄時(shí)間、登陸地點(diǎn)、登錄方式、訪問(wèn)客體等信息存儲(chǔ)在數(shù)據(jù)庫(kù)中。
(2)人臉識(shí)別模塊,利用分類(lèi)器對(duì)人臉面部、眼睛、微笑等信息提取特征,與保存在數(shù)據(jù)庫(kù)中的用戶頭像特征進(jìn)行比較,確認(rèn)符合用戶本人信息后生成二維碼憑證。其識(shí)別過(guò)程為“圖像采集裝置捕捉人臉圖像,提取特征信息→二維碼解碼→調(diào)用數(shù)據(jù)庫(kù)提取頭像特征→判斷用戶身份是否正確→顯示用戶身份信息并保存”。在具體識(shí)別過(guò)程中,先從CFRDemoDlg類(lèi)中調(diào)用函數(shù)OnBnClickedExport(),建立人臉特征識(shí)別矩陣;隨后調(diào)用SavePicToModel()函數(shù),將用戶提交的人臉信息添加在模板庫(kù)中;接下來(lái)進(jìn)入CEnrollDlg類(lèi),依次調(diào)用MatchImage()、PicRecognize()、Pic2NormFace()函數(shù),識(shí)別圖像信息并將結(jié)果存儲(chǔ),返回保存值,并將保存值與閾值進(jìn)行比較,確認(rèn)超出閾值后即判定識(shí)別成功,發(fā)放準(zhǔn)許登入許可。
(3)數(shù)字簽名模塊,基于簽名算法和密鑰進(jìn)行用戶信息檢驗(yàn),既能夠保證對(duì)用戶身份信息進(jìn)行驗(yàn)證,同時(shí)可防范出現(xiàn)偽造二維碼或用戶登入信息等情況的發(fā)生。
(4)二維碼模塊,該模塊主要通過(guò)掃描、識(shí)別用戶數(shù)字簽名,根據(jù)對(duì)應(yīng)編碼生成二維碼憑證,經(jīng)解碼后獲取原始數(shù)字簽名信息,用于對(duì)數(shù)字簽名進(jìn)行驗(yàn)證。二維碼編碼流程為:“傳入二維碼版本、簽名密鑰→調(diào)用數(shù)據(jù)庫(kù),提取有效信息和簽名→對(duì)簽名信息進(jìn)行編碼→完成數(shù)據(jù)處理并存儲(chǔ)在COR_Encode中,返回True→根據(jù)信息處理結(jié)果生成以pFilenameStr為路徑的二維碼圖片”。在具體編碼過(guò)程中,先輸入簽名密鑰,調(diào)用CTrainDlg類(lèi)函數(shù)OnBnClickedQREncode(),從中調(diào)取用戶預(yù)先保存的信息并簽名認(rèn)證;隨后調(diào)用函數(shù)EncodeData(),完成編碼信息處理;在ProcessEncode()函數(shù)中,根據(jù)數(shù)據(jù)處理結(jié)果生成存儲(chǔ)路徑,并保存在filePathName文件中。二維碼解碼流程為“輸入二維碼→利用OnBnClickedQRDecode()將二維碼圖像分解為數(shù)字信息→完成解碼→保存字符串信息,返回True→讀取ContentDecoder類(lèi)字符串信息,解碼完畢”。在具體解碼過(guò)程中,先進(jìn)入CEnrollDlg類(lèi)中,提交二維碼平整,提取filePathName文件,并導(dǎo)入驗(yàn)證密鑰;隨后調(diào)用函數(shù)OnBnClickedQRDecode(),將該路徑中保存的圖像轉(zhuǎn)化為數(shù)字信息;接下來(lái)調(diào)用函數(shù)DecodeData(),完成數(shù)字信息解碼,獲取字符串并存儲(chǔ)在變量中,返回BOOL類(lèi)型值;最后將存儲(chǔ)信息讀取至CString類(lèi)的ciphertext變量中,返回?cái)?shù)值,獲得解碼后的字符串,用于對(duì)用戶身份進(jìn)行識(shí)別,完成數(shù)字簽名的驗(yàn)證。
2.服務(wù)端基礎(chǔ)算法庫(kù)
服務(wù)器端基礎(chǔ)算法庫(kù)以深度學(xué)習(xí)算法為核心,集成分類(lèi)、聚類(lèi)、標(biāo)準(zhǔn)化、結(jié)構(gòu)化、業(yè)務(wù)模型訓(xùn)練、特征提取、主成分分析、回歸、序列分析等算法類(lèi)型。基于人機(jī)認(rèn)證功能進(jìn)行數(shù)據(jù)挖掘算法的設(shè)計(jì),主要運(yùn)用仿真優(yōu)化方法以相對(duì)最少次數(shù)獲取滿意解,將系統(tǒng)所需最大化指標(biāo)設(shè)為P=P1,P2,…,Pp,最小化指標(biāo)設(shè)為Q=Q1,Q2,…,Qq,仿真優(yōu)化總耗時(shí)為T(mén),則建立目標(biāo)函數(shù)為:
在目標(biāo)函數(shù)的約束條件設(shè)計(jì)上,將不同子系統(tǒng)的仿真輸出結(jié)果視為系統(tǒng)輸入值,通過(guò)對(duì)整體系統(tǒng)進(jìn)行仿真獲取各指標(biāo)的輸出結(jié)果,將第i個(gè)子系統(tǒng)的輸出結(jié)果設(shè)為Si(i∈[1,n]),由此設(shè)置約束條件Pi和Qi;隨后將仿真優(yōu)化總耗時(shí)設(shè)為T(mén),利用ti(i∈[1,n])表示第i個(gè)子系統(tǒng)的單次仿真耗時(shí),整體耗時(shí)為tn+1,由此設(shè)置仿真條件T;將子系統(tǒng)仿真優(yōu)化總次數(shù)設(shè)為ci,整體系統(tǒng)仿真次數(shù)為cn+1,子系統(tǒng)仿真輸出結(jié)果ki表示輸入變量的數(shù)量,設(shè)置約束條件Si;將整體系統(tǒng)輸入變量的可行域設(shè)為xij,則約束條件表示為:
(二)硬件配置
原信息審計(jì)系統(tǒng)在建設(shè)環(huán)節(jié)已滿足硬件設(shè)計(jì)條件,因此人機(jī)認(rèn)證系統(tǒng)擬充分利用原有硬件設(shè)備,不涉及新增硬件設(shè)計(jì),依據(jù)功能邏輯完成各單元的劃分,并將相應(yīng)程序存儲(chǔ)在ROM/RAM或磁盤(pán)中。
(三)軟件方案
根據(jù)系統(tǒng)安全穩(wěn)定運(yùn)行需求,選用企業(yè)級(jí)關(guān)系型數(shù)據(jù)庫(kù)Mysql與工業(yè)級(jí)標(biāo)準(zhǔn)J2EE應(yīng)用服務(wù)器軟件,遵循ANSI/ISOSQL-89、ANSI/ISOSQL-92標(biāo)準(zhǔn),支持分區(qū)技術(shù)、聯(lián)機(jī)存儲(chǔ)及備份功能,滿足C2級(jí)安全要求以上,且符合雙字節(jié)編碼[5]。在軟件應(yīng)用部分功能實(shí)現(xiàn)上,主要涉及以下技術(shù)方案:
1.身份鑒別技術(shù),采用SSO技術(shù)框架與Portal建立系統(tǒng)公用組件,提供統(tǒng)一開(kāi)放接口與CA、PKI認(rèn)證模塊對(duì)接,支持對(duì)用戶身份標(biāo)記及鑒別控制,建立集“CA認(rèn)證+PKI+用戶名、密碼”于一體的身份識(shí)別認(rèn)證機(jī)制,并采用軟件容錯(cuò)技術(shù)保證用戶身份的唯一性與鑒別結(jié)果的可靠性。在系統(tǒng)管理管理策略設(shè)計(jì)上包含以下兩種:一種是登陸失敗策略,當(dāng)用戶登錄失敗次數(shù)達(dá)到限值后,將禁止其再次登陸,或當(dāng)其登錄時(shí)長(zhǎng)超限后將強(qiáng)制退出;另一種是安全策略,由系統(tǒng)結(jié)合預(yù)先設(shè)定的參數(shù)對(duì)用戶認(rèn)證失敗行為進(jìn)行管控,并生成錯(cuò)誤登錄信息日志。
2.訪問(wèn)控制技術(shù),以資源管理平臺(tái)為核心進(jìn)行系統(tǒng)安全策略配置,利用TDM軟件對(duì)控制權(quán)進(jìn)行分配、訪問(wèn)本地隊(duì)列數(shù)據(jù),與平臺(tái)訪問(wèn)不同類(lèi)型文件、數(shù)據(jù)庫(kù)表功能相結(jié)合;在用戶訪問(wèn)權(quán)限控制上,主要包含系統(tǒng)級(jí)、功能級(jí)(菜單級(jí))、頁(yè)面級(jí)(流程級(jí))、字段級(jí)(按鈕級(jí))四類(lèi)權(quán)限,由統(tǒng)一平臺(tái)對(duì)不同用戶對(duì)應(yīng)的操作訪問(wèn)權(quán)限進(jìn)行分配與定義,并借助工作流組件完成最小權(quán)限的設(shè)置,實(shí)現(xiàn)不同權(quán)限間的有效制約。
3.剩余信息保護(hù),選用基于Web開(kāi)發(fā)的Session、Cookies兩種工具建立信息系統(tǒng),采用Session方式對(duì)用戶鑒別信息進(jìn)行存儲(chǔ),并且當(dāng)用戶退出系統(tǒng)后,依照預(yù)設(shè)流程進(jìn)行Cookies的清理,保證發(fā)揮信息保護(hù)作用。
4.抗抵賴,采用基于PKI結(jié)構(gòu)的數(shù)字證書(shū)進(jìn)行待傳輸數(shù)據(jù)信息的加密處理,利用數(shù)字簽名確保用戶輸入身份信息的真實(shí)性;同時(shí)設(shè)置分級(jí)別操作日志,用戶登錄系統(tǒng)或執(zhí)行業(yè)務(wù)操作過(guò)程中可利用operationlog日志進(jìn)行過(guò)程數(shù)據(jù)的存儲(chǔ),便于事后查詢管理,保證業(yè)務(wù)操作的抗抵賴性。
(四)系統(tǒng)測(cè)試
1.測(cè)試環(huán)境建構(gòu)。為針對(duì)人臉識(shí)別認(rèn)證功能的實(shí)現(xiàn)進(jìn)行驗(yàn)證,在實(shí)驗(yàn)室環(huán)境下采集10名用戶的人臉圖像信息,建立小型人臉識(shí)別庫(kù),對(duì)照攝像頭采集的圖像判斷是否有人臉,并基于圖像預(yù)處理與數(shù)據(jù)轉(zhuǎn)化后,將人臉圖像以.xml格式存儲(chǔ)在/dev/vcs/video目錄中;隨后對(duì)10名用戶進(jìn)行人臉檢測(cè),經(jīng)預(yù)處理提取特征信息,基于最近鄰分類(lèi)算法與模板庫(kù)中的圖像特征進(jìn)行識(shí)別,判斷是否與人臉識(shí)別庫(kù)中的信息符合,并生成識(shí)別結(jié)果。
2.測(cè)試結(jié)果分析。基于Linux環(huán)境下在計(jì)算機(jī)終端觀察測(cè)試結(jié)果,顯示對(duì)話框中對(duì)應(yīng)人臉識(shí)別圖像庫(kù)中的數(shù)據(jù)與標(biāo)記的用戶名及其身份信息,證明該系統(tǒng)可有效實(shí)現(xiàn)人機(jī)認(rèn)證功能。在此基礎(chǔ)上進(jìn)行整體評(píng)價(jià):(1)兼容性,對(duì)外開(kāi)放可直接接入平臺(tái)的API接口,提供語(yǔ)音轉(zhuǎn)換、結(jié)構(gòu)化處理等服務(wù)功能。(2)可靠性,單節(jié)點(diǎn)服務(wù)器支持100用戶并發(fā)、1000用戶在線,在執(zhí)行多用戶并發(fā)操作時(shí),將靜態(tài)頁(yè)面類(lèi)響應(yīng)時(shí)間控制在3s內(nèi),事務(wù)處理類(lèi)響應(yīng)時(shí)間控制在8s內(nèi),模塊試運(yùn)行3個(gè)月以上,達(dá)到7×24h可靠運(yùn)行,年可用率超過(guò)99.97%。(3)可維護(hù)性,滿足易理解、易分析、易配制、易修改、易測(cè)試要求。(4)易用性,頁(yè)面布局合理、通用操作規(guī)范,且出錯(cuò)處理、反饋與提示均滿足人性化要求。
五、結(jié)束語(yǔ)
通過(guò)面向信息審計(jì)系統(tǒng)合規(guī)性管理與控制需求,建立一種基于人機(jī)識(shí)別的數(shù)據(jù)挖掘算法,解決同一賬號(hào)在同一時(shí)段、不同終端登錄所引發(fā)的安全問(wèn)題,有效提升網(wǎng)絡(luò)安全管理水平,并進(jìn)一步加快推進(jìn)系統(tǒng)數(shù)字化、智能化建設(shè),為信息審計(jì)系統(tǒng)認(rèn)證功能實(shí)現(xiàn)及應(yīng)用場(chǎng)景的拓寬提供良好示范經(jīng)驗(yàn)。
作者單位:田桂申? ? 白雪嬌? ? 章達(dá)英? ? 國(guó)網(wǎng)內(nèi)蒙古東部電力有限公司
參? 考? 文? 獻(xiàn)
[1]齊智江.計(jì)算機(jī)入侵檢測(cè)數(shù)據(jù)挖掘模型設(shè)計(jì)及系統(tǒng)實(shí)驗(yàn)驗(yàn)證[J].科學(xué)技術(shù)創(chuàng)新,2022,(07):69-72.
[2]徐剛.醫(yī)院信息管理系統(tǒng)中的數(shù)據(jù)挖掘技術(shù)及應(yīng)用[J].數(shù)字技術(shù)與應(yīng)用,2021,(03):3.
[3]李明亮,關(guān)虹.高校智能化審計(jì)管理信息系統(tǒng)的構(gòu)建與實(shí)施[J].教育財(cái)會(huì)研究,2021,(02):6.
[4]毛玲玥.審計(jì)信息系統(tǒng)的異常數(shù)據(jù)挖掘算法和應(yīng)用[J].全國(guó)流通經(jīng)濟(jì),2020,(19):2.
[5]王良,鮑喜,王云,等.基于數(shù)據(jù)挖掘算法的審計(jì)數(shù)據(jù)分析及案例應(yīng)用[J].中國(guó)注冊(cè)會(huì)計(jì)師,2020,(06):5.