田 欣
(甘肅省通信產業服務有限公司郵電規劃咨詢設計分公司,甘肅 蘭州 730000)
在信息化時代背景下,依托互聯網開展的行為活動中會產生大量涉及用戶個人隱私和企業機構機密的信息,包括線上辦理業務時的業務信息,網絡購物時的聯系方式與居住地址信息,企業決策分析時的機密風險,以及在進行身份認證時被采集的面部特征信息等生物信息,這類符號化信息充分反映用戶社會屬性、企業發展方向。與此同時,部分不法分子為獲取利益,選擇在信息傳輸、儲存期間采取病毒入侵等手段來竊取用戶隱私信息,以此來盜用他人身份從事違法犯罪活動,典型問題包括將用戶隱私信息販賣給教育培訓機構和保險機構、盜用他人身份辦理銀行卡、在網站注冊與網絡交易活動中提交他人信息。
相比于傳統數據,大數據的數據類型較為復雜,由結構化數據、半結構化數據、非結構化數據等多種類型組成,各類數據的特征、產生量與分布情況有所不同,對數據庫存儲性能提出嚴格要求,在同時存儲或使用多源異構數據時,有可能出現程序混亂崩潰、多種應用程序并發無序運行、數據存儲錯位等問題,最終造成數據丟失、文件無法讀取等后果,存在風險隱患。
數字鴻溝最早出現在20世紀80年代,由利奧伊德莫里賽特提出,最初指不同社會群體在信息認識、信息擁有方面存在的鴻溝。在大數據背景下,數字鴻溝一詞的含義發生改變,泛指個人與機構單位在數據認知、利用、共享方面的認知差異,數字鴻溝的形成,對大數據技術應用造成深遠影響,限制了數據實際利用率與數據價值挖掘力度的提升。例如,從企業角度來看,部分企業將生產經營活動中產生的數據信息作為核心機密,并未將此類數據與同行業企業和公眾進行共享,高價值數據信息始終在小范圍內流通、傳播,使得數據價值未得到充分發揮,還由此產生額外的數據處理、存儲成本[1]。
大數據技術雖然在決策支持等領域中得到廣泛應用,但技術問世時間較晚,當前在技術層面上仍舊存在一定的缺陷不足,由此形成風險隱患。例如,從數據處理角度來看,由于大數據具備低價值密度、信息噪音的特征,如果直接對所收集龐大數據進行處理分析,受到其中失真、錯誤信息影響,數據處理結果的準確性缺乏保障,數據處理結果與實際情況存在出入,起到誤導決策的負面影響。從數據安全角度來看,配套安全保護技術的發展腳步未跟上大數據技術發展,仍舊采取網絡防火墻、入侵檢測、訪問控制等傳統技術手段,在系統開發、數據處理、數據存儲、數據傳輸等環節都存在的安全隱患,時常遭受Dos/DDos、網絡病毒的攻擊入侵,最終出現機密信息失竊、系統癱瘓等問題。而從配套設施角度來看,當前多數企業機構、用戶配置的數據服務器、數據庫管理系統等核心軟硬件設施存在使用功能單一、性能落后、穩定性差的問題,對大數據系統的運行狀態造成影響,偶爾因設施故障而出現系統癱瘓、所存儲信息丟失、信息外泄等問題,形成風險隱患[2]。
為遏制用戶身份信息被盜用、用戶隱私信息被竊取等違法行為,需要及早建立數據誠信合約管理機制,政府部門、企業、機構單位與用戶都將承擔維護網絡安全、尊重他人隱私權的責任,樹立誠信意識,對存在竊取用戶隱私行為、售賣隱私信息、盜用他人社會身份等不法行為的人員進行追責懲處,既要予以輿論、道義層面的譴責,同時,也需要予以法律、經濟層面的制裁[3]。
為實現這一目的,應采取實施可追溯大數據保護責任鏈條、明確準入門檻、誠信獎懲、誠信信息公開四項措施。第一,可追溯大數據保護責任鏈條是指通過技術手段對數據流通、處理過程進行溯源分析,當出現身份信息被盜用、用戶隱私信息失竊等安全問題時,對相關數據的產生、存儲、加工、傳播過程進行溯源分析,確定安全問題源頭。第二,明確準入門檻是指對大數據使用門檻加以規定,各機構單位、用戶唯有達到對應資質或是滿足各項要求后,方可訪問大數據平臺執行數據收集、處理等操作,或是收集市場信息與用戶信息,需要遵循相關制度規定,在政府主管部門監管下使用數據,如審查境外機構是否具備數據跨境經營的權限,以及審查機構單位是否具備在境外服務器存儲數據的權限。第三,誠信獎勵是指對嚴格遵循相關法律法規和政策文件的企業及個人予以獎勵,或是在社會服務、銀行信貸融資等方面給予便利優惠。
在大數據背景下,舊有的數據處理方式、行為活動模式都發生了明顯改變,數據具備信息噪音、交互傳染、隱蔽滲透的全新特征,如果用戶仍舊按照傳統行為方式開展與互聯網、大數據有關的活動,將因此形成大數據風險隱患,有可能出現隱私信息失竊、形成數字鴻溝等一系列問題。因此,為預防和減少網絡安全問題出現,需要重點增強個人數據思維,扭轉舊有觀念,及早適用大數據環境變化,推動數據理念由“數字化生存”轉變為“數據化生存”。首先,做好大數據技術輿論引導工作,培養公眾個體的數據化思維,如通過廣播、新聞等方式向公眾普及大數據技術相關知識、常見大數據風險問題和正確規避措施,既要靈活運用大數據技術開展各項工作,又要融入到民眾日常生活當中。
大數據技術應用,在數據處理能力、決策科學性、數據收集能力得到全面強化的同時,問題也隨之而來,網絡安全形勢發生變化,舊有的政策法規缺乏適應性,無法對全部的網絡安全、大數據技術風險問題提供有效約束、指導;與此同時,考慮到大數據技術尚處于初期發展階段,隨著預測分析、數據可視化、數據預處理等全新技術手段的應用,技術體系與網絡安全環境也將隨著時間推移而持續變化。近年來,我國為保障大數據信息共享安全,陸續頒布多項政策法規,如圖1所示,包括《關于開展信息安全等級保護安全建設整改工作的指導意見》《國家網絡空間安戰略》等,建立起一套涵蓋大數據技術應用各個方面的政策法規體系,為建立大數據風險防范機制、選取風險規避措施、防止用戶隱私信息被竊取等提供明確的法律依據[4]。

表1 我國關于大數據信息共享安全方面的政策法規
首先,技術優化創新是完善大數據外圍技術,包括NoSQL數據庫、預測分析、數據可視化、數據預處理、數據校驗等,攻克數據處理、數據存儲等方面的技術難題,向用戶提供更為優質的使用體驗。例如,對數據預處理技術的應用,提前對所收集的龐大數據流進行分類、篩除等一系列處理,從中提取高價值信息,按照類型、來源將數據分為若干種類,去除數據流中的虛假信息、不實數據。通過應用NoSQL數據庫技術,在系統中建立文檔型數據庫、圖型數據庫、Keyvalue數據庫等多個數據庫,將數據分類整理后導入對應數據庫中存儲,解決應用程序無序運行、數據存儲錯位的問題[5]。
其次,軟硬件設施更新是完善大數據技術的相關配套設施,如開發一批區域性、行業性的大數據操作平臺,使用新型數據服務器與大容量存儲設備,開發DNS應急災備系統,自主研發大數據信息系統安全框架,圍繞系統結構開發配套的軟件產品,通過改善大數據系統性能來預防系統癱瘓、文件損壞等問題出現。
第三,數據庫安全性控制是指采取用戶標識鑒別、存取控制、自動審計等手段,以此來保障數據存儲安全。其中,用戶標識鑒別指采取生物特征認證、臨時口令認證、賬號認證等方法來識別用戶身份,在識別通過后,用戶方可訪問數據庫,當未知身份用戶入侵數據庫時,系統將自動發送報警信號,并采取相應保護措施。存取控制是對不同用戶的權限等級進行劃分,唯有達到一定等級或是被授予相應權限的用戶,方可在數據庫中執行數據下載、文件編輯等操作,并在界面上向用戶隱藏超出權限范圍的機密數據。自動審計是指由大數據系統對用戶在數據庫中執行的操作進行全程記錄,自動生成審計日志,跟蹤審計所產生相關信息。當出現非法存取數據等操作行為時,通過查閱審計日志即可發現具體問題,確定非法存儲數據用戶身份、時間的具體操作行為[6]。
綜上所述,在大數據背景下,為應對全新挑戰,有效識別、規避和轉移技術風險,解決網絡安全隱患突出、數據資源濫用等實際存在的問題。政府部門、企業機構與用戶都需要對大數據技術風險問題有直觀、深入的了解,通過采用建立數據誠信合約管理機制、增強個人數據思維、加強信息資源安全技術保障等策略,建立完善的大數據技術風險防范機制,推動大數據技術的長足發展。■