孟偉冬 周旋
摘要: 闡述了信息數據安全的重要性;分析了造成信息數據丟失的原因;結合具體案例,就信息數據丟失問題提出了應對策略:結合系統生命周期、項目管理、軟件架構、風險投資等管理技術來實現信息數據的安全。
關鍵詞: 數據安全; 數據丟失; 風險投資; 應對策略
中圖分類號:TP309.2文獻標志碼:A 文章編號:1006-8228(2012)05-06-03
Discussion on cause of information data loss and corresponding strategy
Meng Weidong1, Zhou Xuan2
(1. The Peoples Procuratorate of Quzhou, Quzhou, Zhejiang 324000, China; 2. Agricultural Bank of China Quzhouquhua Sub-Branch)
Abstract: The importance of information data security is elaborated. The cause of information data loss is analyzed. Combining with practical cases, the paper presents the corresponding strategy for avoiding information data loss. By using knowledge such as system life cycle, project management, software architecture and venture capital, the security of information data can be realized.
Key words: data security; data loss; venture capital; corresponding strategy
0 引言
分析調研機構IDC在2011年發布的研究報告顯示,全球信息總量每過兩年就會增長一倍。2011年,全球被創建和被復制的數據總量為1.8ZB。1.8ZB是一個什么概念?舉例來說,1.8ZB相當于全球每個人每天都去做2.15億次高分辨率的核磁共振檢查所產生的數據總量[1]。同時IDC預測,2012年,全球被創建和被復制的數據總量比2011年增長48%,達到2.7ZB。在人類目前所擁有的全部信息中,有超過90%的信息都是非結構化的,例如:圖像、視頻、音樂、基于社交媒體和Web工作流文件等富媒體信息,這對于人類理解和分析信息是巨大的挑戰。
如今,信息數據已經成為維系單位正常運行的重要資源,關鍵數據更是成為單位生存和發展的命脈。隨著信息數據量驚人增長,信息數據的安全性問題顯得越來越突出。如何保護信息數據的安全?如何避免自然災害、人為災害以及計算機系統故障所造成的信息數據丟失?解決這些信息數據的安全問題已經變得非常重要和迫切。
1 數據安全
信息數據的安全性指的是數據的保密性、完整性、可用性、真實性。保密性指數據只能給合法授權的用戶使用,不能泄露給非授權訪問的用戶。破壞保密性的安全威脅有傳輸威脅、病毒威脅、非授權竊取、丟失數據威脅等。完整性指數據未經授權不能被改變。破壞完整性的安全威脅有操作系統故障、應用系統故障、硬盤故障、誤操作、病毒威脅、非授權篡改等。可用性指當需要時是否能正常使用數據。破壞可用性的安全威脅有操作系統故障、應用系統故障、硬盤故障、誤操作、病毒威脅等。真實性指數據的內容是否真實準確。破壞真實性的安全威脅有誤操作、病毒威脅、非授權篡改等[2]。
信息數據面臨的安全威脅來自于多個方面。通過對信息數據安全威脅的分析可以知道,造成信息數據丟失的原因主要有:軟件系統故障(操作系統故障、應用系統故障)、硬件故障、誤操作、病毒、黑客、計算機犯罪、自然災害等等。
2 案例分析
2.1 軟件系統故障
某檢察院使用的一套業務應用系統軟件,用于傳輸上下級檢察院之間的電子卷宗材料。該院辦案業務量呈倒三角模式,基層檢察院往上級檢察院傳輸的電子卷宗材料相對較少。某基層檢察院在使用該應用系統軟件一段時間后,因更換服務器,重新安裝了該應用系統軟件,加之積累數據較少且紙質卷宗已存檔,于是重建了服務器上的數據庫。當該基層檢察院再次往上級檢察院傳輸電子卷宗材料后,發現之前已經傳輸到上級檢察院的電子卷宗材料被覆蓋,相關數據已無法在上級檢察院數據庫中找回。
事后分析,該應用系統軟件存在漏洞。舉例說明:當基層檢察院將電子卷宗材料傳輸給上級檢察院后,該電子卷宗材料在基層檢察院和上級檢察院的數據庫中均擁有一一對應的ID號(例如:330106000007代表330106“西湖區”+000007“第7號卷宗”)。當基層檢察院更換服務器并重建數據庫時,基層檢察院的數據庫ID號同時歸零并重新開始計數。當ID號計數到330106000007,一旦相應電子卷宗材料上傳,則上級檢察院數據庫中ID號為330106000007的電子卷宗材料會被基層檢察院數據庫中同一ID號的電子卷宗材料所覆蓋,造成上級檢察院數據庫中ID號為330106000007的電子卷宗材料數據丟失。
2.2 硬件故障
某單位使用的存儲設備采用RAID技術把多個獨立的硬盤(物理磁盤)按照不同的規范組合在一起形成一個磁盤陣列系統,從而提供了比單個硬盤更高的存儲性能和數據備份能力,確保了信息數據的安全。
但是,RAID技術也并非萬無一失,數據仍然可能因為硬件故障而丟失。舉例說明:某單位采購了甲品牌的存儲設備,配置了兩組共16塊物理磁盤,第一組用于本地存儲本單位的關鍵數據,第二組用于異地容災備份下級單位的關鍵數據。這些存儲設備采用7+1運行模式,即其中一塊物理磁盤作為熱備盤,一旦其他物理磁盤變成游離盤時,熱備盤立即自動替換該游離盤,其余七塊物理磁盤通過RAID5規范組合成一個邏輯磁盤。同時,該單位采購了乙品牌的備份軟件,該軟件可以按備份計劃定期地將各個服務器上的關鍵數據自動備份到存儲設備上。但該軟件在版本未升級前不能將數據存儲到指定的邏輯磁盤分區上,造成數據只能在存滿第一個邏輯磁盤的第一個分區后,才能向第一個邏輯磁盤的第二個分區存儲數據,直到存滿第一個邏輯磁盤的最后一個分區后,才能向第二個邏輯磁盤的第一個分區存儲數據,依此類推。于是下級單位的異地容災數據和本單位的關鍵數據都混合存儲在第一個邏輯磁盤上,造成第二個邏輯磁盤處于無數據存儲的空轉狀態——雞蛋都放在了同一個籃子里。
當第一個邏輯磁盤中有一塊物理磁盤因種種原因出現硬件故障變成游離盤時,第一個邏輯磁盤中的熱備盤并沒有立即自動替換成功,緊接著第一個邏輯磁盤中又一塊物理磁盤變成游離盤。此時,下級單位的異地容災數據和本單位的關鍵數據大量丟失。
2.3 誤操作
某單位服務器在操作系統和應用系統安裝成功后,對該服務器的系統分區進行了克隆備份。該服務器在運行一段時間后,由于種種原因需要利用分區調整軟件對系統分區和非系統分區的容量大小進行調整。某日,系統管理員發現該服務器響應速度變慢,經檢查發現該服務器操作系統異常報錯。于是,系統管理員對該服務器非系統分區上的關鍵數據進行了異地備份之后,對系統分區進行了克隆備份的還原操作。由于該服務器的系統分區和非系統分區容量大小事前已做了調整,但系統管理員未記錄下調整日志,致使克隆還原后的系統分區和還原前的系統分區容量大小不一致,造成該服務器非系統分區上的數據丟失。事后只能通過異地備份來恢復關鍵的數據。
2.4 其他原因
計算機病毒,是指在計算機程序中插入的破壞計算機功能或者毀壞數據,影響計算機使用,并能自我復制的一組計算機指令或者程序代碼。計算機病毒具有一定的傳染性、隱蔽性、潛伏性和破壞性。計算機感染病毒后,會導致計算機系統崩潰,軟件無法正常運行,程序和數據遭受到不同程度的破壞、刪除、甚至被竊取,從而造成無法彌補的損失。
人為災害(黑客、計算機犯罪、戰爭)與自然災害一樣嚴重威脅著計算機的物理安全,造成數據丟失甚至毀滅殆盡。2005年美國發生了一起嚴重的信用卡資料被盜事件。為維薩、萬事達、美國運通、發現等大信用卡公司服務的一個數據處理中心網絡存在信息安全漏洞,被惡意黑客植入木馬程序。黑客入侵該網絡后,竊取了美國約4000萬信用卡客戶資料,這些資料包括持卡人的姓名、賬戶號碼和有效期等,全球包括亞太地區中國在內的信用卡客戶均遭受到不同程度的影響。黑客竊取這些資料后在網上“黑市”進行交易。犯罪分子利用這些資料偽造大量信用卡后大肆刷卡消費,嚴重損害信用卡客戶的合法利益,嚴重擾亂金融秩序。這可能是美國有史以來最嚴重的一次信息安全案件[3]。
3 應對策略
針對以上信息數據丟失的情況,本文著重從系統生命周期、項目管理、軟件架構、風險投資等幾個方面提出應對策略。
3.1 系統生命周期和項目管理策略
每個事物都有其產生、發展、成熟和消亡的生命過程,軟件系統也是如此。這個周期被稱為SLC (System Life Cycle,系統生命周期)。為了有效地進行系統的開發和管理,根據系統生命周期的概念,可以將軟件系統的開發劃分成五個階段,即總體規劃階段、系統分析階段、系統設計階段、系統實施階段、系統運行和評價階段[4]。每個階段都有其明顯的特征、明確的任務、專門的方法和工具,使得規模龐大、結構復雜的軟件開發工作變得容易控制和管理。軟件系統的開發應該從過去的小作坊模式逐步過渡到現代的信息系統項目管理模式。項目管理團隊應從客戶的實際需求出發,綜合考慮信息系統項目的社會環境、政治環境、自然環境等因素,對信息系統項目進行可行性研究和評估,并通過項目的整體管理、范圍管理、時間管理、成本管理、質量管理、人力資源管理、溝通管理、風險管理、采購管理,利用相關的工具和技術,最終把該項目的產品開發出來,使得軟件系統故障率幾乎為零,使客戶滿意。
3.2 軟件架構策略
對于大規模的復雜軟件系統來說,對總體的系統結構設計和規格說明比起對計算的算法和數據結構的選擇顯得更為重要。在此種背景下,系統、深入地研究軟件架構(software architecture,軟件體系結構)被認為是提高軟件生產率和解決軟件維護問題的新途徑。軟件架構研究的主要內容涉及軟件架構描述、軟件架構風格、軟件架構評價和軟件架構的形式化方法等。軟件架構反映了領域中眾多系統所共有的結構和語義特性,可指導如何將各個模塊和子系統有效地組織成一個完整的系統。不同的軟件架構有各自的優缺點,對數據的安全性要求也不同。例如:傳統的二層C/S(Client/Server)架構對數據的安全性不好。因為客戶端程序可以直接訪問數據庫服務器,那么客戶端計算機上的其它程序也可以想辦法訪問數據庫服務器,從而使數據庫的安全性受到嚴重威脅。而在三層C/S架構中,增加了一個應用服務器,使整個應用邏輯放在應用服務器上,而只有表示層存在于客戶機上。其優點是充分利用功能層有效地隔離開表示層和數據層,未授權的用戶難以繞過功能層而利用數據庫工具或黑客手段去非法訪問數據層。這就為嚴格的安全管理奠定了堅實的基礎,使得整個系統的管理層次也更加合理和可控[5]。
3.3 風險投資策略
生活中風險無處不在,任何時候任何地點都有可能發生意外情況而使人們的生命和財產遭受損失。所以投資界有句至理名言——“不要把雞蛋放在同一個籃子里”。這在數學上被稱為最大熵原理。熵是來自熱力學的一個概念。在哲學和統計物理中熵被解釋為物質系統的混亂和無序程度。信息論則認為它是信息源的狀態的不確定程度。所謂熵增加原理,是指孤立系統向著微觀狀態最混亂的方向變化,直到熵達最大。1948年,香農(SHANNON C E)把玻爾茲曼熵的概念引入信息論并把熵作為一個隨機事件的不確定性或信息量的量度。因此,信息數量的大小,可以用被消除的不確定性的多少來表示,而隨機事件不確定性的大小可以用概率分布函數來描述。基于熵的定義,可知最大熵分布原理:最小偏見的概率分布是這樣一種分布,使其熵在根據已知樣本數據信息的一些約束條件下達到最大值[6]。
信息數據在使用過程中會存在風險——丟失、被竊取、被篡改、被破壞等。根據最大熵原理,信息數據和雞蛋一樣也不能放在同一個籃子里。例如:在只有一個物理磁盤的條件下,信息數據應該復制或者移動到不同的磁盤分區上;在有多個物理磁盤的條件下,信息數據應該復制或者移動到不同的磁盤上。也可以采用RAID(Redundant Array of Inexpensive Disks,廉價磁盤冗余陣列[7])技術把多個容量較小的廉價物理磁盤組成一個大容量的磁盤陣列系統,通過數據跨盤技術,按照不同的RAID規范把數據分別存儲在磁盤陣列系統中的多個物理磁盤上。RAID技術的優勢在于允許系統在多個物理磁盤上同時讀取和寫入數據以提高I/O數據傳輸速率,但也因此不可避免地增大了系統出錯的概率。為了補償可靠性方面的損失,RAID技術提供了容錯功能,通過使用存儲的校驗信息來從錯誤中恢復數據,以確保信息數據安全。
除了本地分散風險以外,還可以通過異地容災的手段來降低災害對信息數據所產生的風險。例如:可以在單位大樓相距較遠的樓層之間或者主樓與副樓之間建立主機房和副機房的存儲備份系統,還可以在不同地域的上下級單位之間建立機房的存儲備份系統。對保密性要求不高的單位可以向SaaS(Software as a service,軟件及服務)提供商租賃數據空間,而不用操心數據備份的具體物理位置。但是在選擇云存儲時,需要嚴格評估SaaS提供商的政治條件、資質、存儲速度、數據保護能力等各項指標[8]。
3.4 其他策略
在信息化網絡時代,可以利用網絡殺毒軟件、硬件防火墻、入侵檢測、訪問控制、數據加密、漏洞掃描、補丁分發、日志審計、桌面安管、數字證書、數字簽名、網絡隔離、VLAN(Virtual Local Area Network,虛擬局域網)等各類技術來降低病毒、黑客、計算機犯罪等人為災害對數據所造成的損失。同時,還應在國家法律法規允許的范圍內,建立一套嚴格的數據安全管理制度,從人員思想、單位規章、保密制度和法律法規等不同層面加強對各類相關人員的管理。
4 結束語
信息技術正以空前的影響力和滲透力,不可阻擋地改變著社會的經濟結構、生產方式和生活方式。在信息化網絡時代,一切互聯互通、信息無處不在,同時也潛伏著各種威脅,例如:敏感數據丟失、泄密等。這些威脅足以破壞信息數據的安全,影響個人的工作和生活、單位的生存和發展、甚至國家的政治、經濟和國防安全。古人云:“道高一尺,魔高一丈。”如何為信息數據的安全保駕護航,已經成為信息社會里一個永恒的命題。
參考文獻:
[1] IDC.從混沌中提取價值[R].數字宇宙研究報告,2011.
[2] 耿朝輝.如何保證數據安全[J].網管員世界,2010.6:80~85
[3] 新華網.黑客竊取美國4000萬信用卡賬戶資料[EB/OL].北京:新華社,2005(2005-06-19)[2012-03-06].http://news.xinhuanet.com/weekend/2005-06/19/content_3104068.htm
[4] 羅曉沛,侯炳輝.系統分析師教程[M].清華大學出版社,2003.
[5] 張友生.系統分析師技術指南(2007版)[M].清華大學出版社,2007.
[6] 俞禮軍,嚴海,嚴寶杰.最大熵原理在交通流統計分布模型中的應用[J].交通運輸工程學報,2001.9:91~94
[7] 張友生,陳志風.信息系統項目管理師考試全程指導[M].清華大學出版社,2009.
[8] 郭曉鋒.關鍵數據異地備份[J].網管員世界,2010.11:109~110