畢建新
(東南大學科研院,江蘇南京,210096)
學術界和商業界對云計算的討論如火如荼,它具有低成本、虛擬化、存儲能力強、彈性服務、資源池化、按需服務、服務可計費、泛在接入的特點,而電子文件管理的各項要求與云計算的特點幾乎完全吻合,目前電子文件管理中所存在的問題絕大部分也能夠由云計算來解決,可以說云計算是目前解決電子文件管理困境的最佳選擇。本文嘗試將可靠性理論引入到電子文件管理中來,從工程學角度分析云計算環境下電子文件管理可靠性的影響因素及保障策略。
可靠性是指產品在規定條件下和規定時間內完成規定功能的能力,它是產品的內在質量特性,體現的是產品非功能屬性要求[1]。可靠性成為現代質量觀的核心,以可靠性為核心的質量觀關注全系統、全過程、全特性的質量管理,重視質量特性的形成過程,運用可靠性技術來強化質量設計,確保產品好用管用、經久耐用[2]。從這個角度看,可靠性理論與文件生命周期理論及前端控制思想的內涵是一致的,而且還具有更強的操作性。云計算環境下電子文件管理的可靠性同樣可以從規定條件、規定時間和規定功能三方面來分析。規定條件包括電子文件管理的環境條件和工作條件。環境條件主要是指云計算環境,主要包括IaaS(基礎設施即服務,以下簡稱IaaS)、PaaS(平臺即服務,以下簡稱PaaS)和SaaS(軟件即服務,以下簡稱SaaS)等三個核心服務層以及以服務質量保證和安全保證為核心的服務管理環境。工作條件主要是電子文件管理體制機制、規章制度和業務標準規范等。規定時間包含兩個層面,一方面是指電子文件管理從系統設計、文件生成、捕獲到最終歸宿的全生命周期,另一方面是指云計算環境本身的生存周期。規定功能是指電子文件在其生命周期內所具備和完成的功能和技術指標。
電子文件及其管理系統的技術性能指標僅從一個方面反映了電子文件的管理質量,卻不能反映其全貌。因此,有必要將可靠性作為電子文件管理的重要質量指標加以考核和檢驗。
2.2.1 現有標準規范的要求
我國于2003年和2010年分別頒布了國家標準《電子文件歸檔與管理規范GB/T 18894—2002》(以下簡稱《規范》)和《電子文件管理暫行辦法》(以下簡稱《辦法》)。其中雖未直接出現“可靠性”字樣,但都對電子文件的可靠性作出了詳細的要求。如,《規范》對電子文件的真實性、完整性和有效性從制度、工作程序和技術措施三個層面加以保證,要求“建立規范的制度和工作程序并結合相應的技術措施,從電子文件形成開始不間斷地對有關處理操作進行管理登記,保證電子文件的產生、處理過程符合規范”。在電子文件的收集和積累階段,要求“采取嚴格的安全措施,保證電子文件不被非正常改動”,對不同類型的電子文件規定了通用格式,并定期制作電子文件的備份。在電子文件歸檔階段,“應對歸檔電子文件的基本技術條件進行檢測,檢測內容包括:硬件環境的有效性,軟件環境的有效性及其信息記錄格式、有無病毒感染等。”在電子文件保管階段,在保管環境、設備環境更新、載體轉存也均提出了具體要求。《辦法》中也多次提到與《規范》相似的可靠性問題。隨著信息技術的發展,學術界對于電子文件可靠性的認識越來越深刻,涉及電子文件可靠性保障的相關標準規范也已撰寫完畢待批。這些標準規范對電子文件管理所涉及的硬件設備和系統、管理系統功能架構、存儲與交換格式、元數據基本集、管理流程等做出了詳細的規定,對于未來大幅提高電子文件管理的可靠性具有十分重要的意義。
2.2.2 云計算環境下的特殊要求
云計算將大規模的共享虛擬計算資源以服務的方式提供給用戶,其表現形式就是一系列服務的集合。服務的超大規模性、高復雜性、失效類型多樣性、虛擬化管理和資源動態變化等特性,使得傳統的可靠性保證技術難以適應云服務的新特點和新需求[3]。這就要求將可靠性融入到云計算環境搭建和電子文件管理系統設計階段。這使得電子文件管理系統的設計框架從傳統的“軟件=程序+數據+文檔”模式轉變成為“軟件=服務(集)+工作流+數據”,系統開發方法已經由傳統的面向產品轉變成面向服務,其運行環境由封閉、靜態、可控逐步轉變為開放、動態、多變。云計算環境下軟硬件系統呈現出松耦合的特點,允許網絡中滿足功能的軟硬件組件加入,而這些新加入組件的可靠性將直接影響到電子文件管理的整體可靠性。傳統的提供冗余備份以及通過測試、動態替換軟硬件組件等方式提高系統可靠性的方法已無法適應云計算環境的要求,如果不對軟硬件組件的可靠性進行把關,未來在電子文件管理過程中所產生的軟硬件維護費用之高將成為不堪忍受的負擔[4]。
綜上所述,目前電子文件管理可靠性還處于“事后把關”模式,即從制度設計、工作程序和技術措施等幾個層面分別進行風險評估以確認電子文件可能出現的風險并設計處置預案。在電子文件管理經過近二十年的發展后,特別是在云計算環境下,對電子文件可靠性問題如果仍然堅持“事后把關”的處理模式,其可靠性保障將難以得到進一步提升。這就要求把可靠性作為設計特性,將其融入到電子文件管理生命周期及所處環境的前期設計中,使可靠性的技術跟蹤與分析評價貫穿于電子文件管理的全生命周期。
云計算環境下電子文件管理可靠性是一種綜合可靠性,由制度可靠性、環境可靠性、系統可靠性和業務可靠性等四方面構成,如圖1。要提升電子文件管理的綜合可靠性,就必須從上述四方面分析電子文件管理可靠性的影響因素,并理解其影響機制及危害性。本文采用可靠性研究中常用的故障模式、影響及危害性分析(Failure Mode, Effect and Criticality Analysis,FMECA)方法,對云計算環境下可能影響電子文件管理可靠性的關鍵因素進行統計,并對其產生的影響及危害進行分析。這是一種從局部到整體的分析方法,通過這種分析方法可以發現云計算環境下電子文件管理過程中的薄弱環節、主要故障模式及原因,能有針對性的提出改進措施,進而提升電子文件管理的可靠性。
本文所述的制度層包含了電子文件管理體制機制、規章制度和業務標準規范等。電子文件管理體制機制是指電子文件管理職責在機構中的分布,其對電子文件管理的影響表現為各類管理職能、責任和權利的不能有效的銜接;電子文件管理規章制度是指電子文件管理者需要共同遵守的規章和準則,規章制度不完善主要表現為不健全、不配套、不合理、不執行[5];電子文件管理標準規范是用于指導電子文件管理取得最佳效果經一致協商制定的共同使用和重復使用的規范性文件,標準規范的不足會嚴重影響電子文件管理質量。目前電子文件管理體制機制、規章制度尚處于初建階段,一些管理體制機制還處于磨合期,部分規章制度還不能對電子文件管理起到實質性的約束作用,電子文件管理標準規范也多是針對文書類電子文件和聲像類電子文件,較少涉及完整的流程規范和業務規范。還談不上針對云計算環境進行專門的制度設計。由此可見,制度層影響因素是導致電子文件管理可靠性問題的深層次原因。

圖1 電子文件管理綜合可靠性構成
環境層主要是指電子文件管理所處的云計算環境,即IaaS 層、PaaS層和服務管理層,環境層可靠性的缺乏會對電子文件管理和服務造成不可估量的損失。云計算環境可靠性與網絡環境密切相關。云環境中軟硬件具有松耦合性特點,網絡中的軟硬件組件可以自由加入,云計算服務提供商基于降低成本的考慮,會部分采用廉價或者可靠性不高的硬件設備,從而導致硬件節點故障的發生。如果是關鍵節點,如數據中心、計算節點發生故障,電子文件管理將面臨崩潰的危險。云計算PaaS 層的可靠性是環境可靠性的關鍵環節,PaaS 層是否可靠很大程度上決定了電子文件的可靠性。云計算環境下電子文件的數量以TB 和PB級持續增長,所涉及的電子文件應用的拓撲結構也日益復雜,其狀態和性能也處于不斷的變化之中。如果缺乏對海量電子文件科學的數據存儲與處理技術、資源管理與調度策略,電子文件的可靠性與可用性將大打折扣。云計算服務管理層對核心服務層的可用性、可靠性和安全性提供保障,包括服務質量保證和安全管理等。云計算平臺規模龐大且結構復雜,很難完全滿足用戶的服務質量保證需求,此時,是否有針對性的制定服務水平協議和安全與隱私保護技術,就成為云計算能否廣泛應用于電子文件管理的關鍵。
系統層主要包含業務系統、電子文件管理系統和電子文件長期保存系統等云計算應用,這些應用面向電子文件管理終端用戶,構成了云計算環境的SaaS 層。系統層對電子文件管理可靠性的影響實質上是軟件系統可靠性的問題。云計算環境下SaaS 層的各類應用呈現出規模龐大、復雜程度高、數據異構性的特點,科學的軟件工程方法與管理就成為保證電子文件管理應用可靠性的基本手段。在遵循云計算環境下統一的電子文件元數據標準、編碼標準和接口標準的前提下,充分考慮各類電子文件管理應用開發過程中的避錯設計、錯誤校驗、錯誤兼容。待系統開發完畢,軟件測試會盡可能的找出系統中存在的缺陷和錯誤,并進行改正。而測試方法的不同、測試覆蓋面的差異、測試階段投入工作量的大小都直接影響著測試結果。實踐證明,測試方法得當、覆蓋面廣泛、測試投入充分的系統,其可靠性必然高,反之其可靠性必然相對較低。是否采取有針對性的提高軟件可靠性的設計、測試方法與技術,會對系統可靠性產生重要的影響。值得一提的是,軟件生命周期中從需求分析,到系統設計、編碼開發、再到測試、到最后的投入使用及維護,都離不開開發人員。從事系統設計、管理、開發、測試相關人員的能力、經驗、素質也是影響系統可靠性的重要方面[6]。
業務層是指電子文件從機構業務系統中產生開始直至進入長期保存系統的流轉過程。電子文件在不同的業務流程中呈現出不同的流轉特征。業務流程的可靠性同樣也影響著電子文件管理的可靠性。傳統電子文件管理流程僅僅是對紙質文件管理流程的簡單電子化,雖然可靠性較高,但對于提升文件管理效率作用有限。計算環境下電子文件管理要達到管理效率和管理可靠性的大幅提升,就需要構建一種適應云計算環境的具有自適應性的柔性業務流程。這種流程能夠面向云計算規模龐大、結構復雜、服務動態的特性,自動的調整文件管理流程和電子文件的流轉。因此,在業務層必須要綜合考慮電子文件管理的業務類型、業務場景、業務流程、業務對象以及對業務對象的操作。電子文件業務流程在具有自適應的柔性特征的同時,還應當具有相當的健壯性,即不易被不合理因素干擾而導致業務流程的中斷,使電子文件無法按要求完成流轉。這涉及到業務流程的合理性以及不同業務流程之間的依賴性和銜接性。
綜上所述,可繪制出一張電子文件管理可靠性影響因素表格,如表1。表中包含了影響因素類型、影響因素、危害性及原因,表格比較直觀的體現了云計算環境下電子文件管理可靠性影響因素。
可靠性作為現代質量觀的核心,關注的是全系統、全過程、全特性的質量管理,重視質量特性的形成過程,強調將可靠性作為設計特性,將其融入到前期設計中。因此,電子文件管理也要將可靠性融入到電子文件管理的前期設計中,并將可靠性的技術跟蹤與分析評價貫穿于電子文件管理的全生命周期。
制度可靠性主要是從管理體制機制、規章制度、標準體系層面對云計算環境下電子文件管理作出約束和規范??茖W的管理體制機制、規章制度和標準體系,可以營造出電子文件可靠管理的制度環境,給予電子文件管理科學的指導。在管理體制機制上,應當逐步建立健全國家—省—市三級電子文件管理協調機構,對電子文件管理工作進行組織協調和監督檢查;在此基礎上進一步完善電子文件形成單位與檔案部門管理職責,建立文秘、業務、檔案、信息化建設和安全保密等部門協同配合的日常管理機制,指導歸檔電子文件管理工作。在規章制度上,完善電子文件全程管理的規章制度、電子文件管理與現有文件檔案管理有機銜接的管理辦法等;制定電子文件管理系統和設備的管理制度,對電子文件管理系統和設備的認證測評、風險評估、設備采購、規范使用提出要求。在業務標準規范上,完善電子文件管理標準規范體系,對電子文件管理全生命周期提出管理與技術規范。
云服務可靠性由可靠云基礎設施服務、可靠云平臺服務及可靠云應用服務構成。云基礎設施服務為電子文件管理提供可靠的網絡、數據中心、計算等虛擬化資源服務,是電子文件管理可靠性的基礎;可靠云平臺服務屬于云基礎軟件服務層,為電子文件管理提供平臺支撐,是支撐電子文件管理的重要手段;可靠云應用服務,即電子文件管理應用,與用戶的可靠性需求緊密結合,是云服務可靠性的直接體現。

表1 電子文件管理可靠性影響因素表
可靠云基礎設施服務的目標是建立具有高可靠性和高容錯能力的網絡、大規模存儲設施和高性能計算節點。其中,網絡可靠性主要取決于網絡設計的可靠性和設備可靠性,這兩者構成了網絡的固有可靠性。在網絡設計上,一方面要考慮主干網絡技術的發展,采取適度超前的技術和設備,使設計的網絡能夠適應當前和未來電子文件管理的發展趨勢,確保網絡具有較長的生命周期,最大限度地滿足電子文件管理的需要,另一方面又要保持一定繼承性,降低風險,使網絡的設計具備良好的兼容和擴充能力,能夠實現高可靠網絡的平滑升級。在組網設備選擇上,應當選擇質量優秀、有良好聲譽的網絡設備,并且所用的網絡設備都應滿足可靠性設計指標要求,嚴格遵守網絡的相關規范,所有設備及子系統均需滿足最新、最高的標準規范。網絡組織與維護的有效性構成了網絡的工作可靠性。
冗余設計技術是提高存儲可靠性和計算節點可靠性的一種有效的方法。冗余設計技術,是指產品所包含的為完成規定功能所必不可少的組成部分的額外附加成分[7]。云計算環境下關鍵的計算節點,通常采用多服務器作為并行計算節點,當某個計算節點出現故障時,其他節點能夠實時自動接替其計算任務,使整個系統仍能正常工作,從而提高計算節點的整體可靠性。同樣,數據存儲也采用冗余技術的分布式存儲技術以提高其存儲可靠性。
可靠云平臺服務面臨著電子文件數據規模的日益龐大,亟需解決PaaS 層的海量數據存儲與處理技術,以及基于這些技術的資源管理與調度策略。云計算環境下電子文件的存儲雖然采用了分布式存儲技術,但存儲節點失敗和錯誤導致存儲數據丟失的現象仍然存在,為了進一步提高數據存儲的可靠性和可恢復性,基于網絡編碼技術的分布式數據存儲方法應運而生。網絡編碼技術的使用可以大幅提升網絡的健壯性和數據的可恢復性,再配合有效的副本機制、任務調度算法和任務容錯機制,不但可以降低數據丟失的風險,而且能優化作業完成時間[8]。
對于業務系統、電子文件管理系統和電子文件長期保存系統等電子文件應用而言,在系統開發前就需進行軟件可靠性評估,分析傳統網絡環境下系統可靠性影響因素,收集詳細的可靠性數據,并分析在云計算環境下可靠性影響因素的變化,使系統在設計階段的可靠性水平就處于受控狀態。在系統設計開發時,需充分運用避錯設計、查錯設計、改錯設計和容錯設計的方法,將以預防為主的思想貫穿于設計的全過程,同時開發故障監控與診斷專家模塊,以便對系統運行狀態進行監控,并實時收集系統運行過程中的失效數據進行可靠性評估,也為系統的改進提供參考[9]。在系統開發完成后,要完善和優化系統測試方案,對系統進行完整、詳盡、可靠的測試,爭取在系統上線之前發現其內部缺陷、故障等,以便快速排除故障,降低系統的失效率,達到提高系統可靠性的目的。
云計算環境下電子文件管理業務流程與傳統網絡環境下電子文件管理業務流程存在著較大的區別。傳統網絡環境下,電子文件的流轉呈現出實時、一體化、線性的流轉特征,電子文件在整個管理流程中雖然管理效率較以往紙質文件管理有大幅提升,但總體而言,整個管理流程還是對傳統文件管理的電子化模擬,還不能滿足海量電子文件協同管理的要求。在云計算環境下,電子文件管理從一開始就確立了“分布”、“集成”管理的理念,電子文件從產生到流轉直至永久保存或銷毀,始終存在于“云端”,雖然用戶不知道電子文件流轉到何處、最終存儲在何地,但電子文件數據流始終受到PaaS 層數據管理與調度模型的控制,整個管理流程呈現出高度實時性、高度集成性、網狀協同的特征。云計算環境下電子文件管理流程需要針對云計算的特點加以再造,其流程再造必須以業務流為主線,結合電子文件管理機制體制的創新,擺脫原有組織結構的束縛,對現有的電子文件形成辦理流程、利用流程、歸檔流程及檔案管理流程重新設計和優化。需要從業務流程角度分析電子文件管理工作,包括對電子文件的來源和管理業務流程進行分析;根據云計算環境下業務流程的需要來變革電子文件管理的組織結構模式并整合管理機構,使電子文件管理的管理部門扁平化、業務部門集成化;并在此基礎上構建基于協同理論的電子文件管理系統,實現電子文件管理與業務流程的有效集成。這樣才能夠實現業務流程的可靠性。
云計算環境下電子文件可靠性保障是一項復雜環境下的系統工程,必須綜合運用多種手段對電子文件管理進行全系統、全過程、全特性的質量管理,只有確保電子文件管理的高度可靠性,云計算才有可能在電子文件管理中得到廣泛運用。
[1]劉維信.機械可靠性設計[M],北京:清華大學出版社,1996.
[2]可靠性是“中國創造”的倍增器——訪北京航空航天大學可靠性工程研究所所長王自力2013-6-6 http://www.cqn.com.cn/news/zgzlb/diyi/722679.html.
[3][9]梁員寧.云服務可靠性評估模型及關鍵技術研究[D],解放軍信息工程大學,2012.
[4]何國偉.軟件可靠性的現狀及展望[J].電子科技導報,1994(1):6~9.
[5]馮惠玲等.電子文件風險管理[M].中國人民大學出版社,2008.
[6]張靜.軟件可靠性模型研究[D],西安電子科技大學,2012.
[7]孫懷義.冗余設計技術的有效性研究[J].自動化與儀器儀表,2007,(6):3-5.
[8]羅軍舟,金嘉暉,宋愛波,東方.云計算:體系架構與關鍵技術[J].通信學報,2011(7):3-21.