馬彪 王繼東
基于云平臺的省級教育考試機構數據中心建設初探
——以江蘇省教育考試院為例
馬彪 王繼東
教育考試信息化是提高教育考試管理工作效率、促進教育考試改革發展的重要手段。省級教育考試機構承擔的考試項目眾多、規模不等,各種信息系統并存,數據共享的要求較高。本文圍繞這一問題提出用建立省級教育考試機構數據中心的辦法來打破業務壁壘、重組業務模式,建立高可靠性、高可用性、高內聚、松耦合的應用基礎平臺。本文結合江蘇省教育考試院的實際情況,探究了省級教育考試機構數據中心建設的必要性與可行性,提出了較為完整的建設方案。
教育考試;數據中心;云平臺;建設方案
江蘇省教育考試院由原招辦、考辦、會考辦三辦合一,成立伊始,即非常重視教育考試的信息化工作,目前已經進入第二個信息化規劃的實施階段。省級教育考試機構的招考項目很多,種類復雜,有招生類考試、自學考試、非學歷證書考試,且教育考試項目本身存在著階段性強,業務項目之間耦合性較低的特點。目前江蘇省教育考試院信息系統從招考項目上劃分包括:普通高考信息系統、自學考試信息系統、證書類考試信息系統,各大系統中又包含若干子系統。從考試環節上分有:報名系統、考務管理系統、評卷系統、成績處理系統、錄取系統,相互交叉后,大大小小的系統幾十個,缺乏統一的數據標準、統一的開發標準,系統間難以實現數據共享,為更高水平的教育考試事業發展造成了一定的阻礙。
在第二個信息化規劃中,江蘇省教育考試院明確將建立教育考試省級數據中心,逐步集成各類信息系統,以提高教育考試信息化的水平和效率。
云平臺是指在大量的分布式計算機上,而非本地計算機或遠程服務器中,建立與互聯網相似的數據資源池,使得用戶能夠將資源切換到需要的應用上,根據需求訪問計算機和存儲系統。
云平臺的優勢在于提供了看起來沒有上限的可用計算資源,用戶不需要提前考慮設備的需求量,免去了用戶的前期投入,可以從一個規模較小的硬件資源起家,并根據自己的需要增加資源。云平臺資源擁有很好的彈性,當資源需求下降時,傳統方式部署的服務器資源就被閑置了,而通過云部署的資源則靈活很多。
云平臺包含兩方面內容,一是在網絡上提供的為計算服務的應用,例如以前被稱為SaaS(Software as a Service)的一類應用;二是提供這些服務的在數據中心的硬件和系統軟件。
根據江蘇省教育考試院信息建設二期目標,按照打破業務壁壘,重組業務模式,建立高可靠性、高可用性、高內聚、松耦合的應用基礎支撐平臺的基本原則,數據中心建設包含兩大層面任務:一是數據中心云平臺建設,通過建立教育考試私有云,提供統一的數據管理、網絡接入、系統安全,主要面向硬件系統以及中心數據庫建設;二是應用系統建設,面向各項業務,專注系統功能的實現,并遵循統一的開發規范和接口要求。
數據中心整體系統架構如圖1所示,從兩大任務中可衍生擴展出六大建設內容,分別為云平臺網絡基礎建設、云存儲數據中心建設、數據標準建設、容災備份、接入服務和資源調度和應用系統建設。其中,數據標準建設和容災備份又是數據中心系統建設的基礎和安全保障,貫穿于兩大層面的各個部分。

圖1 數據中心系統架構
數據中心建設是一個龐大的系統工程,涉及基礎層、數據層和中間層等許多方面,而其中關鍵性的建設內容則是云平臺網絡基礎建設、云存儲數據中心建設、數據標準建設和容災備份。
基于虛擬技術已在江蘇省多項評卷中采用,且效果突出,在數據中心建設中進一步建立以System Center為中心的私有云管理平臺,通過建立自服務管理模式降低管理人員的壓力。在硬件層之上建立虛擬化的資源池,啟用Hyper-V作為底層虛擬化的管理層,采用規模化的群集架構來降低成本、提高效率和管理能力,虛擬化后統一硬件底層結構,便于遷移和管理。
數據中心的建設核心問題在于如何解決不同系統之間的數據交互與共享,數據的交互存在兩種模式,點對點的信息交互模式以及中心數據庫的交互模式。前者結構簡單,容易在原有系統上升級改造;一個節點錯誤不會影響其他節點。缺點在于:隨著系統的增加,每個系統需要建立的接口越來越多;參與數據交互的雙方必須同時在線;需購置多套數據庫及中間件等軟件,成本較大。后者所有應用系統均基于中心數據庫,各系統分別根據各自權限從中心數據庫中讀取數據。其優點是:數據單一,接口簡單,不會存在不一致性;各個系統相互獨立,不需要為交互數據而實時在線;可集中對中心數據庫做好容災備份。缺點是:中心數據庫須面對較大的吞吐量,其穩定性和性能要求較高。
江蘇省教育考試院現存系統較多,相對割裂,要想以點對點的方式實現數據交互,工作量極大,且難以維護,故提出建設中心數據庫的方案。
由圖4可見,云存儲數據中心平臺包括三大模塊組成:數據資源管理模塊、數據處理模塊、系統管理模塊。這三個部分相互配合,完成對數據的收集、存儲、處理、調用以及管理,及時獲取各類教育考試評價與決策分析數據,并抽取數據為應用系統服務。

圖2 點對點的信息交互模式

圖3 中心數據庫交互模式

圖4 云存儲數據中心層次結構
對于省級考試機構數據中心而言,數據源是一切業務系統的基礎,萬一數據丟失或不能訪問,從而導致工作停頓,將給全省的教育考試工作帶來極大損失。為將因災難引發的數據損耗風險降低到最低,一旦發生災難,可跨越不同磁盤系統,快速切換,實現系統同步,本數據中心考慮使用同步遠程鏡像技術進行容災系統的建設。利用光纖連接數據中心和災備中心,兩中心可保證業務系統24×7小時不間斷運行,實時同步數據,可在較短時間內將核心業務接管到異地的災備中心直至主站點完全修復。
目前江蘇省考試院現有大小系統幾十個,由于沒有統一的數據標準和開發標準,各系統間不能進行數據交換、數據共享,形成一個個“信息孤島”。為將這些“孤島”式的應用系統集成起來,就需要制定出各個業務系統統一遵循的標準規范和格式數據,統一基礎數據并進行管理。
數據標準的體系結構建設主要包含兩大任務:管理信息標準的建設與數據交換標準,而管理信息標準分為數據元標準和代碼標準。數據元(Data element)是通過標識、定義、表示以及允許值等一系列屬性描述的數據單元,在特定的語義環境中被認為是不可再分的最小的數據單元。
數據元概念的構成是對象類與特征的結合。例如:考生這個“對象”可以有性別、年齡、成績等多個“特性”,將它與其中的某一個特性結合組成“數據元概念”,如考生性別、考生成績。數據元由數據元概念和表示兩部分組成,如考生性別,性別={男,女},性別={男,女,未知},分別構成兩個不同的數據元。數據元標準是數據標準的重要組成部分,通過對數據元名稱、數據元定義、數據元類型、數據元長度、數據元值域、數據元表示與數據元表示方法一致,保證同一個數據元只有一個定義,一個編碼,從而實現各應用系統間高效、準確的數據交換和數據共享。
管理信息標準中的代碼標準具體來源包括:已經形成標準文件的各類規范,上級部門下發的各類文件,江蘇省制定的各類招考文件、規章制度以及工作流程規范。
數據元標準和代碼標準只解決了信息描述層面的標準,而沒有對信息本身的存儲格式、權限以及信息的描述方法等進行統一的標準化。為使數據平臺內各信息系統能夠進行數據交換和訪問互通,需要制定統一的數據交換信息標準,包括數據描述標準、權限描述標準、信息采集標準、信息發布標準以及數據交換接口標準等。
接入服務是各類主要應用系統實現的基礎,各類應用系統使用接入服務訪問云存儲中的各類數據。根據江蘇省教育考試院的實際需要本數據中心的接入服務大致包括以下幾個方面:用戶認證,權限管理,公用API接口與Web Service服務。
優秀的用戶認證、權限管理機制可以提升數據中心數據的安全性,保證只有經過授權的人員才可以訪問數據,并且可以為不同的人員設置不同的權限。這樣不僅僅可以防止數據被非法修改,還可以從制度上避免舞弊等惡意行為的發生。
公用API接口是連接應用系統與數據中心的直接通道,豐富的公用API接口使應用系統更加準確方便的獲得所需數據。適當的Web Service服務利于整個數據中心的維護與應用的開發。
1)高招管理系統:面向普高、學測、對口單招、研究生考試等相關業務的管理子系統,處理高招業務的報名管理、計劃管理、考務考籍管理、特殊考生管理、體檢信息管理、成績信息管理、志愿填報管理、錄取信息管理,并通過數據中心的高招業務數據快照,形成高招業務的初步數據分析。
2)自考管理系統:面向自考的社會自考、助學專業、專接本等相關業務的管理子系統,處理自考業務的報名報考管理、計劃管理、考務考籍管理、成績信息管理、實踐課程與論文管理、畢業生管理、教材管理,并通過數據中心的自考業務數據快照,形成自考業務的初步數據分析。
3)成招、專轉本管理系統:面向成招、專轉本的管理子系統,處理報名管理、計劃管理、考務考籍管理、成績信息管理、志愿填報管理、錄取信息管理,并通過數據中心的成招、專轉本數據快照,形成初步數據分析。
4)社考管理系統:面向各類非學歷社會證書考試的管理子系統,處理報名管理、考務考籍管理、成績管理、證書管理,并通過數據中心的社考數據快照,形成社考業務的初步數據分析。
5)中招管理系統:面向高中階段入學的管理子系統,銜接高中階段的報名信息、成績信息、錄取信息,并通過數據中心的中招數據快照,形成中招業務的初步數據分析。
6)標準化考場建設系統:包括視頻及網絡監控系統、應急指揮系統、考生身份驗證系統、作弊防控系統、考試綜合業務系統五大系統平臺。
7)公眾免費服務系統:面向公眾、考生的免費服務子系統,建設涵蓋成績信息、錄取信息、公示信息、證書信息等網絡免費查詢的門戶網站,提供諸如在線訪談、博客、論壇等多種形式的各類招生考試資源、信息發布渠道,提供考生電話免費呼叫中心,提供辦公大樓一站式窗口服務。
8)辦公電子政務系統:面向教育考試系統的辦公電子政務子系統,提供公文處理、通知收發、人力資源、綜合檔案、設備資產、課題成果等辦公電子管理和方便不同業務群體之間的實時交流。
9)電子支付系統:面向報考費用、錄取費用、增值服務費用的電子支付子系統,建立與銀行的電子支付接口,實現所有收費項目的網上電子支付。
10)決策分析與評價系統:依托信息統計的科學決策要求,實現基于數據中心的考試評價體系,滿足社會、學校、地區、個人對考試評價的迫切需求。
基于云平臺的省級考試院數據中心的成功建設必將進一步推動江蘇省教育考試信息化進程,提升工作效率并促進教育考試改革,更好地服務于考生、高校、社會。可以預料在其建設過程中可能存在各種困難和阻力,科學規劃、分步實施,廣泛調動各種資源是項目成功實施的保證。
[1]王寧,等.一種基于數據中心的政府信息資源整合系統架構設計[J].計算機應用研究,2005(9):67-71.
[2]李冬梅.統一數據標準實現業務協同[J].信息技術,2010(6):235-240.
[3]許鑫,蘇新寧.高校共享數據中心平臺的設計與實現[J].現代圖書情報技術,2005(6):48-53.
[4]董歡.數據挖掘技術概述[J].信息產業,100.
[5]胡茂勝.基于數據中心模式的分布式異構空間數據無縫集成技術研究[D].武漢:中國地質大學(武漢),2009.
[6]張曉華,林紅,吳娟.數據中心在高校綜合信息系統中的作用探究——以華北電力大學(北京)校園網絡規劃為例[J].軟件導刊,2010,9(8):69-70.
[7]張錦珠.數據中心平臺的一種設計與實現技術探討[J].信息安全與技術,2011(12):46-49.
[8]蔣菱,葉明亮.基于BP神經網絡算法的數據挖掘方法研究[J].電腦編程技巧與維護,2011(18):44-45.
[9]陶安,王軍武.利用虛擬磁帶庫技術實現異地數據容災備份[J].軟件導刊,2011(12):50-51.
[10]劉麗娜,于治樓,張化祥,等.一種云環境下基于Xen的分布式存儲模式[J].信息技術與信息化,2011(6):18-20.
[11]王濤.基于數據倉庫ETL技術的數據提取與數據轉換研究[D].吉林大學.2011.
[12]戴浩.基于業務元數據的多維建模系統設計與實現[J].計算機工程與設計,2010,31(24):5248-5256.
[13]林莉,傅曉娟,陳麗麗.XML數據交換技術在高校信息化中的應用[J].信息技術與課程整合,2012,8(3):713-715.
[14]陳彩虹.國內外元數據標準宏觀比較研究[J].河北科技圖苑,2011,24(1):65-67.
Cloud-platform Based Cata Center for Provincial Education Examination Institution:Taking Jiangsu Provincial Education Examination Authority as an Example
MA Biao and WANG Jidong
Informationization is an important means of improving the education examination management efficiency,thus promoting the reform and development of educational testing.The provincial education examination institutions undertake numerous examinations on different scales,and the coexistence of various information systems poses a higher demand for data sharing.In this paper,it proposes to establish provincial education examination authority data center to break the barriers of business and restructure the business model,aiming to establish an application platform of great reliability,high availability,high cohesion and low coupling.By referring to the reality of Jiangsu Provincial Education Examination Authority,this article explores the necessity and feasibility of data center construction,proposing a more integrated construction program.
Education Examination;Data Center;Cloud Platform;Building Programs
G405
B
1005-8427(2012)08-0034-5
江蘇省教育考試院
南京信息工程大學