譚 朔,王煥清,楊安娜
(湖南財政經濟學院,湖南 長沙 410205)
高校教育電子政務信息化建設中數據建設研究*
譚 朔,王煥清,楊安娜
(湖南財政經濟學院,湖南 長沙 410205)
高校教育電子政務信息化的目標是多層次、分階段逐步實施的。高校教育電子政務信息化建設的核心是信息的按需分配和信息的利用,而數據是信息的基礎。本文對高校教育電子政務信息化建設中數據建設的若干問題進行探討。
電子政務;信息分配;信息利用;數據建設
數據是信息系統的生命線,是高校教育電子政務信息化建設的核心所在。它既關系到各項業務工作能否正常開展,也關系到廣大師生的利益能否切實得到保障。必須清醒地認識到,提高數據質量是高等教育事業改革發展的客觀要求。
提高數據質量,是提升信息系統應用水平的現實要求。部分高校數據情況調查發現,隨著高校信息系統的逐步建立和完善,數據庫中數據存在的缺項、漏項、邏輯關系錯誤等問題日益突出,直接影響到統計分析和預測的工作質量,制約了信息系統決策輔助功能的有效發揮。提高數據質量,是進行科學決策的必然要求。隨著高校教育電子政務信息化建設工作的不斷深入,高校在教育改革方面面臨著許多新形勢、新任務,而數據是否準確無誤,直接關系到高校領導、決策部門對形勢判斷的正確性及決策的科學性。只有在數據準確的基礎上才能做出正確的判斷和宏觀決策,為政策制定加強管理提供科學依據才有可能更好地為社會服務、為高校服務、為師生服務。高校各級部門的工作人員都要牢固樹立 “數據質量無小事”的觀念,自覺地把數據準確無誤作為追求的工作目標,作為衡量工作質量的重要標準,以高質量的數據為學校領導決策服務、為師生服務。
高校教育電子政務信息化建設的核心并不是通信網絡的高速化、管理手段的電子化,而是極大限度地滿足不同群體對信息的需求。比如學生群體對知識信息等的需求,教師群體對教學資源信息、科研信息等的需求,管理群體對管理信息的需求。學習、科研、管理的成敗都直接與所掌握的信息量多少、是否全面、是否正確、是否及時有關。管理效率的好壞,取決于數據量集結的多少,數據的集中率有多大,數據發布是否及時準確。數據是為管理和決策服務的,其實質是以硬件為載體、以數據為基礎、以資源為核心、覆蓋無盲點、服務無盲區、身份標識化為原則的信息資源配送服務體系,以極大限度地滿足不同群體對信息的需求。因此在高校教育電子政務信息化建設過程中,不要把主要精力用在硬件設施上,萬兆以太網、千臺計算機絕不意味著已經成了高校教育電子政務體系,必須將主要精力放在數據建設和信息資源建設以及信息資源的配送上。在管理中數據是基礎,人們可以在數據中看到問題,在數據中看到成效,通過對數據的歸納和分析,找到問題的根本,為領導的決策提供有力的支持。數據的建立和應用將大大提高師生掌握信息的能力,大大提高師生的工作、學習效率。
學校的規模逐年擴大后,傳統的管理上的判斷手法慢慢失效,例如學校的招生計劃、就業培養計劃、學生的定向實習計劃、教學資源配給計劃等都依據常規的數據統計工作來制定。而這種常規的數據統計工作往往不是科學合理的,某些具有相關性的數據在各學院、處室之間并沒有得到有效流動,因而所形成的數據不全面、不合理、不規范,導致相關領導最后的決策依據不科學。因此,數據建設對我們的教學管理具有非常實際的指導意義,這項工作做的越早就越能提升學校的整體管理水準,從而提升學校在日新月異的發展格局中的競爭力。高校教育電子政務信息化建設的關鍵是完全的業務數據整合,全面的業務系統數據為整合提供基礎。
高校基礎數據是指高校各種活動內容的知識、資料、圖像、數據、文件的總稱。高校基礎數據是高校發展規劃、高校教學管理、高校科研管理、高校學生管理與實施的前提。只有依靠準確的第一手基礎信息數據,高校的規劃和管理才能做出正確的決策。采用何種數據客體編碼方式與數據采集技術在很大程度上決定了信息數據采集的質量。
高校基礎數據種類非常齊全。根據數據的三維分類方法,其分類如圖1所示:

概括起來高校基礎數據有如下特點:
(1)類型繁多,來源復雜
高校在教學、科研、學生工作活動的過程中,各個環節都會產生類型繁多的信息,不僅本系統內部各個環節有不同種類的信息,而且由于教學系統與其他系統如科研系統、學生管理系統等密切相關,各種基礎數據信息的來源、發生處理地點和擴散范圍各不相同,使得高校基礎數據信息的采集、分類、統計、分析的難度加大。
(2)覆蓋面廣,信息量大
高校數據具有多種類、大批量的特點,包含了學校的各個環節,使得信息量大增,傳統的信息處理技術已不能滿足發展的需要。
(3)更新速度快
在高校的教學管理活動中,有些信息動態性特別強,由此產生的大量新信息不斷更新原有的數據庫。因此,信息處理更加強調信息采集的及時性和信息加工處理的快速。
高校的基礎數據千頭萬緒,縱橫交錯,全面地梳理并非易事。我們可以借用企業業務架構的思想,從戰略高度進行考慮,勾勒各個業務區域,理順業務關系。在此之前,首先要做的工作是明確高校業務的內涵,即弄清楚高校究竟有哪些業務。中國的普通高校,其業務范圍基本涵蓋教學、科研、管理、生活四大方面,各個學校的業務大體相同,同時也具備一些個性。每個學校必須根據自己學校的實際情況來構件業務架構。
以某高校為例,在信息化建設一開始梳理了學校的業務,把高校業務歸納為:
(1)學生一條線:入學、在校、離校;
(2)教職工一條線:人事、科研等;
(3)財物管理一條線:國資、后勤等;
(4)辦公自動化。
以與學生有關的基礎數據為例,如圖2所示為學生有關信息的交互過程。當信息和流程都梳理清晰后,就可以很容易地開發各類應用了。

高校基礎數據采集技術涉及數據客體編碼和數據采集兩個環節。目前,主要的高校基礎數據采集技術有以下幾種:
(1)手工輸入
手工輸入法是利用人工輸入物流單證的傳統方法,材質采用傳統的紙面形式,此法最大優點是靈活,最大缺點是速度慢,錯誤率高,可靠性差。
(2)條碼技術
條碼技術涉及編碼與識讀兩個環節。編碼是用“條表示1,空表示0”的方式將既定信息直接轉變成計算機語言;識讀是通過條空反射率的不同,將光信號轉換為電信號,實現信息還原。這種方法可以實現數據的自動化識別,最大優點是快捷,錯誤率低,可靠性高,性價比高。但易受到污損,必須光學可視識讀、適應性差。
(3)磁卡
磁卡是一種磁記錄介質卡片,它由高強度、耐高溫的塑料或紙質涂覆塑料制成。磁卡上的磁條是一層薄薄的定向排列的鐵性氧化粒子組成的材料,用樹脂粘合在一起,并粘在非磁性基片上。磁卡數據可讀寫,但是隨著磁卡應用的不斷擴大,磁卡技術特別是其安全技術已難以滿足越來越多的對安全性要求較高的應用需求。同時,磁卡本身結構簡單,磁條暴露在外,存儲容量小,缺乏內部安全保密措施,容易被非法破譯。
(4)電子標簽/閱讀器
電子標簽又稱射頻標簽、應答器、數據載體;閱讀器又稱為讀出裝置、掃描器、讀頭、通信器、讀寫器(取決于電子標簽是否可以無線改寫數據)。電子標簽與閱讀器之間通過耦合元件實現射頻信號的空間(無接觸)耦合;在耦合通道內,根據時序關系,實現能量的傳遞和數據交換,從而達到識別目的。
高校一直重視數據資源建設,也積累了大量的原始數據和成果數據,這些數據是數字化校園建設的寶貴財富。通過對高校數據現狀調研和分析,發現高校在數據完整性、數據質量、數據共享等方面存在一些問題。主要表現為:
(1)數據內容不齊全。某些重要數據尚未建庫;已建數據庫存在定義不齊全;大部分非結構化數據尚未電子化入庫。
(2)數據質量參差不齊。數據存儲介質老化,大部分數據以紙介質形式存儲;部分數據記錄不準確、不一致、不完整;數據重復記錄。
(3)數據共享程度不夠高。數據資源建設缺乏統一規劃,數據分散;數據的標準不統一,存取困難;學生數據、資產數據、運維數據等結構化數據沒有專業數據庫;數據管理和維護工作量日益增大,難以保證數據的及時更新和維護。
(1)高校數據客體在高校信息系統中的邏輯位置或狀態表達存在二義性,無法根除。
自然語言天然地具有二義性,極易引發歧義。不能作為計算機語言,于是人們借助代碼的形式表示高校客體在計算機中的邏輯位置或屬性狀態。但在高校應用系統的建設過程中,由于種種原因,不同高校、不同職能部門的各類應用信息系統處于分散開發的狀態,各高校或各職能部門在進行信息系統開發時,編制代碼的時候沒有嚴格參照公共標準執行,隨意性強。不同的信息系統對同一數據客體的代碼也不同,差之亳厘,謬之千里。數據客體的邏輯位置或屬性狀態一旦不能被精準、唯一地表達出來,自然無法準確界定數據客體所承載的高校基礎信息,更妄談高校信息的共享與交換。二義性不僅在單個高校的信息系統中存在,而且也在多個高校的應用信息系統中存在,是個共性的問題,嚴重制約了高校信息化建設。
(2)基礎數據信息采集手段落后,尚未實現自動化,運用現代化技術手段的意識差。
高校基礎數據信息采集的技術實現手段差異很大。手工輸入、條碼、磁卡、電子標簽技術等都有不同程度的應用。其中,條碼在高校報到系統等環節使用居多,應用水平和效果也較高。但總體上,高校絕大多數的設備資產管理的入庫仍然采用手工輸入方式,沒有使用現有的條碼技術、電子標簽技術的意識,嚴重依賴紙面,沒有實現電子化和自動化。
(3)高校基礎數據標準不統一,準確性差。
垃圾數據泛濫是應用信息系統開發過程中,由于隨意性所導致的不良結果之一。由于沒有對處于基礎位置的數據環境建設給予足夠的重視,忽視數據的組織管理技術,致使物流信息數據標準化嚴重滯后于物流建設本身,造成系統數據結構混亂,造成垃圾數據在數據處理過程中泛濫的問題。高校信息化建設過程中,應遵循“三分技術,七分管理,十二分數據”的原則。數據不準確,數據質量不高往往是信息化不能達到預期目標的基礎性原因。
(4)在基礎數據建設中常用的各種數據格式和物品編碼不統一。
在高校教育電子政務化建設過程中,出現了各地、各行業甚至各高校自成體系的現象,難以在信息系統中共享。這些問題直接影響到了高校教育電子政務化的基礎。由于數據客體編碼、基礎數據格式、基礎數據采集技術不統一而導致基礎數據采集困難。數據準確性差且不能共享和交換這一現象在高校中普遍存在。即便采用同一種自動識別技術,比如條碼,也會因為碼制不統一,或者系統底層的信息編碼標準不統一、數據傳輸方式不統一而導致數據采集與共享難以進行。所有這些,嚴重阻礙著不同層次的數據信息交換和數據共享。
究其原因是高校對數據建設的重要性認識不夠,導致整個教育電子政務建設體系推倒重來的現象時有發生,因此我們在建設高校教育電子政務的過程中必須把數據建設作為重中之重來抓。
根據數字化校園建設的范圍確定哪些數據需要準備,然后確定參與部門和人員配備,進而確定工作計劃,切記不可將所有工作只交給一個部門甚至一個人做,必須對此項工作艱難程度有充分的認識。工作計劃應注意安排定期的會議,以方便工作人員之間的溝通。
應用程序的數據管理是通過編碼實現的,編碼可以對數據進行唯一的標識,并且貫穿以后的查詢和應用,建立編碼原則是為了使后面的工作有一個可以遵循的原則,也為龐雜的數據確定了數據庫可以識別的唯一標識方法。所謂磨刀不誤砍柴工,切不可急于求成,忽略了這些重要的工作。
另外,編碼原則的制定屬于校級標準的建立,應該按照 《教育管理信息化標準》(第一部分:學校管理信息標準)和教育信息化技術標準委員會CELTSC出臺的標準制定和管理,尤其對于量大的基礎數據,必須由多個部門共同確定方案。
建立的公用信息包括校級、學生、教學、科研、部門、員工信息、貨幣代碼等基本信息。這些數據會在其他基礎數據中被引用,并且數據量不大,可以利用較少的時間和人力完成。如果整理其他數據的時候發現缺少公用信息再補的話,整體效率和進度會大打折扣。
在這些離散數據中,僅學生基本信息一項,字段就包括教務部門、圖書館、宿舍管理、保衛、校醫院、卡管理結算中心、學工部、財務等的信息。在這一步中,應利用統一格式的表格在各個部門間交叉流轉,讓各部門將與自己相關的數據填入表格,完成后傳遞給下個部門,以此類推,直到完成此步工作。在工作中應注意傳遞的安排,傳遞路徑需提前確定。為了保證工期,可以讓不同部門同時開始,然后交叉傳遞,或者一個部門完成一小部分后就傳遞給下個部門。同時,將每張發出的表格統一編號(唯一),并在部門間交接時作好記錄,這樣不僅可以控制進度,還能避免數據丟失。
(1)完整性檢查:完整性即記錄數量是否完整。可以請學校中有經驗的人員復查或計算一下總數,將其和歷史數據比較。同時還要檢查字段的完整性,所有的應用軟件都有必須輸入的字段,如果缺少這些字段就會造成系統的不穩定。另外還有一些非軟件要求的必須輸入的字段,對學校今后的業務和統計分析有用的字段也要列入檢查范圍,例如學生分類和所屬地區等。
(2)正確性檢查:正確性的范圍很廣,這里不做一一說明,可以由學校自己根據需要制定檢查原則。有些錯誤如會計科目是資產類型的,但是因為人為錯誤輸入成負債類型的,再比如有分類為800元以上的設備,但是錄入成低值易耗品,這樣的錯誤在系統上線前必須發現并改正。
(3)唯一性檢查:數據的唯一性應該從兩個角度檢查,常見錯誤有多個實物編成同一個編碼,如果以后錄入系統,成熟的應用軟件會有提示編碼已經存在的提示功能,并拒絕接受。同時一個實物對應多個編碼的現象也必須杜絕,這種錯誤應用軟件是發現不了的,必須利用人工查找,否則在上線后會發生多個賬務錯誤。
錄入前應該將基礎數據原始檔案歸檔,對于以電子文檔保存的數據,應該將數據備份好,并注明整理人員、完成時間和最后版本。如果是打印的紙介質,應該將其保存在專門的文件柜中,作為重要文檔管理。
完成錄入工作后仍然不能徹底放松,必須再次檢查,此時最好的方法是利用軟件程序測試數據,例如將數據庫備份一個新的數據庫,將學校常用的流程在新數據庫中做一遍,通過檢查結果的正確性來驗證基礎數據的正確性。
高校數字化校園建設項目——基礎數據的建設是一個系統工程,它的建設涉及高校的方方面面,協調溝通較為復雜,執行較為被動,技術職能部門往往是處在被動服務而不是主動服務的尷尬地位上,亟需一個強力部門加以領導。因此,基礎數據建設工程是“一把手”工程。在學校項目的建設過程中,需要加強標準化管理,實施“一票否決”,以免造成新的信息孤島的出現。在數據中心的建設上,宜采用“聯邦制”的松耦合形式,通過中間件,運用數據字典進行轉換,實現數據共享,杜絕數據聯系上的緊耦合形式。
另外制度的保障也要及時跟上,高校可以在做數據整理工作前,建立獎懲制度,提高錄入人員的積極性,督促錄入人員在錄入的同時進行認真的檢查以保證數據錄入的正確性。
總之,基礎數據建設這項工作的重點不是在數據本身,嚴密的計劃和合理的組織才是完成這項艱巨工作的最好手段。
[1]蔣東興,郭大勇,羅念龍,劉啟新.清華大學新一代數字校園建設規劃與實踐[J].廈門大學學報(自然科學版),Vol.46,2,2007.
[2]張曉華.大學異構數據集成與應用平臺的研究與開發[C].華北電力大學,2006.
[3]賈琦,郭紹忠,丁志芳.基于本體的元數據管理系統的研究[J].計算機工程與設計,2009,30(1).
[4]袁小一,俞毅.資源集合元數據標準探析[J].信息系統,Vol.30,5,2007.
[5]王琦蜂,胡玲玲.基于AO的審計數據采集方法[J].計算機系統應用,2009(3).
[6]陳偉,王昊,陳丹萍.一種基于交互式數據遷移技術的數據采集方法[J].計算機工程,Vol.32,9,2006.
(編輯:隗爽)
TP309.2
B
1673-8454(2010)23-0023-04
湖南省科技廳自然科技基金項目(2008JT3027)。