文/毛琦 劉俊 王齊
?
西安交通大學大數據環境下高校如何開展數據分析和應用
文/毛琦 劉俊 王齊

近年來,多領域數據的爆發式增長推動著信息技術和互聯網的快速發展,針對大數據的研究已經成為國家基礎性戰略資產儲備和衡量國家競爭力的重要標志。加強信息化建設,加強數據的管理、掌握與加工,打造“數據中國”已成為“十三五”戰略規劃的重要組成。信息化已從各個層面被提升至國家發展戰略的高度。
高校信息系統一直是數據生產大戶。麥肯錫報告《大數據:創新、競爭和生產力的下一個前沿》中認為,大數據是大小超出常規的數據庫工具獲取、存儲、管理和分析能力的數據集。統計顯示,僅2009年,美國國家教育部某信息系統的數據庫就膨脹至269 P 字節(1 個P 字節等于10億個M 字節),龐大的信息程度入選當年全美10 大數據生產貢獻量排名。在我國,超萬人的高校非常多,對于高校管理層來講,學籍信息、選課、成績單、圖書借閱歷史、上網時間分布、校內論壇交流、微博微信等互聯網登錄和吃飯刷卡消費等都會產生大量信息數據;對于任課教師來說,個人工齡及薪酬管理、上課課件和視頻傳輸、項目管理及經費應用等教學科研也會產生大量信息數據;除此之外,還有高校教務及行政系統的設備管理、辦公自動化建設和學校主頁建設等信息數據。這些高校現存的龐大信息系統經多年運營積累了很多基礎原始數據,如何對這些原始數據開展深入的分析和應用,在統籌分析的基礎上加強學校的科學化管理,為學校發展決策提供數據支撐,成為擺在我國高校面前的一個重要課題和開拓性機遇。
面對信息時代帶來的各種機遇與挑戰,為滿足人才需求,美國政府率先行動實施了一系列促進計劃,以鼓勵研究型大學設立跨學科的研究生專業課程、培養新一代數據科學家和工程師人才。例如,向加利福尼亞大學伯克利分校的計算開發項目投資1000 萬美元,項目旨在集成3 種數據轉化信息方法(機器學習、云計算和眾包); 為“EarthCube”項目( 旨在允許地球學家獲取、分析和共享與地球相關的信息) 提供第一階段的資金支持; 向一個研究培訓小組(支持一項教授大學生如何利用圖形和可視化工具解析復雜數據的培訓計劃) 提供200 萬美元的資助; 為一個由統計學家和生物學家組成的專業研究團體提供140 萬美元的研發資金; 召集各個學科和領域的研究人員,共同探討如何利用大數據轉變教育與學習模式等。美國已將發展大數據提高到國家戰略高度,以求繼續保持在國際上的科技領先地位。
在國內,從2012年開始,包括廈門大學、復旦大學、華東師范大學、上海財經大學等在內的一批大學開始重視數據的深度分析和應用工作。比如華東師范大學利用預警系統跟蹤學生的餐飲消費數據,跟蹤分析學生是否有經濟困難,是否需要幫助;東華大學的智能實驗室項目,記錄實驗室使用的全過程數據,形成動態表格,實現教育經費使用的集約高效。
此外,中國科學院、復旦大學、北京航空航天大學等相繼成立了近十個從事數據科學研究的專門機構。

通過對網絡行為數據的分析來研判教育系統網絡輿情走勢的價值就凸顯了出來。
高校中的數據有很高的教學與科研價值,開展高校數據分析和應用工作可以輔助高校教學管理,甚至能改變教育領域傳統的授課模式、學習模式和管理模式。對現存海量原始數據加以分析,可將其應用在科研計算、招生推廣、學科管理、薪資統籌、學生信息跟蹤等多個方面。在新形勢的驅使下,多數高校已經形成共識,在信息爆炸的時代,開展數據的深度分析和應用工作,對高校的發展而言是非常有必要的一項重點基礎工作。
1.學校科學決策,需要數據深度分析和應用的輔助。
對于大量業務數據進行深度分析和應用的核心驅動力是輔助高校決策支持。這種基于預測的數據分析與應用體系成功的關鍵在于它們是建立在海量數據的基礎之上。此外,隨著高校數據分析及應用體系積累的原始數據越來越多,通過跟蹤記錄分析找到最好的預測模式,可以對高校運轉的各領域提供決策支持,具體而言,對高校預測招生生源情況、就業情況,預測在校學生的各種需求情況、教師的科研項目管理、教職工人事信息管理以及學校的將來發展狀況等方面都能起到數據支持與趨勢研判的前瞻性輔助支持。
2.教學質量評估,需要科學的數據深度分析和應用。
教學評估是每個高校定期要做的工作,把數據分析技術引入到教育領域的評估系統中,不僅提高了教育管理的科學性,而且增強了教育數字化建設的實效性。將基于海量數據挖掘的智能算法應用于教學質量評估中,從教師教學的效果、多媒體課件的使用、學生和教師的互動、教學與教學場所等因素中找出其中的內在聯系,能為教學部門提供決策支持信息,為教師提供準確的反饋信息,使之更好地開展教學工作,提高教學質量。
3.教師教學能力的提升,需要數據支持。
過去的教學因為沒有大量數據的支撐,該教什么全憑教師跟著感覺走。現在,通過深度分析學生在觀看網絡教學視頻過程中的關注頻次和瀏覽量,分析得出學生感興趣、或者難理解的課程關鍵節點,幫助教師有的放矢地改進教學重點、確定教學難點,勢必會引導教師改革教學方式。
4.校園網絡信息管理及分析,需要數據深度分析和應用的支撐。
在現代信息高度發達的年代,網絡輿情研究工作對高校政治思想教育工作和高校教育環境穩定的重要性不言而喻。特別是隨著Web2.0時代的進一步推進,在高校管理當中,校園網BBS、微博、微信等新媒體正大行其道,“圈子”模式的交流方式為校園網絡輿情分析和突發事件網絡疏導增加了困難,正因如此,通過對網絡行為數據的分析來研判教育系統網絡輿情走勢的價值就凸顯了出來。
西安交通大學的信息化建設起步于上個世紀90年代初,是國內較早開展信息化建設的高校之一,目前學校信息化建設進程中的信息數據建設大致完成了兩個階段的工作:簡單的資源“數字化”(主要以大量的文字和數字資源上網為標志)以及業務工作的“流程化”。期間,學校建設了辦公自動化系統、科研系統、教務系統等各類業務工作系統,傳統的部門業務工作開始通過網絡進行辦理。
現階段,業務工作的“流程化”產生了大量的業務數據信息,而相關部門對這些數據信息的需求催生了業務數據的“共享化”需求。從使用研發層面,所謂的業務數據的“共享化”也就是應用系統與數字資源的整合優化。我校在數據“共享化”方面做出了一些有益的嘗試,打通了科研和財務系統的數據接口,實現了科研、財務一站式服務;建立了移動校園門戶,整合了科研、財務、OA、圖書館等業務系統的數據以及部分教務系統的數據。
然而,當前我國絕大多數高校在數據分析與應用層面遇到了類似的發展困境:當前高校還沒有在真正意義上將整合的數據分析和應用提升到學校發展戰略的層面上來考量。比如,在數據管理方面,多數高校還存在數據口徑不一致、各部門獨立發布和使用數據的現象,這就忽略了各口徑間數據的聯動效應,損失了數據關聯背后產生的巨大應用價值,不利于學校形成大數據格局。具體表現在:
1.數據整合程度不高,仍然存在數據孤島。
當前部分高校業務部門之間的信息缺乏統一規劃管理,導致各業務系統之間無法共享數據,信息系統資源相互獨立,數據的一致性得不到保證,嚴重影響了跨部門之間的業務協同,造成了存儲系統的利用率不均衡和存儲空間的浪費。信息“孤島”難以對數據進行沉淀、積累、匯總和再分析應用,無法從中進行深度挖掘形成有價值的信息。
2.各部門各自為戰,數據口徑不一致。
高校的運轉需要各個業務部門的協同配合,在當前高校管理過程中發現各業務部門在使用和共享既定業務數據時,普遍存在各自為戰的情況,導致數據口徑不一致,容易在學校信息管理中造成混亂。同時,這一現狀也直接導致學校無法利用有效的數據分析解決管理中遇到的實際問題,無法挖掘現在擁有數據中潛在的價值。例如,高校的校友系統,無法與就業、招生、本科生管理、研究生管理等系統進行數據共享,造成了校友身份信息的不完整、不統一等問題,甚至部門在完善信息時還需要人工手動確認數據的情況,為校友工作上帶來了巨大的困難和繁冗的重復性工作,進行數據分析更是無從談起。
3.沒有歸口管理,尚未形成機制。
隨著近年來高校信息化建設的逐步發展,各高校管理口的業務部門積攢了大量的原始數據,然而當前的高校數據管理體制沒有對所積攢出的零散原始數據進行歸口管理,缺乏協同響應的機制,無法對數據產生的標準、存放、使用、維護以及開展深入數據服務等應用進行統一的指導和規劃。因此,當前高校的數據分析和應用工作僅僅停留在各業務系統之間進行簡單數據交換的原始階段。
1.在已有的信息化建設成果的基礎上,構建全面互補的高校數據分析與應用管理體系。
經過多年的信息化建設,不少高校已基本形成了包括組織管理、技術保障、運行維護等在內的信息化管理運行體系。因此,在大數據時代到來之際,在加快推進高校信息化建設的關鍵點上,要充分利用已有的信息化建設成果,進一步推進建立以主管校領導牽頭的信息化建設與管理領導小組,明確學校信息化推進的責任部門,制定與信息化建設相關的制度法規,進一步開展全面互補的高校數據分析與應用工作。通過信息化標準規范的制定、采納和應用推廣構建高校信息化建設標準規范體系,完善信息化項目管理體系及信息化運行維護、檢查評估機制,迎接大數據時代的到來。
2.加強對已有數據的整合、分析與應用,提高數據對高校事務決策的輔助參議功能。
不少高校在初探信息化推進過程中產生了大量零散式、孤島式的數據信息,這類冗余信息的堆砌僅僅實現了高校信息數據管理中留存備忘的功能。應在排查現有信息化建設進展的基礎上,集成高校辦公自動化、科研管理、財務管理等重要校務管理信息應用系統數據,統籌整合、深入分析,將簡單堆砌的數據轉化為輔助高校決策的有力支撐例證,為學校教學、科研、管理和服務水平的提升以及進一步數據分析、整合、共享之路打下堅實基礎。
3.重視高校信息化工作的統籌指導和戰略規劃。
著力加強數據的分析與應用;著力增強網上輿論工作的主動性和創造性,承擔主要工作包括:
(1)數據分析與應用工作:制定學校數據發展規劃及相應數據標準;推動數據收集、存儲、分析和應用工作;學校綜合數據庫的建設、維護、管理工作;各級各類教育統計數據匯總、上報工作;數據統計服務工作,教育統計分析和評價報告撰寫工作,為學校宏觀管理與科學決策服務。
(2)學校信息化推進與實施工作:制定、推廣和實施學校各類信息化標準,開展標準應用的相關工作;學校教育信息化的發展規劃工作;組織、協調和推進全校各單位教育信息化的建設工作;綜合校務平臺等軟件項目的開發、評測工作。
(3)網絡輿情管理工作:網絡輿情的搜集采集,預警信息的提供;輿情信息匯編的制作和發布;不良信息處置,網絡突發事件應急響應。
(4)公共信息服務工作:學校門戶網站的內容管理和日常保障工作;信息技術培訓工作;校級公共信息服務保障工作。
(5)信息資源開發工作:網絡教育教學資源的開發、建設和發布等工作。
基于大數據的分析管理在高校應用中面臨著機遇與挑戰并存的現狀。隨著“數據中國”的深入開展,高校教育管理的信息化、數據化將成為不可逆轉的趨勢,挖掘教學數據深層次的價值并使其為學校發展決策服務是高校數據管理的重要任務。另一方面,以上文中所提到的當前所存在的問題在我國高校現今數據發展的探索過程中具有普遍性,如何結合本校實際情況進一步推進信息化進程和大數據挖掘程度還有待深入探索、修正。
(作者單位為西安交通大學數據與信息中心)