(哈爾濱金融學院現代教育技術中心 黑龍江哈爾濱 150030)
大數據(big data),指無法在一定時間范圍內用常規軟件工具進行捕捉、管理和處理的數據集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。
在維克托·邁爾-舍恩伯格及肯尼斯·庫克耶編寫的《大數據時代》中大數據指不用隨機分析法(抽樣調查)這樣捷徑,而采用所有數據進行分析處理。大數據的5V特點(IBM提出):Volume(大量)、Variety(多樣)、Velocity(高速)、Value(低價值密度)、Veracity(真實性)。[1]
大數據技術的戰略意義是對有意義的數據進行專業化處理。換而言之,如果把大數據比作一種產業,那么這種產業實現盈利的關鍵,在于提高對數據的“加工能力”,通過“加工”實現數據的“增值”。大數據需要特殊的技術,以有效地處理大量的容忍經過時間內的數據。適用于大數據的技術,包括大規模并行處理(MPP)數據庫、數據挖掘、分布式文件系統、分布式數據庫、云計算平臺、互聯網和可擴展的存儲系統。[2]
云計算服務,即云服務,是指可以拿來作為服務提供使用的云計算產品。包括云主機,云空間,云開發,云測試和綜合類產品等。
對于云計算的服務類型來說,一般可分為三個層面,分別是:IaaS、PaaS和SaaS。這三個層次組成了云計算技術層面的整體架構,這其中可能包含了一些虛擬化的技術和應用、自動化的部署以及分布式計算等技術,這種技術架構的優勢就是可以對外表現出非常優秀的并行計算能力以及大規模的伸縮性和靈活性等特點。
而我們平時所提及到的云服務,則是在云計算的上述技術架構支撐下的對外提供的按需分配、可計量的一種IT服務模式。這種服務模式可以替代用戶本地自建的IT服務。
大數據與云計算之間的關系,可以簡單理解成,云計算技術是一個容器,大數據是放在這個容器中的水,大數據是要依靠云計算技術來進行存儲和計算的。
高校一直是數據生產大戶。麥肯錫全球研究中心的數據報告《大數據:創新、競爭和生產力的下一個前沿》中顯示,大數據是大小超出常規的數據庫工具獲取、存儲、管理和分析能力的數據集。僅2009年,美國國家教育部某信息系統的數據庫就膨脹至269P字節(1個P字節等于10億個M字節),龐大的信息程度入選當年全美10大數據生產貢獻量排名。
在我國,有很多萬人以上的高校,對于高校管理層來講,學生的學籍信息、選課、成績單、圖書借閱情況、科研系統、招生就業情況、上網時間分布、校內論壇交流、微博、微信、互聯網登錄、一卡通消費、門禁等都會產生大量信息數據;學校教師使用的OA系統、教師基本信息、科研系統、經費報銷、薪酬管理、上課課件、視頻傳輸、項目管理等也會產生大量信息數據;實驗中心的實驗室設備、機房管理,圖書館的圖書管理;除此之外,還有教務系統及行政系統的設備管理、辦公自動化建設和校園網建設等信息數據。這些高校正在使用的系統經過多年運營,積累了大量的基礎原始數據,并且隨著業務的不斷發展,數據量的增長也是飛速的。如何對已有的原始數據開展深入的分析和應用,在統籌分析的基礎上合理運用,加強學校的科學化管理,為學校的發展提供數據支撐。大數據的分析研究,已經成為我國高校面臨的一個重要課題和開拓性機遇。
高校中的數據有很高的教學與科研價值,從2012年開始,包括華東師范大學上海財經大學、廈門大學、復旦大學等在內的一批大學開始重視數據的深度分析和應用工作。比如華東師范大學利用預警系統跟蹤學生的餐飲消費數據,跟蹤分析學生是否有經濟困難,是否需要幫助;華東師范大學的智能實驗室項目,記錄實驗室使用的全過程數據,形成動態表格,實現教育經費使用的集約高效。此外,北京航空航天大學、中國科學院、復旦大學等先后成立了十余個專門從事數據科學研究的機構。
高校的數據進行分析和應用,基于預測的數據分析與應用體系成功的關鍵在于它們是建立在海量數據的基礎之上。此外,隨著高校數據分析及應用體系積累的原始數據越來越多,通過跟蹤記錄分析找到最好的預測模式,可以對高校運轉的各領域提供決策支持,具體而言,對高校預測招生生源情況、就業情況,預測在校學生的各種需求情況、教師的科研項目管理、教職工人事信息管理以及學校的將來發展狀況等方面都能起到數據支持與趨勢研判的前瞻性輔助支持。
教學評估是每個高校的重要工作,也是定期必須要做的工作。我們把數據分析技術引入到教學評估系統中,提高了教學管理的科學性,增強了教學數字化建設的實際應用性。把基于海量數據挖掘的智能算法應用于教學質量評估中,從多媒體課件的使用、教師教學的效果、教師和學生的互動等因素中找出其中的聯系,能為各教學單位和教務管理部門提供決策支持信息、反饋信息,促使我們更好地開展教育教學工作,提高教學水平和質量。
當代是信息迅猛發展的年代,輿情研究工作對高校思想政治教育和高校教育教學環境穩定的特殊性和重要性是不言而喻。現在更是隨著Web2.0時代的進一步發展,在高校網絡管理當中花樣百出,如校園網BBS、微博、微信等新媒體的興起和大范圍應用,“圈模式”的交流方式為校園網輿情分析和突發事件網絡疏導增添了困難。所以,教育系統網絡輿情走勢的價值就顯現了出來。
基于大數據環境下高校數據的分析和研究,體現了高校管理和高校各種應用面臨著機遇與挑戰并存的現狀。隨著“數據中國”的深入發展,高校教學和行政管理的數據化、信息化將成為不可逆轉的趨勢,挖掘教育教學數據深層次的價值,已經成為學校發展當中,為高層做出決策的重要依據。其次,文中所涉及到的我國高校數據發展的過程具有普遍性,結合本校實際情況,進一步推動信息化進程和嘗試深度對大數據進行挖掘,還需要我們進一步的探索,找到更適合的算法。