徐勇
大數據時代觀:一種可以采納的思維模式
依據現有傳統思維模式實現上述的“全數據”評估,必然存在人力、物力和海量數據的困境。因此,我們必須轉變思維模式,革新傳統監控評估技術。大數據時代觀就是一種可以采納的思維模式。其關鍵是“樣本=總體”。
在信息處理能力受限的時代,世界需要數據分析,卻缺少用來分析所收集數據的工具,因此隨機抽樣應運而生,“抽樣”的目的就是用最少的數據得到最多的信息,它可以被視為那個時代的產物。但是,當感應器、手機導航、網站點擊等被動地收集了大量數據,而計算機可以輕易地對這些數據進行處理,我們可以獲得海量數據的時候,其缺陷越來越難以忽視了。〔見維克托·邁爾-舍恩伯格(英)《大數據時代:生活、工作與思維的大變革》(中文版).浙江人民出版社.2012版,以下簡稱“維克托文”〕例如用抽樣的方法分析整個人口的情況,正確率可達97%。對于某些事物來說,3%的錯誤率是可以接受的。但是對于教育來說,3%的錯誤率是不能接受的。數據處理技術已經發生了翻天覆地的改變,我們的方法和思維也要跟上這種改變,要以每一個學生數據中心,合法地收集他們的所有數據,用“樣本=總體”為思路,設計評估,設計質量監控。
(一)大數據時代觀點綜述
進入2012年,大數據(big data)一詞越來越多地被提及,人們用它來描述和定義信息爆炸時代產生的海量數大數據時代來臨,并命名與之相關的技術發展與創新。大數據時代觀下有許多成功案例,如2009年甲型H1N1流感爆發的時候,谷歌更有效、更及時的發布了“流感”指示標。令人驚人的是,谷歌的方法是建立在大數據的基礎之上的,而不需要分發口腔試紙或聯系醫生。這是當今社會所獨有的一種新型能力:以一種前所未有的方式,通過對海量數據進行分析,獲得有巨大價值的產品和服務,或深刻的洞見。(見“維克托文”)
為了引入大數據時代的基本觀點,我們對這段時間內與監控有聯系論點做一個綜述。
首先,“從硅谷到北京,大數據的話題正在被傳播。”“我們的行為、位置,甚至身體生理數據等每一點變化都成為了可被記錄和分析的數據。……如今,一個大規模生產、分享和應用數據的時代正在開啟。”“互聯網時代,尤其是社交網絡、電子商務與移動通信把人類社會帶入了一個以PB(1024TB)為單位的結構與非結構數據信息的新時代。”大數據也將改變我們生活中最重要的方面,因為它為我們的生活創造了前所未有的可量化的維度。大數據已經成為了新發明和新服務的源泉,而更多的改變正蓄勢待發。
其次,讓數據“發聲”。“大數據”專家杰夫·喬納斯(Jeff Jonas)提出要讓數據“說話”。在數字化時代,數據處理變得更加容易、更加快速,人們能夠在瞬間處理成千上萬的數據。但當我們談論能“說話”的數據時,我們指的遠遠不止這些。
其三,“樣本=總體”。當數據處理技術已經發生了翻天覆地的變化時,進行抽樣分析在大數據時代就像在汽車時代騎馬一樣。(見“維克托文”)隨機抽樣取只是一條捷徑,是在不可收集和分析全部數據的情況下的選擇,它本身存在許多固有的缺陷。一旦抽樣過程中存在任何偏見,分析結果就會相去甚遠。探索以大數據為基礎的克服抽樣缺陷的解決方案,是提高數據利用效率的重要手段。聯系到我國現代化所面臨的種種問題以及教育、交通、醫療保健等各方面挑戰,通過大數據這種創新方式來解決問題,意義就更大。(見“維克托文”)
其四,大數據的核心就是建立在海量數據的基礎之上的1預測。有預測的監控,才有可能不斷完善受監控的學校或區域。而這種“完善”是自主,內在的,隨著監控系統接收到的數據越來越多,它們可以聰明到自動搜索最好的信號和模式,并監控系統也將自己改善自己。將目前單純依靠人類判斷力的監控模式,轉變為監控在計算機系統幫助下,成為受監測的主體和監控實施者共同自主完善模式下的監控行為。
從上述大數據的觀點來看,目前在教育質量監控評估上,過于依賴“抽樣”數據,都比較重視各種終端信息的采集,但對于管理和教學過程中的信息及發展性的信息關注不夠,教學質量信息采集時效性較差,是出現“兩費兩差一不足”,不利于對教學質量進行全過程管理,影響教學質量評估診斷、促進效用的及時發揮。
(二)大數據時代觀下的教育質量監控設想
目前評價方法一般是“加權求和”,雖然簡單,但容易降低評價的可能性,無法發揮數據全部作用。現有的網絡評價應用無疑延伸了評價的時間、拓寬了評價的空間、豐富了監控的內容,但同時也使評價數據庫的數據急劇增多,這些浩瀚的數據背后隱藏著許多重要的信息。傳統的數據分析手段只能獲取這些數據的表層信息,難以從中挖掘出有助教學決策的有價值的信息,來構建有效的教學質量預警機制。
以下我們從教育質量監控體系包括以下五個相互聯系、相互影響的子系統(即教育教學質量管理理念、組織機構、資源狀況、教育教學過程和質量評價分析)出發,談談教育質量監控的設想。
1. 樹立以學生發展為本質量監控的出發點和歸宿。首先在監控上要關注每一個學生的發展,監控的樣本等于所有學生,將學生體檢的健康數據、出入校門或班級的出勤數據、進入場所(宿舍、飯堂、圖書館的時間)時間、作業次數記錄、以及學業水平數據、家庭及社區環境數據、入學畢業跟蹤數據都作為監控的對象,并在此基礎上形成區域(或學生)學生發展狀況報告,發布學生健康狀況報告、學業水平報告。
2. 教育管理機構為主導的全員參與監控實體。組成一個縱橫交錯、相互作用、相互制約的監控機構網,對教育活動的全過程實施全面監控。
3. 區域內一體化的資源狀況監控系統。監控人力資源管理、基本設施建設與管理、經費管理等。在此基礎上可以了解區域內的均衡化發展的程度,學校資源利用情況。
4. 實時化教育過程監控系統。實時化過程監控是對教學計劃運行過程的觀察、監督,對偏離教學質量目標的行為進行實時分析和處理,保障課程設施正常開展,防范不按國家要求設置課程情況,防范加班加點情況。監控主要包括教學準備與設計監控、課堂教學過程監控、課程考試監控、實踐教學監控等。目前來看,課堂教學評價系統記錄產生大量評價數據,然而,這些數據主要是在日常教務管理過程中產生的,是教學質量測量的最重要的數據源,管理系統一般都沒有對其進行深入分析,也沒有發現其中隱藏的各種知識,這就使得教學管理人員無法從整體上把教學的綜合效果、變化趨勢等,教務管理系統積累的海量數據沒有能夠發揮應有的作用。要利用專門的分析軟件進行分析,為改進教學、提高教學質量服務。
5. 評語式的質量評價分析系統。要培育大數據時代的監控專家,保障教育“數據”真正發言,形成基本“評語”;要努力開發符合“全數據”的智能化教育管理系統,該系統對現有教育管理系統具有很強的兼容性,能夠采納已有數據。
為實現上述五點設想,建議采取以下工作策略:
1. 組建適合“全數據”質量監控機構和隊伍;
2. 研究“全數據”質量監控理論,開發監控框架,建立適合全數據評價評估的數學模型;
3. 摸清我省現有中小學學校內管理系統的類型(教務、學籍、圖書、健康、成績等等),同時要研究非教育系統與學生相關的數據系統,在此基礎上充分利用現有數據資源;
4. 監控中的有關指標盡量避免抽樣,其數據指向是現有教工、學生的日常數據,達到兩個目標:監控評估是真實的,監控數據不需要臨時采集。
(三)教育監控系統數據庫
教育監控系統數據庫建設首先要抓好數據框架研究。從宏觀上看,質量監控系統數據一般分為 “硬數據”和“軟數據”。(見凌惜勤等《建立校級教學基本狀態數據系統,完善教學質量監控體系》教改經緯.2011.總第219期)
“硬數據”一般是以數字的形式出現,具有統計功能,主要包括數量,名次和比率,如在校學生數、師資隊伍情況、學校占在面積、校舍及實驗室面積、教學儀器設備的數量及價值、圖書館藏書及體育場館面積,各項教學經費投入情況等。而“軟數據”一般是指對客觀事物的判斷和描述,不具有統計功能,主要包括文字、文檔、圖像信息等。大數據觀點下,格外重視“軟數據”。挖掘這些數據往往可以深入分析學校的辦學指導思想,辦學目標定位、人才培養方案、教學計劃的制定與落實情況、教學管理制度的制定及執行情況、教學質量標準的制定及監控情況,各種評估、評價(如學生評教、教師評學、各級各類的聽課評價,社會及用人單位的評價等)及反饋、各種總結報告、獲獎情況,無疑這些數據是十分重要的監控信息。要重視軟數據庫模式的標準研究和建設。
為實現以學生發展為中心的全數據理念,首先要建立適合其理念數據維度。例如TQMDSS(見張忠玉等《一種基于本科教學質量監控的決策支持系統》華南師范大學學報(自然科學版).2007,04)中重要的維度有:
1. 時間維度。根據學校的實際情況又分為年度維度和學期維度,其屬性較為簡單“年度(年度編號,年度);學期(學期編號,學期)。
2. 學生維度。學生、教師信息都存放在TQMS中的用戶信息表中,為了方便區分教師和學生,在數據源數據庫Classroom Teaching中,建立專門的學生視圖,作為學生維度數據源。這樣學生維度屬性為:學生(學生號,年級,學生姓名)。由于學生用戶太多,為便于篩選,采用多級別維度;依次為年級、學院、專業、高級別的學生集合必須包含低級別的學生集合。
3. 教師維度。同學生維度一樣,建立教師視圖作為教師維度數據源,教師維度屬性為:教師(教師號,學院、教師名);教師沒有年級和專業屬性(因此許多高校教師主要以院系為單位管理,經常跨專業授課)。
4. 教學班級維度。教學班級是對某學期、某教師為某班級(教學對象)開設的某一門課程的抽象描述。
其次,為提高監控工作的水平,要設法保障監控數據質量。
可能造成統計數據質量不高的原因會是多方面的,如法制意識不強;統計人員隊伍素質不高;被統計或調查對象不配合。提高統計數據質量的措施首先要提高統計人員素質;要把握數據源頭,夯實統計數據質量基礎;也要對統計數據質量進行監控。對數據質量監控的方法可以分為以下幾類:按監控時間可分為日常監控和時點監控;安數據質量監控范圍可分為抽樣監控和全數監控;安數據質量監控的手段可分為審核、復核、校驗、實地檢查。
大數據時代觀下監控模式的發展前景
(一)用數據庫(包括學校概況、師資隊伍、校園校舍、辦學經費、圖書資料、儀器設備、專業與課程、教學管理、教學效果、學生基本情況等數據群組信息)可以達到教育質量全面監控的目的,形成全面的、動態的教學質量監控體系。各個學校的狀態數據庫所采集的數據項是原始的,是真實、客觀、準確的,未來開發的監控系統會自動生成各項工作中所需要的衍生數據,為更深的層次分析教育現象產生的原因以及教育發展的偏差和趨勢服務。
(二)監控系統將是智能化的實時的開放的系統,從目前監控過于依賴專家的單一模式,轉變為將系統數據分析與專家協調監控模式。系統也將有利于實施民主監督與社會監督。
(三)有利于教育主管部門和學校用數據信息治校,而不是分數治校。教育行政部門用數據發現“細微”的問題,及時提醒,引導教育,而不是分數掐死教育。也可以有效避免將教學質量監控等同于考試,避免監控淪落為片面追求升學率的推手。
(作者單位:廣東省教育研究院)
責任編輯 鄒韻文