鹿星南
[摘要]大數據的蓬勃發展深刻影響著教育領域,促進了教育系統的多重變革,尤其是給以理論假設、抽樣調查、統計分析為主流的教育研究范式的發展帶來了契機。在大數據背景下,探討教育研究范式的轉換與變革問題,應結合小數據時代的傳統教育研究范式并審慎地厘清大數據的應用范圍和作用邊界。文章從三方面探討教育研究范式的變革動向。首先,在研究進路方面,注重數據驅動型教育研究和理論驅動型教育研究的雙向融合;其次,在研究方法方面,大數據助推研究方法的混合與并存;最后,在研究思維方面,既要看重相關關系又要探求因果關系。
[關鍵詞]大數據;教育研究范式;變革動向
[中圖分類號] G40[文獻標識碼] A[文章編號]1005-5843(2018)10-0001-06
[DOI]10.13980/j.cnki.xdjykx.2018.10.001
得益于智能感知、移動互聯網、云計算等前沿信息技術的躍遷式發展,各類數據以指數形式暴增,大數據已成為人們廣泛追捧的熱詞。作為一種時代潮流,大數據給科學研究、商業服務、公共衛生等領域帶來了多重沖擊與挑戰。當前,大數據迅速成為教育研究關注的焦點話題,伴隨著大數據技術在教育領域的持續推廣和使用,其在教育領域的應用更是遍地開花。如服務于教育決策、學生評估、課程與教學變革、教育研究范式轉變等方面。可以認為,依托源自于教育場域中的大數據而進行的教育研究將成為新常態[1]。盡管大數據驅動的教育研究具有巨大的發展前景,但缺少反思的盲目追逐可能導致大數據研究陷入概念炒作[2]。基于此,筆者在明晰大數據視域下教育研究范式變革的價值與局限性的基礎上,結合小數據時代傳統教育研究范式的特征,反思并探索大數據時代教育研究范式的變革動向及其推進策略。
一、大數據的歷史發展、內涵及其表征
人類進入大數據時代已成共識,從歷史視角來看,大數據也有其自身的演進軌跡。針對客觀世界的數據刻畫與記錄由來已久,“古埃及、古希臘等時期都早已藉數據來記錄事情、測量土地、觀測天文等”[3]。其中,古希臘的畢達哥拉斯學派更是提出“數是萬物的本體”[4]的哲學命題。17世紀初,以伽利略為代表的近代科學家將數據引入自然科學的研究中,“將數據的運用上升至科學方法論的地位”[5]。隨后,因計算機和通信技術的崛起與發展,人類邁入信息時代并意識到數據是組成計算機網絡技術的基本要素。進入20世紀80年代,阿爾溫·托夫勒將信息爆炸列為未來信息社會的重要特征。在一定程度上,信息爆炸可以視為大數據的前身,但由于當時的技術水平有限,大數據未能受到應有的關注。直到21世紀,得益于互聯網、智能移動終端、可穿戴技術等與人類生活的高度融合,數據體量達到了前所未有的規模,人類對海量數據的存儲和計算也取得了新的突破。2008年,國際頂尖雜志Nature刊發“Big Data”專輯[6],集中探討數據洪流所引發的技術挑戰及其改進路徑。至此,大數據迅速走紅,并在全球掀起了相關研究和討論的熱潮。隨著大數據理念的深入發展,世界多個國家競相布局大數據發展戰略。如美國的《大數據研究和發展倡議》、歐盟的《數據價值鏈戰略計劃》、法國的《數字化路線圖》等,將發展大數據上升至國家意志層面,并將其稱贊為“21世紀的石油”[7]。我國于2012年才開始大數據研究,并于2014年首次將其寫入政府工作報告。2015年國務院發布的《促進大數據發展行動綱要》正式開啟了發展大數據的新章程。
大數據是21世紀信息技術蓬勃發展的必然產物,但人們對大數據的概念厘定仍存有爭議。一般意義上,大數據是指普通軟件工具難以在可接受的時間范圍內感知、獲取、處理和分析的海量、復雜、異質的數據資源。有研究者基于國內外學者、研究機構、企業等對大數據的理解,從數據規模、處理工具、利用價值三個維度對大數據的內涵進行概括性釋義[8]:第一,較之于小數據,其數量巨大、來源分散;第二,常規的數據工具不足以應對大規模數據,需要引入全新的數據計算工具;第三,大數據能夠帶來巨大的經濟、社會和科研價值。數據顯示,2016年全球大數據市場規模達到453億美元,同比增長25.8%[9]。此外,大數據商業應用第一人維克托·邁爾·舍恩伯格對大數據的相關問題進行了哲學考察[10],認為世界的一切都可用數據來表征,并提倡依據數據這一新視角來重審和刻畫世界的真實面貌。還有研究者從本體論、認識論、方法論等層面系統地闡述了大數據的哲學問題[11]。在本體論上,萬物皆數,將數據提升至哲學層面的本體地位;在認識論上,通過數據驅動的知識發現來探尋事物的發展規律;在方法論上,大數據的整體性思維促成了還原論方法和整體論方法的整合。可以說,作為一個復雜多變的概念,大數據不僅是一種新型的科學技術,更表征著一種全新的思路、方法和問題解決方案。因此,對大數據的理解不能過于寬泛,應從不同著眼點切入。首先,從大數據的技術屬性和存在形態來講,新的數據挖掘技術和數據特征可以攫取數據背后的信息、知識和智慧,從而幫助人們更加精準、有效地洞悉事物的發展規律和趨勢。其次,從深層意義來講,大數據是一種與人類認知圖式、知識發現模式和學術研究密切相關的范式革新或重構。
二、大數據背景下教育研究范式變革的價值與隱憂
大數據在自然科學領域中的價值和實用性是有目共睹的,它不僅為科學研究提供了一種全新的技術工具,更引發了科學發現模式的變革和研究范式的轉換。無獨有偶,大數據也向語言學、心理學、政治學、教育學等社會科學領域逐漸延伸和滲透。正如一些研究者所言:“大數據以其獨有的功能和優勢作用于教育領域,促進了教育系統的多重變革。”[12]尤其是給以理論假設、抽樣調查為主的教育研究范式帶來了重大發展契機。從技術層面來看,大數據使信息資料的采集與分析更加快速、便捷。大數據時代,依托情境感知、互聯網、云計算等熱點信息技術,人類以及人類社會的各類數據都被客觀、快速地記錄,匯集成了巨量的數據。較之于傳統教育研究中的抽樣數據,我們獲得的可能是全納式數據。此外,Hadoop,Tableau,RapidMiner等一系列數據挖掘與分析工具能夠協助研究者快速處理數據,實現數據的精準化、可視化。從研究思維來看,大數據所秉持的“注重相關關系、允許混雜性”[13]的思維,有益于教育研究者深度挖掘過去難以涉足或無法描述的現狀或問題。從研究進路來看,大數據助推教育研究從“理論驅動轉向數據驅動的知識發現”[14]。它以數據為驅動,借助新的工具采集數據,或者通過模擬方法產生數據,隨即用工具處理,從而形成和確立新的規律及理論[15]。數據驅動的教育研究將數據視為科學發現的基礎,并通過數據挖掘和分析技術將以往的經驗歸納、發展為“大數據歸納法”[16]。從研究方法來看,大數據有利于消解定性研究和定量研究的對壘,推動研究方法的相互融合與滲透,使其更加趨向混合研究。在定性研究中,大數據能夠依托海量或全樣本數據,揭示隱匿在信息背后的現狀或趨勢,從而“既不需要控制變量來檢驗關聯,又能規避定性方法在案例選擇中的樣本偏誤”[17]。在定量研究中,利用大數據的優勢既能克服量化研究小數據體量不足、類型單一的缺陷,又能將大數據技術運用到量化研究所青睞的數理統計方法中,從而形成高質量的數據鏈,進一步深化、量化研究。因此,大數據為定性和定量研究方法的結合提供了諸多可能,從而推動了混合研究的發展。
雖然大數據給教育研究范式的變革帶來了難得的發展機遇,但也存在一些消極的影響。其一,大數據堅守的全數據模式可能是一個“美麗的謊言”[18]。如互聯網生成的大數據難以表征全體互聯網用戶的行為,因為“這些數據主要是由在網上留下痕跡的人群產生的”[19]。此外,大數據只能記錄人類的客觀行為,在描述和測量人類的思維、感受、情緒等主觀意圖方面差強人意。其二,大數據擁護者特別重視相關關系而不在乎甚至棄置因果關系。雖然大數據在尋求相關關系方面作用明顯,借助相關關系可以從數據海洋中揭示某一事物的真實面貌。但是,大數據時代的教育研究并未停留于相關關系的揭示,“因為相關關系是因果關系的必要條件,它為探求因果關系奠定了基礎”[20]。其三,大數據主義主張理論研究已經終結,甚至提出“有了足夠的數據,理論就可以功德圓滿”[21]的口號。盡管大數據時代的知識發現應始于數據,數據不能預先被理論所污染,但理論在知識發現中依舊發揮著作用,只是其作用機制改變了。正如有研究者所言:“大數據時代不應該也絕不會是理論消亡的時代,相反的,理論滲透于大數據研究的各個環節。”[22]
三、大數據背景下教育研究范式的變革動向
得益于大數據技術的迅猛發展、教育系統變革的深切吁求以及國際教育大數據政策的層出不窮,教育研究領域掀起了一股范式變革的浪潮。教育研究范式的大數據轉向已然大勢所趨。范式是庫恩學術話語體系中的重要范疇,旨在研究自然科學的發展歷程及其范式革命問題。在庫恩的語境中,“范式具有不可通約性、不可共存性,科學革命是新范式替代舊范式的激進過程”[23],即新范式的勃興和舊范式的衰落。社會科學家在借鑒與修正的基礎上引入了范式概念,但并不像庫恩筆下的自然科學那樣帶有“范式更替”的意味。正如艾爾·巴比所言:“在社會科學領域,理論范式只有是否受到歡迎的改變,很少會被完全舍棄……社會科學范式提供了不同的觀點,每個范式都提及了其他范式忽略的觀點。”[24]作為一門社會科學,教育學自改革開放以來,呈現出繁榮發展的局面,但不同的教育研究學說或門派間一直存在爭議。盡管如此,教育研究范式的變革并不是對傳統研究范式的全盤否定,而是在既有范式的基礎上達成新的超越,是一種去粗取精、去偽存真式的融合與共存。目前流行的數據驅動型教育研究使教育研究范式呈現出一些新特征:“更加青睞總體樣本、更加倡導相關關系、更加看重研究效率,”[25]這為我們審視教育研究中的問題和現象提供了新的思維。然而,上述觀點僅論及大數據對教育研究范式的表層影響,尚未觸及教育研究范式的結構變革。數據驅動的教育研究范式與小數據時代的傳統教育研究范式不是非此即彼的二元對立關系,借助社會科學中的范式理論,前者是對后者的修正、拓展與完善。因此探求大數據時代教育研究范式的變革動向,應結合小數據研究在教育學中的價值和功用,從如下幾點推進。
(一)促進數據驅動與理論驅動的雙向融合
大數據時代的降臨以及數據洪流的匯聚使知識發現的模式發生了巨大變化,促成了以數據為中心的知識發現新通道。與以往理論驅動的知識發現不同,數據驅動的知識發現是指“在先驗假設盡可能少、甚至沒有理論假設的條件下,借助數據挖掘、機器學習等先進數據處理技術,從海量的數據資源中提取隱藏在數據背后、能被人理解的知識和規律的過程”[26]。然而,由于數據挖掘技術與計算工具還不夠成熟、數據的碎片化和模糊性問題以及教育研究的復雜性和不確定性等特點,數據難以實現徹底共享,純粹依靠數據驅動的知識發現去揭示教育的所有規律是不符實際的,具有一定的局限性。雖然數據驅動的知識發現有意避開了傳統教育研究的宏大敘事和理論論證模式,并重塑了教育知識的演繹和生成進路,但這并不代表著理論驅動型教育研究的消亡。因此,教育研究應將兩種范式進行整合。正如有學者所言:“利用大數據的技術紅利,在依靠理論驅動的知識發現的基礎上,促成‘數據驅動與‘理論驅動的融合是大數據背景下教育學等社會科學研究范式轉變的必然走向。”[27]
在教育研究中,數據和理論驅動融合的研究范式的運行機制為:首先,研究人員從實際的教育現象和問題出發,結合一定的教育理論,確立研究框架并概括提煉出理論假設;其次,“以理論假設為導向,盡可能搜集與研究對象有關的全部原始數據”[28],同時通過大規模的數據挖掘與分析技術從中提取有價值的知識或信息;最后,借助上述流程中所概括出的有價值的信息來檢驗理論假設的合理性,進而揭示某一教育問題或事實的變化規律以及發展趨勢。另外,在上述兩種研究范式融合的過程中,盡管大數據分析技術存在于研究的各個方面,但教育研究者應“將特定的歷史和社會文化內涵納入數據之中”[29],對其進行意義解讀與詮釋,謹防大數據陷入崇尚工具理性、技術理性的泥潭。
(二)助推研究方法的混合與并存
研究方法是關系到教育研究水平和教育科學化的重要因素之一。20世紀以來,受西方主流教育研究方法的影響,國內教育研究方法經歷了以思辨研究占據主導地位,轉向實證研究的演進歷程。其中,實證研究主要包括量化研究、質性研究和混合研究。就目前教育研究方法的發展趨勢而言,“雖然教育研究方法正趨向多樣化,但思辨研究依然把控主流話語權,量化研究和質性研究還存在很大發展空間”[30]。進入21世紀以來,迅猛發展的大數據以及開放的學術環境,不僅為教育研究提供了一種新的方法,緩解了多種研究方法之間的張力,同時推進了不同研究方法的混合與并存。
與傳統教育領域所使用的統計、分析方法相比,“大數據挖掘和分析涵蓋數據庫技術、模型識別、機器學習等領域”[31],能夠描繪海量教育數據中存在的教育模式,從而預測教育現象的發展趨勢,并提出相應的教育對策。例如,大數據方法能夠全面、客觀地記錄某一時期內學習者的學習過程數據、成績數據和生活數據,依托相應的分析方法和風險預測模型,能夠分析學生的學業成就以及預測失學風險,從而為教師的教學提供有效的支持[32]。作為一種新的實證研究方法,大數據在豐富教育研究方法的同時,也促進了教育研究方法的多元并存。在一定程度上,“大數據的全數據模式和獨特的數據特征促使教育中的定性和定量研究在數據收集與處理方面逐漸融合”[33],緩解了兩種研究方法的分野。然而,大數據自身存在的局限性以及教育研究的復雜性、多樣性和不確定性,使大數據方法難以替代以抽樣調查、觀察與訪談等為主的小數據時代的教育研究方法。大數據方法與上述研究方法的融合對于推進教育研究的進步具有重要意義。與大數據方法相比[34],抽樣調查和收集數據可以更加精確描述教育研究對象的客觀行為與主觀態度,大數據方法與抽樣調查的融合,一方面易于控制單個研究變量、拓展研究視域;另一方面可以規避大數據蘊含的碎片化、虛假的信息。觀察與訪談能夠更加深入地了解教育行為主體不斷發展變化的行為表現以及心理特征,大數據方法與觀察、訪談的結合能夠深刻揭示數據背后行為主體的經驗世界及其所處的現實境遇。因此,大數據時代的教育研究既要適當地運用大數據方法來描繪與預測教育發展變化的規律或趨勢,又要運用基于事實和證據的實證研究確切地推斷和解釋教育現象背后的因果關系,同時還要運用哲學、人文、藝術的方法對教育領域的精神和信念進行詮釋與批判。
(三)既要看重相關關系更要探求因果關系
大數據時代最受人關注的話題便是從追尋因果關系轉向重視相關關系,即“我們只需要知道是什么,而不必知道為什么”[35]。換言之,人們不需要挖空心思地探究事物或現象間的因果,而僅需要找到數據之間的可能相關性來認知、把握、預測事物的發展趨向。因為“大數據的核心功能就是基于數據驅動的相關性分析對未來發展趨勢進行可能性的預測”[36]。目前,大數據的相關關系研究在探究學生學習行為和學習需求、教學策略之間的關系以及學生校園消費行為與家庭經濟之間的關系等方面有著獨特的優勢,對研究者更加直觀地跟蹤教育現象、挖掘教育變化規律、預知教育發展趨勢具有重要意義。然而,探究因果關系是促進知識積累和學科體系建設的重要手段。自古希臘以來,西方的自然科學家和哲學家就開始探求事物發展背后的因果關系,并嘗試在此基礎上揭示事物的本質。相關關系只能分析事物間關聯的表象,而因果關系則能把握和揭示事物間的內部運行機制,因此“科學研究離不開因果性,更無法超越它”[37]。那么,在教育研究領域,我們注重相關關系的同時,不能拋卻對因果關系的挖掘,即不僅要知其然也要知其所以然。
就教育研究來講,“教育現象的動態生成,教育內部因素的異質多樣、互相制約,教育過程中多種偶發和隨機因素存在的可能性”[38],使大數據環境下的教育研究表征出種類繁多的相關關系。但是,“有些可能是偽相關、偶然的巧合甚至完全顛覆常識,自身并無太多價值”[39],此時就需要對某一教育現象進行符合學科知識邏輯的因果解釋,進而保證教育決策的科學性和合理性。例如,有研究者通過大數據分析技術來探究學生的課堂表現與教師教學內容、策略、方法等變量之間的相關關系,認為教學的動態調整可以提高學習者的學習效率,有利于為學生提供個性化的學習路徑和學習資源[40]。在此基礎上,研究者又以“C語言程序設計”課程為例,采用實驗研究的方法對上述研究結論進行因果解釋,確保了研究結論的有效性與說服力。大數據時代相關關系和因果關系的并存為我們刻畫了教育研究的新景象,促使教育研究者以大數據揭示的相關性為立足點,預知教育發展的趨勢,繼而以此作為基礎進一步探索數據背后的因果關系,從而為教育研究和決策提供精準、確切的支持。
大數據技術作為人類量化認知世界、探索未知領域的新工具,為教育研究的提升和研究范式的轉變提供了巨大契機。繼大數據在商業活動、政府治理、醫療衛生、機器翻譯等領域大規模應用之后,大數據在教育領域的應用前景也是十分廣闊的。然而,當前教育研究的大數據轉向還處于起步階段,一方面,“教育大數據自身存有技術應用與落地問題、數據信息的模糊性和碎片化問題、數據共享與隱私安全問題以及數據治理問題等”[41]。另一方面,受中國傳統文化、教育研究者個人學術偏好以及人文社科背景等因素的影響,大多教育研究者缺少計算機科學、信息科學、統計學等數理學科知識,熱衷于對宏大問題的理論思辨和邏輯論證,難以形成大數據時代教育研究所需的“數據素養”[42]。大數據時代教育研究范式的變革必定是一個漸進式的過程。我們在確信大數據對推動教育研究范式變革具有積極影響的前提下,更應清晰厘定大數據的應用范圍和作用邊界,積極促進其與小數據時代的傳統教育研究方法相互補充、共同發展。
參考文獻:
[1][42]劉三女牙,楊宗凱,李卿.教育數據倫理:大數據時代教育的新挑戰[J].教育研究,2017(4).
[2]張曉陽.大數據迷潮下的教育研究及其想象力[J].基礎教育,2015(4).
[3]黃欣榮.大數據技術的倫理反思[J].新疆師范大學學報(哲學社會科學版),2015(3).
[4]汪子崇,范明生,陳村富,姚介厚.希臘哲學史(第1卷)[M].北京:人民出版社,1997:292.
[5]劉紅,胡新和.數據革命:從數到大數據的歷史考察[J].自然辯證法通訊,2013(6).
[6]Howe A D, Costanzo M, Fey P, et al.Big data: The future of biocuration[J].Nature,2008,455(7209).
[7]蔡翠紅.國際關系中的大數據變革及其挑戰[J].世界經濟與政治,2014(5).
[8]黃欣榮.大數據的語義、特征與本質[J].長沙理工大學學報(社會科學版),2015(6).
[9]前瞻產業研究院.政策推動大數據產業高速發展 2018年市場規模將達180億[EB/OL]. https://bg.qianzhan.com/report/detail/459/170316-862c2d35.html.2017-03-16/2018-05-20.
[10][13][22][35]維克托·邁爾·舍恩伯格,肯尼思·庫克耶.大數據時代——生活、工作與思維的大變革[M].盛楊燕,周濤譯.杭州:浙江人民出版社,2013:123-126,27-65,93,71.
[11][16]黃欣榮.大數據哲學研究的背景、現狀與路徑[J].哲學動態,2015(7).
[12]吳砥,余麗琴.大數據推進教育深度變革[N].中國教育報,2017-09-21.
[14]鄧國民.大數據和教育研究:認識論和方法論的思考[J].電化教育研究,2018(6).
[15]張婧婧,封晨.多學科視域下教育密集型研究的機遇與挑戰——基于美國《數據密集型教育研究》的解讀[J].復旦教育論壇,2017(5).
[17]陳云松,吳青熹,黃超.大數據何以重構社會科學[J].新疆師范大學學報(哲學社會科學版),2015(3).
[18]楊子飛.“第三洞穴”與“數據主義”——論大數據社會科學的內在矛盾[J].自然辯證法研究,2016(8).
[19][31]丁小浩.大數據時代的教育研究[J].清華大學教育研究,2017(5).
[20]劉林平,蔣和超,李瀟曉.規律與因果:大數據對社會科學研究沖擊之反思[J].社會科學,2016(9).
[21]Chris Anderson.The End of Theory: The Data Deluge Makes Scientific Method Obsolete [J].Wired Magizine,2008(16).
[23]張應強.中國教育研究的范式和范式轉換——兼論教育研究的文化學范式[J].教育研究,2010(10).
[24]艾爾·巴比.社會研究方法(第11版)[M].邱澤奇譯.北京:華夏出版社,2009:34.
[25]鄒太龍,易連云.從“始于假設”到“基于數據”——大數據時代教育研究范式的轉型[J].教育研究與實驗,2017(4).
[26]劉濤雄,尹德才.大數據時代與社會科學研究范式變革[J].理論探索,2017(6).
[27]汪雅霜,嵇艷.大數據分析與量化研究的區別與整合——兼議教育量化研究的未來走向[J].四川師范大學學報(社會科學版),2017(4).
[28]羅俊,李鳳祥.計算社會科學視角下的數據觀[J].吉首大學學報(社會科學版),2018(2).
[29]閻光才.教育及社會科學研究中的數據——兼議當前的大數據熱潮[J].北京大學教育評論,2013(4).
[30]姚計海.教育實證研究方法的范式問題與反思[J].華東師范大學學報(教育科學版),2017(3).
[32]孫洪濤,鄭勤華.教育大數據的核心技術、應用現狀與發展趨勢[J].遠程教育雜志,2016(5).
[33]陳云松,吳青熹,黃超.大數據何以重構社會科學[J].新疆師范大學學報(哲學社會科學版),2015(3).
[34]文軍,吳曉凱.找回失去的傳統:“大數據”研究范式的反思與重構[J].新疆師范大學學報(哲學社會科學版),2018(1).
[36]陳潭,劉成.大數據驅動社會科學研究的實踐向度[J].學術界,2017(7).
[37]黃欣榮.大數據對科學認識論的發展[J].自然辯證法研究,2014(9).
[38]葉瀾.教育研究方法論初探[M].上海:上海教育出版社,1999:328.
[39]鄭宏.大數據時代高教研究的特征與新文化[J].高教探索,2017(12).
[40]姜強,趙蔚,王朋嬌,王麗萍.基于大數據的個性化自適應在線學習分析模型及實現[J].中國電化教育,2015(1).
[41]楊現民,唐斯斯,李冀紅.發展教育大數據:內涵、價值和挑戰[J].現代遠程教育研究,2016(1).
(責任編輯:付英華)