摘要:在《科學革命的結構》一書中,庫恩認為科學革命的本質是范式轉換而非知識堆棧。作為新一輪AI革命“皇冠上的明珠”,生成式人工智能(AIGC)憑借其高智能交互、創造性生成、復雜數據處理等能力,拓展出教育研究范式變革的新路徑。該研究以AIGC的功能機理與助研情境為基點,從知識論、本體論、方法論與價值論四個維度闡述了該工具對于教育研究范式變革的賦能邏輯。然而,作為一項顛覆性技術,AIGC的助研應用仍面臨著知識生成的真實性與合法性質疑、服務客體的局限性、數據安全與倫理的危險性以及信息承載意識形態的侵犯性等問題,應從四個層面制定技術賦能策略:在工具層面,以技術降檻推進教育人工智能知識權力公平;在基建層面,擴大教育研究數字化空間普及;在安全層面,創建科研領域的輕量化專用型語料庫;在話語建設層面,支持本土AIGC平臺的功能迭代與國際傳播。
關鍵詞:教育數字化轉型;學科研究范式;生成式人工智能;人智協同
中圖分類號:G434 文獻標識碼:A
本文系國家社科基金教育學一般項目“百余年來國際教育發展進程中的意識形態問題研究”(項目編號:BDA220036)、2021—2022年度浙江省高校重大人文社科攻關計劃項目“教育數字化背景下高校大數據治理的現實困境及優化策略研究”(項目編號:2023GH009)研究成果。
① 楊啟光為本文通訊作者。
教育研究范式(Educational Research Paradigms)是教育學術共同體從事教育研究活動時應當依循的通用程式,包含了研究者在價值觀念、理論基礎、典型案例、研究方法與論述標準等層面形成的共識[1]。當前的教育研究范式正在面臨多重發展困境,如關于知識本體論與價值論的衡量標準確立問題,思辨與實證兩類研究方法的應用倚重問題[2],宏大敘事與微觀轉向的研究客體邊界劃分問題,教育研究方法論的自身話語體系建設問題,學術信仰的缺失與功利主義風氣蔓延等等[3]。有學者認為,研究方法的多重分歧是教育學的學科建設尚未成熟的明證,完善與豐富教育研究范式是學科發展勢在必行的重要議題。
面對教育研究范式的發展頑疾,生成式人工智能(AI Generated Content,AIGC)的普及與應用或可成為一劑良方。AIGC的核心功能在于可以借助大規模語料庫、生成性對抗網絡、大型預訓練模型等技術,對用戶的交互與技術需求予以高度聚合、千人千面、實時且類人化的高質量回應,且其理解能力與創新能力獲得了全世界使用者的廣泛贊許[4]。Nature期刊曾發文稱,ChatGPT類AIGC具備臂助學術寫作、強化科研創新、增進學術公正、擴張科研視野以及提高出版效率等效能,將推動學術研究范式發生顯著變革[5]。縱覽目前國內AIGC的相關研究,多是從工具賦能教育發展的價值、邏輯、使命及潛在風險治理路徑等層面展開論述,缺乏該工具賦能教育研究范式變革的理性思考與技術建議。因此,本研究從知識論、本體論、方法論與價值論等視角系統探討AIGC對于教育研究范式變革的顯著意義與迭代路向,具有重大的理論價值與現實意義。
依據庫恩(Kuhn,T.S.)在《科學革命的結構》與《對范式的再思考》中的兩次概念闡釋,范式是指某一領域的科學共同體從事相應類別的科學活動時應當依循的通用程式[6],其通用性主要包括:(1)共同的基本理論、思維方式與研究方法;(2)共同的研究信念;(3)共同的自然觀(如形而上學的假定等)。對于新舊范式的轉換,庫恩將其歸因于科學革命的影響,并在科學共同體理念基礎上提出了范式的轉變模式:前學科(范式模糊)—常規科學(建立范式)—科學革命(范式動搖)—新常規科學(建立新范式)[7]。在此基礎上,圖靈獎獲得者吉姆·格雷(Jim Gray)參照關鍵科學革命的時間節點與典型特征,在2007年提出數據密集型科學的概念,并將科學研究范式的演進歷程歸納為四個階段:以對自然現象進行描述論證的實驗科學范式(Empirical Science),利用模型和歸納法對事實進行一般化推演的理論科學范式(Theoretical Science),對復雜現象進行計算機科學仿真的計算科學范式(Computational Science),以及通過IT技術獲取、存儲、清洗、統計與分析大數據的科學路徑,將理論、實驗和計算科學統一起來的數據密集型科學范式(eScience),亦稱第四范式[8]。祝智庭教授探討了《第四范式:數據密集型科學發現》一書中不同學者關于數據密集型科學范式對于各個科學領域的必要性的觀點,并提出該范式對于教育科研領域同樣具有重大影響,如大數據技術對于學習分析學和教育數據挖掘等過程的基石意義等[9]。依據鄧仲華等學者[10]對于吉姆·格雷理念的詮釋,可以對科學研究四類范式進行階段劃分與描述,如圖1所示。

由圖1可知,科學研究范式的演進歷程依次為:18世紀以前偏重于事實描述的經驗范式,18世紀末期形成強調理論可復現性與普遍性的理論范式,20世紀中期伴隨計算機產業而興起的仿真模擬范式,教育大數據、區域鏈、云計算以及AI等技術推動的第四范式變革,演進的四段歷程與18世紀60年代的第一次工業革命、19世紀中期的第二次工業革命、20世紀40年代的第三次工業革命以及當下的信息與通信技術科學革命節點基本相符。嚴格地說,教育學所屬的社會科學領域與庫恩書中的科學范疇存在差異,庫恩也曾在其書中指出社會科學范疇的研究方法論并不完全遵循范式的演進歷程,然而,由于教育研究與自然科學研究具備相似的研究理念、研究特征、原則遵循與實踐路徑,且數據科學憑借其時間維的連續性、空間維的全域性和價值維的多元性等特征,對教育研究的嵌入與變革愈發深刻,因此教育研究也可以從范式建構的維度進行探究,且其范式結構的變革歷程與科學研究范式的變革過程存在顯著關聯。AIGC作為AI發展史中綜合了預訓練模型與深度學習等技術的“集大成者”,其對于研究范式的發展乃至變革的推動價值,兼具歷史與邏輯的合理性。
以AIGC為代表的新一輪科技革命在改變著科學范式的同時,也給教育理論、體系與實踐帶來了挑戰,進而推動著教育研究者的范式反思與路徑更迭。研究者應厘清工具賦能的技術基底、明確應用情境,并從知識論、本體論、方法論與價值論等視角審視AIGC發揮效能的內在機理,才能有的放矢,為洞察AIGC賦能教育研究發展與變革的風險、提出優化路向指明方位。
(一)AIGC的功能及其助研情境
生成式人工智能是基于巨型矢量數據庫憑借自然語言處理(Natural Language Processing,NLP)和機器學習算法(Machine Learning,ML)等技術來模擬人類對話的交互型機器人[11],其工作機理可以概括為五個步驟,一是收集類似爬蟲網站、維基百科、書籍文獻等各類網頁數據;二是依據機器學習算法對訓練數據清洗與預處理;三是設計語言模型架構,Transformer架構憑借其可以并行且速度更快迅速取代循環神經網絡RNN的系列變種,成為主流的模型架構基礎;四是訓練模型,GPT模型依托于Transformer解除了順序關聯和依賴性,通過大量的無監督預訓練(Unsupervised Pre-training)并使用反向傳播來更新神經網絡的權重;五是微調與部署,GPT最初是經由大型文本語料庫進行訓練的,之后被微調為生成模擬人類對話式機器人,進而被部署到生產環境中得以廣泛傳播,為我們所用?;贏IGC的工作機理可歸納出其臂助科研研究的多維情境,如輔助學術論文大綱生成、段落擴寫與續寫、多語言翻譯潤色、數據處理與分析、數據可視化等,據此也可合理預測其助研的技術演化路向,具體如表1所示。


(二)AIGC賦能教育研究范式變革的邏輯分析
1.知識論視角:從線性遞進到登高望遠
批判教育學代表人物阿普爾(Apple,M. W.)曾經提問:誰的知識最有價值?這一問題在經驗形態的規范教育學研究與實驗指導的演繹教育學研究逐步轉向基于計算機仿真與大數據等技術的新型范式過程中,演變成:什么樣的知識最有價值?AIGC加持的移動互聯網時代,信息唾手可得,此時識記類知識的價值應重新加以審視。當前,技術正從三個維度力推教學過程的知識權重變革,一是,模型與算法的優化可臂助多數線性問題解決,如GPT4.0以平均分75的成績通過了美國統一律師資格考試,超越了90%以上的考生,開源程序AutoGPT可以在3分鐘內用React語言創建一個網站等,技術的飛躍使得大部分線性邏輯事項無須再依賴人類頭腦,如閱讀、背誦、寫作、計算等學科知識的核心內容可由智能平臺即時回答[12];二是,個性化學習推薦路徑促進高階思維養成,自適應推薦系統在AI助力下進一步優化推薦路徑的生成,創造性思維、批判性思維與交互協作等能力也可以經由學習者與AIGC的交互來完成;三是,跨學科的發展脈絡愈發貼近社會生產實踐邏輯,在AI輔助下探索教育學與心理學、經濟學以及神經醫學等學科聯結形態的跨學科研究便利性大大增加,數據調用、合并與統計分析等流程難度大幅度降低。
技術激發了教育中知識權重的變易,社會更加注重學習者提出優質的問題、準確詳實地拆解問題與描述問題這一能力,而非對知識的重復,這種轉變,推動著教育研究回歸實踐原點。為了解決“什么是教育研究需要探索、解決的首要問題”這一原點議題[13],教育研究者應考慮基于應然與實然兩個維度發揮AIGC的效能。在應然層面,教育研究者應進一步關注學習者的高階思維培養,關注新技術支持下的各學段內容變革,關注如何幫助學習者站在“技術的肩膀上”登高望遠,避免低質量重復性學習的發生。在實然層面,由數據傳輸過程中信道噪聲會導致信息的丟失和失真,增加信息的熵增,導致研究者陷入數據謎團[14],而AIGC可以臂助研究者對海量、多模態數據加以整合,并輸出為研究者所需的呈現形式,增強教育研究領域知識的可用性與易用性,幫助教育研究者站在“技術的肩膀上”登高望遠,激發教育研究者的探索熱情。
2.本體論視角:從雙元立場到多元并存
關于本體論存在的討論以及教育本體論內涵的探賾長期以來都是哲學與教育哲學研究者的核心議題之一,教育研究的本體論是要超越現有研究對象從而追求其本源、本真與本性[15],若以求同存異的視角觀察,每個時代的教育研究本體論都以其特定的研究范式建構著教育研究的生態。AIGC這一技術引入的最大突破在于,研究范式中研究主體存在超越了“自身”與“他者”的雙元立場,使得多元研究主體并存,推進多種本體論的融合。依據馬克思主義哲學觀點,研究行為的主體是指有目的、有意識地從事研究相關的實踐活動和認識活動的人[16],有學者強調自身視角與他者視角的研究差異性,也有學者認為教育研究者與研究對象互為主客體,即橫向并列關系,也有學者認為二者不可對立,是二元互動狀態,教育研究是在二元對象“主體-客體-主體”的流動中發生的,教育研究應充分發揮二元主體的能動性[17]。然而,AIGC的應用使得教育研究出現了以智能系統為代表的第三方主體,而這一主體以海量循證研究(Evidence-Based Approach)為基礎,是教育研究領域的集體智慧集結,故而成為研究者的“外腦”,研究范式的雙元主體立場演變為多元并存。
在傳統教育研究中,不同立場的研究者聚焦同一教育事件進行對話難度較大,而AIGC卻可以模擬事實立場與思維脈絡并推送適應性互動反饋,此類研究“外腦”通過對廣泛社會實驗與社會經驗的數據挖掘、歸納與表征,拓寬了教育研究者的視野,提升了研究成果的可遷移性。舉例而言,在研究過程中,閱讀大量相關文獻極為耗時,而AIGC可以幫助研究者將研究文獻集批量處理,生成文獻主旨、元分析結論、論點分類等信息,鼎助學者完成元研究與再研究;又如,在數據處理過程中,該工具可以助力研究者發現探索過程中的抽樣缺失、混雜變量缺陷、格式錯誤或數據偏見等統計問題,對數據有效清洗并評估數據質量,判斷研究的可復現性;再如,AIGC可以依據對輸入文獻的詞匯與句意分析,判斷該領域的現有趨勢與發展態勢,生成新的假設與研究方向并論述所提假設的潛在優勢、風險以及測驗路徑等。教育研究主體從雙元走向多元,有利于促進多元主體建立交集,擴張教育研究的適用場域,推動教育研究成果從潛在價值向現實價值轉變。
3.方法論視角:從兩極分野到徑路整合
當代的教育研究應偏向于思辨研究還是實證研究?這個問題長期存在爭議。袁振國教授曾發文《中國教育需要實證研究》,認為實證研究是當今國際教育研究的主流話語和主要方法,提升教育學術期刊的實證研究比例是當務之急[18]。然而,在20世紀80年代教育研究領域的“范式之爭”后的30年間,解釋主義研究范式在美國教育學博士生論文中呈上升趨勢[19]。我國當代著名教育學家顧明遠先生認為,教育研究的方法論并非單一主義,而是強調多維徑路的整合,包括堅持馬克思主義的指導地位、堅持理論聯系實際的原則、堅持繼承與發展相結合的原則、堅持本土性與國際性相結合的原則這四個層面[20]。相比于范式之爭,如何縮減教育研究與教育實踐之間的鴻溝更為緊迫,能引導研究者走出“自上而下”與“圈內循環”境地的研究方法論即為正解。
基于AIGC的研究范式從新的視角對兩極分野的辯駁困境予以回應,以ChatGPT4.0為代表的工具訓練參數動輒以萬億計數,故而以AIGC輔助教育研究可以成為一種基于大規模事實的研究范式[21]。傳統教育學研究中存在諸多問題,如,研究者常常達不到比率型指標抽樣的最小樣本量,樣本容量是否合乎實驗標準本身存疑;教育學理論龐雜繁復且并非全部具有數學“公理”般的科學性,部分基于經典教育學理論的研究缺乏牢固底座;研究者易陷入學術道德陷阱,可能為了達成假設而去選擇所謂“更適合”的數據分段[22]。與此相對的是,AIGC對教育大數據的采集與應用使得樣本從少量群體轉為大量群體,甚至樣本容量接近總量,以“全景式”觀測結論促進自下而上的規律發現——即研究者不預先假定研究中的事實走向,而是直接產出相關研究結論并洞察發展趨勢。例如,韓國學者調取分析了國家教育信息系統(NEIS)的16萬余名高中生學業管理數據,將教育大數據導入基于機器學習的AI預測模型中,從而高精準度識別出潛在輟學風險類學生并及時干預[23]。在AIGC輔助下,教育研究者可以跳出自身主體視角的局限,以全局性視角審視更大規模的教育事實,豐富的科研輔助功能降低了教育研究者的負荷,有助于吸引更多一線工作者參與科研,且靈活而多元的研究立場拓寬了其研究成果的適用群體范圍,AIGC具備推動教育研究方法論從兩極分野到徑路整合的巨大潛能。
4.價值論視角:從取向沖突到價值共鳴
顧明遠先生始終強調教育價值具有復雜性與全面性特征,教育價值囊括政治、經濟、文化、育人四個維度,教育研究的價值應是厚植于教育價值與特定的社會觀念之上[24]。然而,當前的教育研究中部分學者有明顯的價值立場傾向,在論文或專著中難以平衡價值的四維,其所在時空過多地干擾著研究價值取向的博弈過程,如西方高等教育領域便存在認識論取向與政治論取向的價值沖突等[25]。教育研究的四維價值立場是否應有所偏向?既有學者秉持著價值中立、理性客觀的教育研究觀念,也有學者提出教育研究者難以完全超脫其既有主觀偏見,基于所在社會場域預設價值立場導致的價值權重偏頗是情理之中,進而造成了秉持差異觀念的教育研究者存在論斷沖突、取向矛盾的現實,無形中削弱了教育研究對于教育變革的有效賦能。
以ChatGPT為代表的AIGC依憑Common Crawl、WebText2、Books1、Books2以及Wikipedia等全球語料庫,為研究者提供的多元文化背景下的教育研究視角,有利于研究者以更廣闊視野審視研究成果的多維價值,促進價值觀念的分野到共識。在文化共識方面,文化轉型作為我國社會現代化轉型的核心組成之一,由民主政治、市場經濟和開放文化等要素構成的現代文化多樣態景觀逐漸成型[26],教育研究者有責任從更加開放、更加宏大的視野審視本土化教育問題,并積極推動本土教育優質經驗的對外傳播與復刻。在價值取向方面,面對教育學術領域既有的學術功利化、過程快餐化、評價績效化以及成果低轉化率現狀[27],AIGC成為一條攪動原有市場的鯰魚,當低價值的學術研究可以被批量復制和代替,研究者不得不審慎反思研究的價值,在功利主義傾軋的價值困境中借助技術變革契機重塑與強化教育研究的價值標準。
正如AI是一把“雙刃劍”,AIGC對于教育研究的影響同樣存在諸多“創造性毀滅”的效果[28],且該類負面效果貫穿在工具應用的全流程中,如專業性欠缺造成的技術本體危害,技術濫用造成的信任危機,技術依賴造成的成果異化,通用化設計造成的安全與倫理隱患,以及信息傳播造成的話語霸權擴張等等,構成了AIGC傳播與應用的壁障。
(一)知識存偽:AIGC生成知識的真實性與合法性挑戰
柏拉圖所提出的知識三大要素——真實性、可證性與可信性是公認的知識判定基準,然而,在技術改變知識獲取路徑的同時也帶來了新型信息對于知識真實性與合法性的挑戰。知識的真實性是指其源于真實而可靠的信息,建立在客觀事實和合理推理的基礎上,因而具有可信性與可驗證性;知識的合法性是指其合乎公認的社會倫理與道德準則,符合傳播的正當性與規范性[29]。然而,在基于AIGC的教育研究中,知識“黑箱式”的生成流程會在三個層面遭遇質疑,一是,極大規模的語料庫內容來源復雜且缺乏分類標準,故而其產出可能是類似低質量平臺討論內容的橫向合并,準確性或存偏頗[30];二是,教育研究過程易涉及學習者隱私,如“建檔立卡”類未成年人材料等,此類信息在公開數據系統中存在真空[31];三是,基于AIGC收集數據或者建立AIGC的教育研究數據庫時會面臨隱私泄露的風險。
在《什么知識最有價值》一書中,赫伯特·斯賓塞(Herbert Spencer)曾對各類知識進行了價值比較,構建出層級化的課程知識體系,認為判斷知識價值的關鍵不是價值的有無,而在于知識的“比較價值”[32]。AIGC是否可以為教育研究者生成相比原有研究方式更為真實與合法的價值?目前在技術層面還存在重重桎梏,如系統算法在數據容量偏低時易發生過度擬合,導致生成系統概括能力降低,增加結果可變性等等?;谏鲜鲈颍蒲蓄I域中對于ChatGPT類工具的輸出結果持審慎態度,如Nature雜志提出規定,任何大型語言模型工具都不會被接受作為論文署名作者且不建議直接使用問答結論[33],部分SCI雜志會對研究論文進行ChatGPT篩查,等等。AIGC生成知識的低可信性及其背后的技術局限性,已成為其臂助學術研究的核心壁障。
(二)技術壁壘:AIGC數據庫的區域與群體局限性
科學家巴斯德曾說:“科學無國界,但科學家有國界”[34],教育技術領域亦同此理。AIGC各類子數據集本身存在區域傾向性,國別差異、民族差異使得其結論產出不可等量齊觀,技術創造者的文化傾向與價值偏好可能會造成部分區域的研究主體失語。對于許多批判教育學者而言,知識無論是人類建構還是技術生成,都是基于建構者意圖且承載著明確的價值屬性,同理,AIGC在知識生產的數據來源、樣本比重、數據格式等方面都凸顯著技術掌控者的價值傾向,以其作為研究主體之一會造成研究偏倚[35]。在數據來源方面,數據架構和樣式的差異會限制庫間合并,數據庫的訪問受到特許證或收費的限制進而減少使用者數量,如各區域教育主管部門財政經費支出預算的透明度等,所以AIGC存在區域局限性[36]。在樣本比重方面,數據來源區域的對應樣本容量同樣具有樣本差異,如部分數據庫可能采集老齡人口比例較高而部分庫中青少年人口比例占優,教育研究中不應混淆此類差異。在數據格式方面,各數據庫對變量的定義或測量方式差異會導致混雜變量的出現與特定變量的缺失,如不同國家與組織對兒童與青年兩類群體的年齡劃分差異等。所以,數據、樣本與庫間聯結中的技術壁壘,正在強化AIGC等技術的區域與群體局限性,進而造成研究主體的不公與學術視角的狹隘,樹立起主客體之間的交互屏障。
(三)應用隱患:AIGC數據流轉的安全與倫理桎梏
政府和教育組織對于技術在安全倫理層面潛在隱患的考量,掌握著AIGC在教育研究領域的“一票否決權”。在傳統的教育研究中,由于研究者需考慮研究范式的公平正義性、利益風險、傷害風險與隱私泄露風險等,所以接受研究者常會簽署“知情同意書”[37]。然而,AIGC的開放時空廣度與數據邏輯縱深都將其邊界無限擴張,工具應用中默認了數據的開放性,因此該工具在教育領域的落地需思量安全與倫理層面的深度適配[38]。在安全方面,一是,AI算法依托未經檢驗的大數據訓練,存在用戶個人數據泄露的風險;二是,AI推薦路徑可能遭遇惡意數據或虛假數據的引導,在對抗性攻擊中產生錯誤導出;三是,機器學習模型的訓練數據可能遭遇攻擊而模型中毒,造成安全漏洞,如展示虛假信息、傳遞釣魚鏈接或發起網絡攻擊等;四是,AI系統可能因操縱或攻擊而采集未經授權的用戶信息牟利,如校園財政系統或師生身份信息等。在倫理方面,一是,復雜的AI模型難以讓使用者通過復雜的手冊理解其工作機理與隱患,使得AI的危害或偏見難以展示,導致使用者陷入非透明劣勢;二是,AI系統可能違規收集生物識別數據、健康數據與行為偏好等個人信息造成隱私侵犯;三是,數據庫已有偏見會在問答傳播中被強化以至于思維固化,如提供文化教育時可能忽略使用者的民族差異與地域差異,引導后者接納網絡定式。誠然,諸如“自殺”“犯罪”“辱罵”等典型的負面議題,ChatGPT等工具已改良推薦算法并遵循道德規范,但其在教育領域延伸中,仍面臨著數據分析需“致廣大”而風險防范需“盡精微”的深層挑戰,挖掘出AIGC應用中正負效益博弈的“納什均衡”解。
(四)本土失語:AIGC全球化擴張隱含的話語霸權
我國近現代教育研究自產生起即被貼上了“舶來品”“西學東漸”等標簽,本土教育研究話語體系的缺失已成為燃眉之急[39]。在社會數字化轉型趨勢下,加速的全球化進程帶來的區域文化沖突愈演愈烈,教育理念與研究范式在數字技術加持下呈現出新的競爭樣態。ChatGPT等工具表面呈現出無國界的泛化視角,但部分涉及社會觀念的交互仍具有深刻的“文化烙印”,如,當被問及人類有幾種性別時,其回答中包含“人們越來越認可和接受非二元和性別多樣化的身份。非二元個體并不完全認同男性或女性,可認同為兩種性別的組合”等特定社會情境下的典型話語。此類意識形態的無形傳播,無疑是對于技術落后國家或地區的潛在的文化侵襲,彰顯著技術先行國家的文化話語霸權。在我國教育的全球化進程中,一方面,要注重尖端技術的爭鋒,避免美國AIGC技術壟斷造成的文化浸染、倫理沖突、隱私泄露等問題,以及其引發的教育研究理念偏頗、視角錯位,另一方面,應擴大文化傳播途徑,利用好AIGC這一重要知識中介,完善我國的自主知識體系建設與文化傳播。在構建中國特色教育話語體系的進程中,教育研究者不應只是“取經人”,也應勠力成為寫經人與傳經人,加速推動我國教育影響力與綜合國力的匹配與平衡。
教育的數字化轉型是時代抉擇,AIGC類工具也必將與教育研究從淺層耦合步入深度互嵌,研究范式與技術的聯結、融合、反思、糾偏與創新是實現技術賦能的必經之路,面對AIGC在知識論、本體論、方法論與價值論等維度的發展桎梏,應在技術降檻、群體普及、專技專用、話語建設等方面綿綿用力,久久為功。
(一)技術降檻:推進“AI+教育”領域知識權力公平
在當下的全球治理中,相比于政治權威而言,知識權力更能凝聚共識并發揮國家或國際組織的影響力,而后者依托于科技、理性、社會認同、專家等多重要素[40]。AIGC生成知識的真實性與合法性桎梏,其深層原因在于各群體的知識權力不公,為推進知識平權,可以從技術準入、工具應用與結果呈現三個維度實現技術降檻。在技術準入方面,GPT4.0的月租對很多普通研究者來講并不低廉,且使用存在重重限制,國內的諸多大模型目前尚未成熟,這在可用性方面抬高了國內研究者的門檻,而且各院校的數字化轉型良莠不齊,校園硬件設施對于教育研究者在“AI+教育”領域的探索同樣存在束縛,應從上至下加速技術準入層面的資金支持。在工具應用層面,AIGC內部對大量研究工具的富集,增加了教育研究者掌握該工具的難度,以至于部分網站專門講解如何應用該類工具高效率地從事科研工作,對于此類技術素養造成的溝壑,國內如百度旗下文心一言、中科院的紫東太初等AIGC平臺既應努力促成與ChatGPT、Bard等軟件的合作共享并完成本土化升級,也應將其富集的工具模塊以簡明化、可視化等方式向使用者呈現,降低操作門檻。在結果呈現方面,AIGC類工具對輸入數據格式有嚴格要求且結果產出形態繁復,應從輸入端拓寬AI所能識別的數據或公式的文件類別與格式類別,并從輸出端拓寬推薦路徑,依據研究者所需來呈現或折疊數據統計分析過程,并鼓勵科研工作者對工具糾錯反饋,便于工具迭代,增強工具的可用性與易用性。
(二)群體普及:增速教育研究數字化空間的建設進程
AIGC對于豐富教育研究中研究視角與客體的賦能呈現出一體兩面的效果,既有突破單一主體立場與固定思維定式、增進教育事實理解的優勢,但也降低了研究者通過田野調查等方法深挖研究真實性、創新性的需求。造成這一變革困境的歸因主要為兩點,一是教育數字化轉型進度不一、質量良莠不齊甚至割裂嚴重,校園數字化成熟度的低層次導致部分教育研究者“巧婦難為無米之炊”,只能盲從AIGC的公開數據庫開展研究,降低研究結果對其區域群體的契合度;二是工具帶來的所謂更廣闊、更多變的立場與極致的分析效率,無形中引領著數據依賴、技術依賴的風潮,與強調研究者親身進入實地現場的具身研究理念相違背,造成“書齋式”的離身研究景況。
對于前一類歸因,政策制定者與校園管理者應考慮將教育研究設施的數字化列入數字化轉型的體系清單,不應偏重于教學基建與治理基建,也應關注到從課堂到課外、線下到線上、校內到政校企共同體全方位的數字化教育研究空間建設,并學習企業管理中生產線升級的改革經驗,建立研究者與生產系統之間人機適應的訓練體系。對于后一類而言,教育研究者應謹記習近平總書記多次強調的“撲下身子、沉到一線”的調研理念[41],準確把握教育服務對象的基層事實,避免公共數據庫求大求泛帶來的學術成果低適切性,同時,期刊也應增加針對AIGC生成文本識別的反工具篩查,避免批量化生產的低質量論文“劣幣驅逐良幣”。只有數字化教育研究情境得以有效普及,研究主體的技術權力趨向平衡,充分發揮出研究主體的身心協同作用,推動教育研究成果走向多視域、跨層次、重理解、可遷移的價值圖景。
(三)分級定界:創建科研領域的輕量化專用型語料庫
遵循教育安全與教育倫理關乎著教育研究的底線,面對AIGC中數據流轉與內容倫理方面的桎梏,可以參照許多國家對電影、書籍、音樂等文化作品的分級舉措,如美國電影協會制定了G、PG、R與NR等詳細分類裁定標準,設定AIGC類工具服務教育科研的等級與邊界,在開發端而不是用戶端去防范安全隱患與倫理隱憂。創建科研領域的專用化、強安全語料庫,應在政策、技術、制度三個層面為技術應用提供支撐。在政策層面,政府監管遠比行業自律更加有效,因為產品自律往往與其利益發生沖突。中國國家網信辦發布了《生成式人工智能服務管理辦法(征求意見稿)》,要求AIGC建設者對產品的預訓練數據、優化訓練數據來源的合法性與市場應用的合法性負責,然而該政策對教育研究等特殊領域語焉不詳,可以參照歐盟《人工智能法案》(The AI Act)等政策,采取基于風險級別對AI系統分而治之的監管路徑。在技術層面,AIGC的訓練量的龐雜有目共睹,如GPT-3的參數量高達1750億[42],但是大量類似新聞報刊、網絡討論等來源對于提升其科研方面的科學性水平反而不利,因此創建“輕量級”專用語料庫可有效降低噪音數據比率。在制度層面,對于科研專用型語料庫,應對數據傳輸路徑嚴格管控,將終端數據尤其是倫理相關的涉密數據先交由獨立部門加密,再將二次數據匯入庫中,為涉密類數據流轉劃分界域。在政策、技術、制度的合力支持下,輕量級大語言模型必將依憑其價格低廉、技術降檻、高契合度等優勢,加速教育科研中AIGC的應用普及,建立更完備的數據安全與倫理規范屏障。
(四)話語建設:支持本土AIGC平臺的功能迭代與國際傳播
新一輪的AI革命加速了教育全球化進程,能否在激烈碰撞的意識形態紛爭中樹立國家話語權,關乎旗幟、關乎道路、關乎國家政治安全以及人心向背[43]。基于AIGC平臺的意識形態話語,是平臺體系依據數據算法與內容推薦路徑對語料庫輸出內容加以思維建構的結果,算法背后的價值觀念、思維模式與闡釋路徑等因素綜合決定了平臺輸出的話語傾向性。當前,百度的文心一言、阿里的M6預訓練模型、騰訊的文涌、華為的盤古大模型等雖已如火如荼,但在應用效果方面仍難以望ChatGPT項背,故而對于本土話語的國際傳播價值未能彰顯。
針對此,我國應出臺一攬子政策,支持與激勵本土AIGC類產品盡快完成四個關鍵層級的迭代:一是持續優化NPL模型,實現其AIGC對于多語言、跨語言處理能力的躍遷,臂助中文語境的教育經驗跨文化傳播;二是強化應用引導,并建立類似中科院學術專用版的AIGC交互語言引導模板,以便學術科研成果安全性與科學性得到技術層次的保障,降低科研工作者的應用門檻;三是功能拓展,如增設AIGC對于協作式文件編寫與項目管理的支持等內嵌功能,借鑒ChatGPT作為加載控件接入Microsoft Office、Azure與Teams等軟件的先例;四是強化對于圖像或視頻中用戶情緒識別判斷的精準度,進而與眼動技術、情緒感知等多模態技術形成聯動等等,豐富工具助益科研的多場景應用價值與互聯互通本領。在技術產品力過硬的基礎上,應當通過各類國際組織與非國家行為體擴大對于我國AIGC產品的宣傳推廣,自覺對抗西方文化價值覆上“科學外衣”借技術的全球傳播進行“精神馴化”甚至“數字殖民”等潛在危機,推廣基于大語言模型的承載兼具中國特色與智能特征的意識形態話語譜系,掌握大變局之中的話語主動權。
長遠來看,AIGC作為人工智能領域更智慧、更聚合的交互工具,必將成為變革教育研究范式乃至賦能教育高質量發展的有力抓手,但近觀當下,AIGC的相關應用對于教育研究而言仍存在諸多桎梏與風險,需要破除其應用過程中的知識真偽、技術壁壘、安全倫理挑戰與信息話語霸權等藩籬。而且,在全球數字化轉型共識與資本推動下,超級版本的AIGC可能會超出預期地影響全球社會的各個領域,其所攜的種種危機也極可能轉入現實、成為時代洪流。全球競爭固不易,變革還需慨而慷,既已有在ChatGPT珠玉在前,我國的AI相關企業與科研工作者應加速大語言模型領域的探賾索隱,增進技術進階與研用結合,為教育研究范式創新注入活力,臂助中國教育現代化行穩致遠。
參考文獻:
[1] 楊緒輝.從教學樣式到學習范式:人工智能環境下學習的通用設計轉化[J].中國電化教育,2021,(4):59-66.
[2] 汪基德,王開.關于教育研究范式分類問題的探討[J].教育研究與實驗,2021,(3):65-70.
[3] 王洪才,田芬.“證實規律”與“闡釋意義”:人工智能時代教育研究范式的兩種旨趣[J].西北師大學報(社會科學版),2021,58(3):84-93.
[4] 馬鳳岐,謝愛磊.教育知識的基礎與教育研究范式分類[J].教育研究,2020,41(5):135-148.
[5] 袁磊,徐濟遠等.AIGC時代的數智公民素養:內涵剖析、培養框架與提升路徑[J].現代教育技術,2023,33(9):5-15.
[6] Van Dis E A M,Bollen J,et al.ChatGPT:Five priorities for research [J]. Nature,2023,614(7947):224-226.
[7] [美]托馬斯·塞繆爾·庫恩.金吾倫,胡新和譯.科學革命的結構(第四版)[M].北京:北京大學出版社,2012.157.
[8] Kuhn,T.S..Second Thoughts on Paradigms [M].Urbana:University of Illinois Press,1974.
[9] Hey T.,Tansley S.,et al.The fourth paradigm:Data-Intensive Scientific Discovery [J].Proceedings of The IEEE,2011,99(8):1334-1337.
[10] 祝智庭,沈德梅.基于大數據的教育技術研究新范式[J].電化教育研究,2013,34(10):5-13.
[11] 鄧仲華,李志芳.科學研究范式的演化——大數據時代的科學研究第四范式[J].情報資料工作,2013,(4):19-23.
[12] Ramos L,Marquez R,et al.AI’s next frontier:The rise of ChatGPT and its implications on society,industry,and scientific research [J].Ciencia E Ingenieria,2023,44(1):131-148.
[13] 何哲,曾潤喜等.ChatGPT等新一代人工智能技術的社會影響及其治理[J].電子政務,2023,(4):2-24.
[14] 劉旭東.回到原點:論教育的學術傳統[J].教育研究,2013,34(8):10-15.
[15] 龔善要.教育場景中情感計算的應用風險及其法律規制[J].復旦教育論壇,2022,20(6):40-46.
[16] 王志軍,陳麗.聯通主義:“互聯網+教育”的本體論[J].中國遠程教育,2019,(8):1-9+26+92.
[17] 劉秀麗.主體論視野下的高校共青團工作形勢及對策探析[J].中國青年研究,2014,(4):45-48.
[18] 張耀燦.現代思想政治教育學[M].北京:人民出版社,2001.190-191.
[19] 袁振國.中國教育需要實證研究[J].中國教育學刊,2017,(2):3.
[20] Munoz-Najar Galvez S,Heiberger R,et al.Paradigm wars revisited:A cartography of graduate research in the field of education(1980-2010) [J]. American Educational Research Journal,2020,57(2):612-652.
[21] 石中英.回到教育的本體——顧明遠先生對于教育本質和教育價值的論述[J].清華大學教育研究,2018,39(5):4-11.
[22] 王景,李延平.ChatGPT浪潮下拔尖創新人才的培養:價值意蘊、現實隱憂與生態重塑[J].中國電化教育,2023,(11):62-71.
[23] 崔俊富,鄒一南等.大數據時代的經濟學研究:數據驅動范式[J].廣東財經大學學報,2016,31(1):4-12.
[24] Chung JY,Lee S.Dropout early warning systems for high school students using machine learning [J].Children and Youth Services Review,2019,96:346-353.
[25] 顧明遠.顧明遠教育演講錄[M].北京:人民教育出版社,2014.167.
[26] 董云川.高等教育研究的角色與話語[J].湖南師范大學教育科學學報,2022,21(5):62-67.
[27] 徐祖勝,楊兆山.多元文化背景下教育改革的文化立場分析[J].理論月刊,2019,(8):146-153.
[28] 魯子簫.知識的智育困境與德性本質——面向智能時代的思考[J].中國電化教育,2022,(12):44-52.
[29] 姜華,王春秀等.生成式AI在教育領域的應用潛能、風險挑戰及應對策略[J].現代教育管理,2023,(7):66-74.
[30] 方明寶,程志宏.課程知識選擇的合法性批判[J].淮北師范大學學報(哲學社會科學版),2022,43(1):86-92.
[31] 余鵬,李艷.基于教育大數據生態體系的高校智慧校園建設研究[J].中國電化教育,2018,(6):8-16.
[32] 鄭慶華.人工智能促進智慧教育,提升人才培養質量[J].高等工程教育研究,2019,(4):128-132.
[33] 鐘啟泉.“學校知識”與課程標準[J].教育研究,2000,(11):50-54+68.
[34] 吳砥,李環等.人工智能通用大模型教育應用影響探析[J].開放教育研究,2023,29(2):19-25+45.
[35] 鄧陽,彭琳茜.凸顯科學文化實踐的科學教學[J].教育研究與實驗,2023, (2):75-83.
[36] 孫婧,駱婧雅等.人工智能時代反思教學的本質——基于批判教育學的視角[J].中國電化教育,2020,(6):16-21.
[37] 彭紅超,姜雨晴.多模態數據支持的教育科學研究發展脈絡與挑戰[J].中國遠程教育,2022,(9):19-26+33+78.
[38] 馮雨奐.ChatGPT在教育領域的應用價值、潛在倫理風險與治理路徑[J].思想理論教育,2023,(4):26-32.
[39] 李姍姍,于偉.本土化信念:我國教育理論本土化之前提性動因[J].東北師大學報(哲學社會科學版),2009,(6):184-191.
[40] 陳一峰.全球治理中的知識權力及其法律規制[N].中國社會科學報,2022-09-14(04).
[41] 本報評論員.調查研究當“沉到一線”[N].新華日報,2023-10-27(01).
[42] Stokel-Walker C,Van Noorden R.The promise and peril of Generative AI [J]. Nature,2023,614(7947):214-216.
[43] 包崇慶,柏路.人工智能時代主流意識形態話語權建設的多維審視[J].傳媒,2023,(13):93-96.
作者簡介:
荊洲:在讀博士,研究方向為高等教育治理、教育數字化轉型。
楊啟光:教授,博士生導師,研究方向為教育原理、比較教育。
AIGC Enabling Paradigm Change in Educational Research:Mechanisms, Risks and Countermeasures
Jing Zhou, Yang Qiguang
College of Education, Fujian Normal University, Fuzhou 350007, Fujian
Abstract: In his book The Structure of Scientific Revolutions, Kuhn argues that the essence of scientific revolutions is paradigm shift rather than knowledge stack. As the “crown jewel” of the new round of AI revolution, artificial intelligence generated content (AIGC) expands a new path for upgrading the paradigm of educational research by virtue of its ability of highly intelligent interaction, creative generation, and complex data processing, etc. This study is based on the functional mechanism of AIGC and the context of research assistance. Based on the functions and research-assisting contexts of AIGC, this study elaborates the enabling logic of the tool from four dimensions: knowledge theory, ontology, methodology and value theory. However, as a disruptive technology, the research application of AIGC still faces the problems of questioning the authenticity and legitimacy of knowledge generation, the limitations of service objects, the dangers of data security and ethics, and the violation of information-bearing ideologies, etc., and the technology empowerment strategy should be formulated from four dimensions: at the tool level, to promote the fairness of knowledge power of AI for education by technological threshold reduction; at the infrastructure level, to expand the education research digital space popularization; at the security level, create a lightweight and dedicated corpus in the field of scientific research; at the discourse construction level, support the functional iteration and international dissemination of the local AIGC platform.
Keywords: digital transformation of education; disciplinary research paradigm; artificial intelligence generated content; human-intelligence collaboration
責任編輯:李雅瑄