








摘要:當前,以ChatGPT為代表的人工智能生成內容(Artificial Intelligence Generated Content,AIGC)在教育領域引起的變革受到各類專家學者的廣泛關注,然而較少有研究從網絡問答社區層面探討公眾對AIGC在教育中影響及應用的關注與認知。為此,文章通過隱含狄利克雷函分布(Latent Dirichlet Allocation,LDA)主題建模與時間序列分析,對2022年12月6日~2024年4月9日知乎平臺中與AIGC、教育等主題相關的問答與文章進行了探究。LDA主題建模結果顯示,公眾對AIGC在教育中影響及應用的關注與認知主要集中在教師教學與學生課堂學習面臨的挑戰、AIGC對學術倫理帶來的挑戰、AIGC對學生批判性思維和跨學科學習能力的影響,以及中外大學生使用AIGC完成論文作業情況的對比等方面。時間序列分析結果顯示,公眾對AIGC在教育中影響及應用的關注與認知在2023年2月~3月達到高峰,且主要關注點在AIGC對學生學習的影響方面。文章通過研究,旨在為教育領域更好地適應并應對AIGC帶來的變革與挑戰提供參考。
關鍵詞:AIGC;ChatGPT;教育;網絡問答社區;關注與認知
【中圖分類號】G40-057 【文獻標識碼】A 【論文編號】1009—8097(2024)10—0042—11 【DOI】10.3969/j.issn.1009-8097.2024.10.005
一 提出問題
隨著科學技術的不斷發展,以ChatGPT為代表的AIGC正在深刻改變著教育領域。其通過大規模語言模型模擬人類語言,實現自然交互,為個性化教學提供了新的技術支撐,如果使用得當,將是一種變革性教育工具,會使教育發生巨大的變化[1][2][3]。因此,自ChatGPT發布以來,越來越多的專家學者開始關注AIGC對教育領域的影響和潛在應用,而隨著ChatGPT 4.0的發布,社會對AIGC在教育中影響及應用的關注與認知展現出新的變化和趨勢,教師、學生、專家以及廣泛的社會公眾對此表達了各自的看法和認識。國外研究發現,教師對ChatGPT的接受度較低,主要擔心其在學生學習過程中存在的負面影響,學生認為ChatGPT雖然能夠給出結構良好的回答,但質疑其準確性,公眾對ChatGPT在教育中的應用則表現出多元化的態度[4][5][6]。而國內更多關注專家層面的看法,聚焦于ChatGPT教育應用對教育的可能影響及應對策略、ChatGPT在教育領域的應用及其挑戰、AIGC時代拔尖創新人才培養的重要性和面臨的挑戰、ChatGPT應用于高等教育德育領域的可能性和局限性,以及ChatGPT對教師專業發展的影響[7][8][9][10][11]。通過對知網相關文章的檢索、梳理與分析得到的“ChatGPT+教育”相關論文發表趨勢(如圖1所示),可以看出,自2023年1月以來,該主題的學術論文顯著增加,直到2024年7月才呈現出顯著下降的趨勢,這表明在AIGC發展期間學術界對該主題一直保持著高度的關注。在眾多的研究中,雖然有學者已經探討了社會公眾對“ChatGPT+教育”的看法與態度,但僅限于2022年底至2023年初[12]。考慮到公眾對AIGC在教育中影響及應用的關注與認知是逐步發展的,同時網絡問答社區的問答機制能引導深入討論,提供比一般社交媒體更具價值的觀點。因此,本研究嘗試利用Python爬取網絡問答社區中與“AIGC+教育”相關的問題、回答與文章,通過LDA主題建模和時間序列分析探討網絡問答社區公眾(下文簡稱“公眾”)對AIGC在教育中影響及應用的關注與認知,以期為教育領域更好地適應和應對AIGC帶來的變革與挑戰提供參考。基于此,本研究提出以下問題:①公眾對AIGC在教育中影響及應用的主要關注點有哪些?他們對其潛在影響有哪些擔憂?②公眾對AIGC在教育中影響及應用的認知是什么?有什么特點?③隨著時間的變化,公眾對AIGC在教育中影響及應用的關注與認知有哪些變化趨勢?
圖1 "“ChatGPT+教育”相關論文的發表趨勢
二 研究設計
1 數據來源
知乎作為中國領先的網絡問答社區,憑借高質量的數據和廣泛的公眾參與度,匯集了來自各行各業的知識分享者,其中30歲以下的年輕人作為主體用戶,提供了大量深入多元的內容。知乎與其他互聯網平臺不同,其內容主要在問答場景中產生和流通,通過獨特的問答討論機制,引導用戶深入探討特定議題,在用戶群體和討論深度上具有一定代表性[13][14]。因此,本研究收集了2022年12月6日~2024年4月9日期間(研究期間的平臺問答起止時間)知乎這一網絡問答社區中關于AIGC對教育影響及應用的問答和文章進行研究并展開討論。
2 數據收集
本研究以“生成式人工智能”“AIGC”和“ChatGPT”為主題關鍵詞,結合“教育”“教學”“教師”“學生”“學校”“課堂”“科研”和“學術”等詞匯,使用集搜客(GooSeeker)工具在知乎平臺采集了所有相關問答和文章的鏈接。GooSeeker是一個用戶友好的網絡爬蟲,允許非編程用戶抓取網頁信息,同時遵守網站規則和法律,保證數據采集的合法性。《數據安全管理辦法(征求意見稿)》第十六條規定,網絡運營者在不干擾網站正常運行的前提下,可以自動化訪問收集網站數據,但不能超過網站日均流量的三分之一[15]。考慮到知乎沒有開放API,本研究使用Python針對問題、回答、問答發布時間、文章標題、內容、發布時間等進行爬取,最終收集的數據量為4449條,遠低于知乎日均流量的三分之一。同時,本研究遵循目標網站的robots.txt文件規定,避免訪問敏感路徑(如/login、/logout等),確保數據獲取的合規性;爬蟲程序設計遵循網站允許的參數和訪問方式,設置合適的請求間隔以減輕服務器負載,未突破任何技術性訪問控制措施。
3 數據處理
本研究將獲取的數據劃分為“問題與文章標題”(QT)和“回答與文章內容”(AC)兩類。關注是指公眾對某一議題或事件所表現出的興趣和重視程度,反映了人們認為什么是重要的,什么是值得討論和思考的,因此QT揭示了公眾關注的興趣和熱點[16]。認知是指個體對AIGC在教育領域應用的心理表征和信息處理過程,反映了個體對AIGC技術的深入理解,因此AC揭示了公眾的認知水平和理解深度[17]。在最終獲取的數據中,QT類別包含792條記錄,共計21463字符;AC類別包含3657條記錄,共計5669443字符。為保證分析的準確性和有效性,本研究對收集的數據進行了預處理和清洗[18]:首先,利用Python的Pandas庫對收集的數據進行去重處理,以免由于數據重復導致主題建模結果不準確;接著,刪除與“AIGC”“ChatGPT”“教育”等關鍵詞不相關的數據,并使用Jieba庫對數據進行分詞,將長文本劃分為短詞匯。同時,移除表情符號、網址鏈接、標點符號和特殊字符,并采用哈爾濱工業大學的中文停用詞表去除常見但冗長的詞匯。最終,獲得507條QT數據和1466條AC數據,分別包含2701和99249個詞語。此外,本研究還為每條數據添加了時間戳,并統計了QT和AC文本中每月出現頻率較高的三個詞匯及其頻數。
4 研究方法
為分析公眾對AIGC在教育中影響及應用的關注與認知,本研究采用LDA主題建模和時間序列分析來探究AIGC在教育領域內的影響及其在公眾話語中的演變。LDA主題建模是一種基于概率模型的文本分析技術,能夠從大量文本數據中識別出隱含主題,揭示公眾討論的潛在話題模式,對于理解難以直接觀察到的話題結構至關重要[19]。時間序列分析是一種統計方法,用于分析和解釋隨時間變化的數據序列,能夠揭示數據隨時間變化的趨勢和模式,幫助識別和預測討論的時間動態[20]。結合上述方法,可以分析與AIGC相關的教育討論主題及其隨時間的發展,從而深入了解公眾討論的趨勢和周期性模式,全面捕捉AIGC在教育領域應用的公眾關注和話語演變。
5 數據分析
本研究采用變分貝葉斯推斷的LDA算法進行主題建模,該算法是gensim庫中LdaModel的默認方法,適用于大規模文本數據,能有效避免過擬合。在模型訓練前,本研究使用Deveaud等[21]提出的基于詞分布自動估計潛在概念數量的方法,計算最佳主題數量:首先通過Bootstrap抽樣創建多個子數據集,并在Gensim庫中訓練多個LDA模型,主題數從5~50不等;然后,利用Scikit-learn庫計算模型間的Jaccard相似度(J=1.0),確定最佳主題數量為5。得到最佳主題數后,就可以針對QT和AC分別訓練深度LDA模型,并使用pyLDAvis庫將結果可視化。需要注意的是,LDA主題建模雖能有效揭示文本集合中的潛在主題,但由于忽略了詞序和上下文,有時主題含義不夠明確,因此需通過主題解釋和驗證方法來進一步分析其輸出[22][23]。這種方法將算法的客觀性與研究者的深度理解相結合,需要通過多名研究者的獨立審閱和討論,確保主題解釋的準確性和語義連貫性[24]。因此,研究團隊對相關數據進行了瀏覽和深入討論,具體步驟如下:三名研究者獨立審閱用于進行LDA主題建模的相關文本樣本;根據主題建模得出每個主題的核心內容和可能的解釋并進行討論;通過多輪討論,對主題的命名和解釋達成一致意見。
此外,本研究基于每條數據的時間戳,利用Python的Pandas和Matplotlib庫對數據進行了時間序列分析:首先,按照日期對數據進行重采樣,統計每日的QT和AC數量,生成時間序列圖,并在圖中標注與AIGC技術發展相關的重要日期(如GPT-4的發布時間、國內主要AIGC產品的發布時間等)。然后,將時間戳按照季度進行劃分,結合詞頻統計,利用Python繪制詞頻熱力圖,從而直觀展示公眾關注與認知的時間變化。
三 結果與討論
1 LDA主題建模結果
通過LDA主題建模,本研究得到了QT和AC的網絡交互圖,如圖2、圖3所示,其中主題間距離的氣泡大小代表主題的相關程度,氣泡間的距離反映主題相似性,氣泡中的數字則代表主題序號。在圖2(a)中,1表示LDA主題建模網絡交互圖中所選的主題,其相關的前30個關鍵詞如圖2(b)所示,可以看出:主題1的關注點集中于ChatGPT對傳統教育的挑戰,關鍵詞包括“ChatGPT”“教育”“學習”“教師”。而在圖3中,主題1的關注點則集中在ChatGPT對教育變革的影響,關鍵詞包括“ChatGPT”“學習”“論文”“文章”。
通過主題解釋和研究者的驗證,最終得到如表1、表2所示的主題分類,隨后計算主題連貫度(Topic Coherence,TC)為0.86。TC值可以衡量主題中高頻詞之間的語義相關性,反映了主題的連貫性和可解釋性[25]。表1、表2分別展示了QT和AC數據集的主題、主題標簽、10個高頻率特征詞以及相應的文本示例。為了確保主題的準確性和實際相關性,本研究基于10個高頻率特征詞閱讀了原始上下文的文本數據,為每個主題指定一個切合其內容的主題標簽,最終總結出每個主題的含義并進行舉例。
(a)主題間距離 (b)主題1相關的前30個關鍵詞
圖2 "QT的LDA主題建模網絡交互圖
(a)主題間距離 (b)主題1相關的前30個關鍵詞
圖3 "AC的LDA主題建模網絡交互圖
2 公眾對AIGC在教育中影響及應用的關注分析
如表1所示,QT數據集主要有5個主題:①AIGC(如ChatGPT)對教師教學帶來什么挑戰,AIGC如何變革課堂學習;②AIGC(如ChatGPT)對中美大學生的論文作業產生什么影響;③ChatGPT如何幫助學生高效學習英語和編程;④AIGC(如ChatGPT)給高等教育的學術倫理帶來哪些挑戰;⑤AIGC(如ChatGPT)如何輔助中小學教師進行課程設計。從這些主題可以看出,公眾更加關注ChatGPT對教師職業和課堂學習的影響及應用。其中,留學生關注其在中美論文寫作中的應用差異;教師群體關注其教學輔助作用,尤其是在英語和編程學習中的應用以及對個性化教學的支持。此外,還有部分公眾對AIGC可能帶來的負面影響表示擔憂,特別是學術倫理方面的問題。不少人質疑,隨著ChatGPT這類AIGC工具的普及,學生可能會利用其完成論文和作業,導致學術不端行為的增加。例如,有人提出:“國內高校已有學生用ChatGPT寫論文,‘杰作’快趕上老師的水平,高校要如何防止‘AI作弊’?”,這種擔憂源于AIGC強大的生成能力,使學生可以輕易獲得高質量的文本,傳統的抄襲檢測工具難以識別AI生成的內容[26]。因此,這不僅加深了教育領域在學術誠信方面面臨的挑戰,還限制了學生批判性思維的發展。這些挑戰在Iqbal等[27]的研究中也有所體現,該研究分析了教師對ChatGPT在學生學習過程中可能產生負面影響的擔憂,如對自主學習能力的侵蝕、學術不端行為的增加等。此外,Extance[28]在Nature發表的文章中也探討了將大型語言模型(如ChatGPT)應用于教育領域的挑戰,表達了對AI作弊、過分依賴AI快速回答以及AI提供信息的準確性不足等擔憂。
綜合來看,公眾對AIGC在教育中的影響及應用的關注點主要包括兩個方面:一方面,公眾關注AIGC技術對教師職業發展和課堂教學的輔助作用,以及在英語和編程學習、個性化教學中的應用。同時,AIGC能夠提升教學效率、豐富教學資源,并且有助于滿足不同學生的學習需求,從而促進教育質量的提高。另一方面,公眾也關注AIGC可能引發的學術倫理問題和對學生發展的負面影響,以及AIGC技術在教育應用中的信息準確性和可靠性問題。由于AIGC可能生成不準確或者帶有偏見的信息,學生在未經核實的情況下使用這些內容,可能會被誤導和引發知識偏差,這也對教師的指導和監督能力提出了更高的要求。
表1 "QT主題分類表
3 公眾對AIGC在教育中影響及應用的認知分析
如表2所示,AC數據集主要有5個主題:①ChatGPT幫助搜索文獻資料,助力學術論文寫作;②ChatGPT對大學生批判性思維的影響;③AIGC時代,要培養學生的跨學科學習能力和創造性思維;④AIGC帶來的學術倫理與風險挑戰;⑤ChatGPT在科研領域中的應用。可以看出,公眾對AIGC在教育中的影響及應用有較為深刻的理解。公眾普遍認可ChatGPT這類AIGC工具在學術論文寫作和研究中的輔助作用,這反映了AIGC在提高學習效率和資源獲取方面的巨大潛力。同時,公眾也認識到在AIGC時代培養學生跨學科學習能力和創造性思維的重要性,這反映了公眾期待更加開放和靈活的學習環境。此外,公眾還認為,ChatGPT在科研中的應用能夠促進科技創新,這反映了公眾對AIGC在教育中應用的積極認知。但是,公眾同樣認識到AIGC對學生批判性思維的影響及其給學術誠信和倫理帶來的挑戰,這一認知與公眾的關注點一致,公眾不僅關注AIGC給學術誠信帶來的挑戰,同樣也認識到這一挑戰可能會對學生的批判性思維產生影響。
綜合來看,公眾不僅認識到了AIGC給教育帶來的機遇,也認識到了其帶來的挑戰,這一全面的認知表明,在AIGC時代,教育界在充分利用新技術優勢的同時,也要積極應對可能出現的問題。
表2 "AC主題分類表
4 公眾對AIGC在教育中影響及應用的關注與認知的變化趨勢
為探究公眾對AIGC在教育中影響及應用的關注與認知的變化趨勢,本研究通過時間序列分析方法,對2022年12月~2024年4月期間公眾在知乎中針對相關主題的提問和搜索行為進行了逐月的分析,結果如圖4、圖5所示。
由圖4可知,在2022年12月期間,公眾的日均提問與搜索頻率約為0.31次,表明此時公眾對AIGC在教育中影響及應用的關注度較低。可能是因為處于初期階段,AIGC尚缺乏廣泛的輿論討論和案例分享,公眾對新技術的心理預期較低。然而在2023年1月和2月,隨著ChatGPT 4.0、文心一言、智譜清言和GPT-4Turbo等新語言模型的發布,日均提問與搜索頻率顯著提升,尤其在2月下旬達到峰值,這凸顯了公眾對AIGC在教育領域影響及應用的高度關注,揭示了公眾持續增長的興趣,顯示出公眾對AIGC技術在教育中應用潛力的逐步認可。由圖5可知,2022年12月~2023年2月上旬,公眾針對“AIGC在教育中影響及應用”相關問題的回答或文章的發布頻率較低,這可能是因為在技術發展的初期階段,公眾往往對新技術的實際價值和應用場景缺乏直觀的理解與體驗,導致認知和討論熱度不高。而在2023年2月中下旬,知乎平臺中的相關討論達到高峰,主要原因是ChatGPT最初于2022年11月發布,還需要一定的時間才能夠被我國的公眾廣泛了解和關注,這種延遲可能受信息傳播、語言障礙、使用限制等因素的影響[29]。而在此之后,相關討論有波動但整體呈下降趨勢,原因可能是公眾逐漸適應了AIGC帶來的沖擊,不再局限于網絡問答社區,而是在更為廣泛的社交媒體中進行討論。
圖4 "QT時間序列分析 圖5 "AC時間序列分析
結合時間序列分析可以發現,在以ChatGPT為代表的AIGC發布初期,公眾對其在教育領域的影響及應用的關注相對較低,但這不意味著公眾對此沒有關注。有研究探討了公眾在國內主要在線社區中對“ChatGPT+教育”的關注點、理解和態度,發現公眾對其關注是多元化的,主要包括ChatGPT作為教學助手角色的可能性、在教育應用中存在的倫理風險、對學生的學習管理與評估,以及對教育發展和決策的影響等問題[30]。然而,隨著ChatGPT 4.0和國內眾多主流AIGC的發布,公眾對AIGC在教育中的影響及應用的關注程度達到了高峰,其關注點與討論焦點變得更加多樣化,這一趨勢反映了公眾從對AIGC潛在教育應用的初步了解已經演變到對其深層次影響的積極探討。
圖6 "QT季度高頻詞匯熱力圖 圖7 "AC季度高頻詞匯熱力圖
為探究公眾在不同時間段關于AIGC對教育的影響及應用的具體關注與認知情況,本研究根據QT與AC每個季度出現頻率前三的詞匯,結合AIGC、ChatGPT關鍵詞繪制了季度高頻詞匯熱力圖,如圖6、圖7所示。由圖6可知,公眾主要關注ChatGPT對教育的影響及其在學習中的應用。特別是在2022年12月和2023年8月期間,公眾的關注度達到了高峰;而從2023年11月起,公眾關于ChatGPT對學習過程影響的關注度有所下降,說明隨著對AIGC工具的長期關注和使用,公眾逐漸掌握了AIGC的使用方法與技巧,從而降低了對ChatGPT這類AIGC工具的關注。這一趨勢揭示了在教育領域公眾對AIGC從初期的廣泛關注到逐步整合到日常教學實踐的過程,也反映了技術應用從引發興趣到融入常規使用的自然演變。
由圖7可知,公眾對以ChatGPT為主的AIGC的認知貫穿于整個時間線,而關于AIGC對教育影響的認知集中在2023年3月~2023年5月,原因可能是ChatGPT 4.0版本的發布帶來了顯著的技術改進和新功能,進而吸引了公眾的廣泛關注。另外,公眾對AIGC在學生學習中的影響也進行了深入的討論,特別是在2023年2月,這一討論達到了一個顯著的峰值。盡管關于AIGC對學生學習影響的討論相對集中,但公眾對于AIGC可能對教師角色和教學方法帶來的變化關注相對較少。這表明公眾更多地關注AIGC技術對學生的影響,而對于教育者變革和調整的討論還有待進一步加深與擴展。
四 結語
本研究通過LDA主題建模和時間序列分析揭示了公眾對AIGC在教育中影響及應用的關注和認知情況。研究發現,公眾主要關注AIGC給教師教學、學生課堂學習方式帶來的挑戰,對學術科研領域可能引發的作弊和學術不端行為,以及對中外大學生課程論文寫作的影響。公眾對AIGC在教育領域應用的認知集中在對學生論文寫作輔助、跨學科學習能力、創造性思維和批判性思維的培養、對學術倫理的影響等方面。隨著時間的推進,特別是ChatGPT 4.0及中外各AIGC發布后,公眾對AIGC在教育中影響及應用的關注與認知逐漸深化,并聚焦于對學習的影響。本研究從公眾角度解釋了AIGC對教育質量、教學方法、學術誠信等方面可能帶來的長遠影響,為教育領域更好地適應和應對AIGC帶來的變革與挑戰提供了參考,但本研究也存在一定的局限性,如數據來源于單一的網絡問答社區,這可能影響了結果的普遍性;將數據集劃分為問題與標題、回答與文章可能存在信息片面和認知深度不足等問題。后續研究可擴展至多個網絡問答社區或跨文化環境,采用定性的方法深入探討個體的詳細觀點,同時重點關注其對教育公平和學術誠信的影響。
參考文獻
[1]Euchner J. Generative AI[J]. Research-Technology Management, 2023,(3):71-74.
[2]Rudolph J, Tan S, Tan S. ChatGPT: Bullshit spewer or the end of traditional assessments in higher education?[J]. Journal of Applied Learning and Teaching, 2023,(1):342-363.
[3]盧宇,余京蕾,陳鵬鶴,等.生成式人工智能的教育應用與展望——以ChatGPT系統為例[J].中國遠程教育,2023,(4):24-31、51.
[4][27]Iqbal N, Ahmed H, Azhar K A. Exploring teachers’ attitudes towards using ChatGPT[J]. Global Journal for Management and Administrative Sciences, 2022,(4):97-111.
[5]Shoufan A. Exploring students’ perceptions of ChatGPT: Thematic analysis and follow-up survey[J]. IEEE Access, 2023,11:38805-38818.
[6]Li L, Ma Z, Fan L, et al. ChatGPT in education: A discourse analysis of worries and concerns on social media[J]. Education and Information Technologies, 2024,(29):10729-10762.
[7]焦建利,陳麗,吳偉偉.由ChatGPT引發的教育之問:可能影響與應對之策[J].中國教育信息化,2023,(3):19-32.
[8]馮建軍.我們如何看待ChatGPT對教育的挑戰[J].中國電化教育,2023,(7):1-6、13.
[9]王景,李延平.ChatGPT浪潮下拔尖創新人才的培養:價值意蘊、現實隱憂與生態重塑[J].中國電化教育,2023,(11):62-71.
[10]閆利利,侯虹印.ChatGPT道德感與高教德育的技術限度問題[J].中國電化教育,2023,(11):72-82.
[11]吳軍其,吳飛燕,文思嬌,等.ChatGPT賦能教師專業發展:機遇、挑戰和路徑[J].中國電化教育,2023,(5):15-23、33.
[12][30]劉天麗,楊現民,李康康,等.社會公眾如何看待“ChatGPT+教育”?——基于國內主流開放社區的文本分析[J].現代教育技術,2023,(10):14-23.
[13]秦亞,王達.知乎:讓青年找到向上的答案[J].中國記者,2022,(6):30-33.
[14]呂洋,朱紫怡,郭星硯,等.在線問答平臺中基于回答質量的用戶排序模型——以“知乎”為例[J].數理統計與管理,2023,(5):761-774.
[15]國家互聯網信息辦公室.國家互聯網信息辦公室關于《網絡數據安全管理條例(征求意見稿)》公開征求意見的通知[OL]. lt;https://www.cac.gov.cn/2021-11/14/c_1638501991577898.htmgt;
[16]McCombs M E, Shaw D L. The agenda-setting function of mass media[J]. Public Opinion Quarterly, 1972,(2):176-187.
[17]Neisser U. Cognitive psychology: Classic edition[M]. East Norwalk, CT, US: Appleton-Century-Crofts, 2014:23-24.
[18]Sievert C, Shirley K. LDAvis: A method for visualizing and interpreting topics[A]. Proceedings of the Workshop on Interactive Language Learning[C]. Baltimore, Maryland, USA: Association for Computational Linguistics, 2014:63-70.
[19]Blei D M, Ng A Y, Jordan M I. Latent dirichlet allocation[J]. Journal of Machine Learning Research, 2003,(1):993-1022.
[20]Yule G U. On a method of investigating periodicities in disturbed series, with special reference to wolfer’s sunspot numbers[J]. Philosophical Transactions of the Royal Society of London. Series A, Containing Papers of a Mathematical or Physical Character, 1927,226:267-298.
[21]Deveaud R, SanJuan E, Bellot P. Accurate and effective latent concept modeling for ad hoc information retrieval[J]. Document Numérique, 2014,(1):61-84.
[22]Chang J, Gerrish S, Wang C, et al. Reading tea leaves: How humans interpret topic models[J]. Advances in Neural Information Processing Systems, 2009,32:288-296.
[23]Maier D, Waldherr A, Miltner P, et al. Applying LDA topic modeling in communication research: Toward a valid and reliable methodology[J]. Communication Methods And Measures, 2018,(10):93-118.
[24][25]Mimno D, Wallach H, Talley E, et al. Optimizing semantic coherence in topic models[A]. Proceedings of the 2011 Conference on Empirical Methods in Natural Language Processing[C]. Edinburgh, Scotland, UK.: Association for Computational Linguistics, 2011:262-272.
[26]Khalil M, Er E. Will ChatGPT get you caught? Rethinking of plagiarism detection[A]. International Conference on Human-Computer Interaction[C]. Cham: Springer Nature Switzerland, 2023:475-487.
[28]Extance A. ChatGPT has entered the classroom: How LLMs could transform education[J]. Nature, 2023,(7987):474-477.
[29]Zhang X, Li D, Jiang Z, et al. From ChatGPT to China’ sci-tech: Implications for Chinese higher education[J]. Beijing International Review of Education, 2023,(3):296-314.
Research on the Concerns and Cognition of the Public in Online Qamp;A
Communities Regarding the Impact and Application of AIGC on Education
——LDA Topic Modeling and Time Series Analysis
CHAI Shao-Ming1 " "HE Zhen-Hai2[Corresponding Author] " "LI Zuo-Kun3
(1. Aberdeen Institute of Data Science and Artificial Intelligence, South China Normal University, Foshan, Guangdong, China 528225; 2. School of Information Technology in Education, South China Normal University, Guangzhou, Guangdong, China 510631; 3. Faculty of Education, University of Macau, Macao, China 999078)
Abstract: Currently, the transformations in the field of education brought about by artificial intelligence generated content (AIGC) represented by ChatGPT have attracted widespread attention from various experts and scholars. However, few studies have explored the public’s concern and cognition on the impact and application of AIGC in education from the perspective of online question-and-answer communities. Therefore, through LDA topic modeling and time series analysis, this paper investigated questions and articles related to AIGC and education on Zhihu platform from December 6, 2022, to April 9, 2024. The results of the LDA topic modeling indicated that the public’s attention and perception were mainly concentrated on challenges faced by teachers’ teaching and students’ classroom learning, the challenges to academic ethics posed by AIGC, the impacts of AIGC on students’ critical thinking and interdisciplinary learning abilities, and comparisons between domestic and foreign university students in using AIGC to complete essays and assignments. The time series analysis revealed that public’s attention and perception on the impact and application of AIGC in education peaked from February to March 2023, with the main focus on the impact of AIGC on students’ learning. Through this research, the paper was expected to provide reference for the educational field to better adapt to and address the transformations and challenges brought about by AIGC.
Keywords: AIGC; ChatGPT; education; online Qamp;A communities; concern and cognition
*基金項目:本文為廣東省教育科學規劃課題(高等教育專項)“教育數字化轉型背景下生成式人工智能賦能高校教學改革與創新的路徑”(項目編號:2023GXJK266)、廣東省哲學社會科學規劃2024年度一般項目“數字化轉型背景下生成式人工智能高等教育應用的倫理風險與治理路徑研究”(項目編號:GD24CJY33)的階段性研究成果。
作者簡介:柴少明,副院長,教授,博士,研究方向為人工智能教育應用、計算機支持的協作學習(CSCL)、學習科學與技術和知識建構等,郵箱為charmingchai@m.scnu.edu.cn。
收稿日期:2024年4月27日