陳聰聰 李晨 王亞飛

摘要:當前,人工智能技術在教育領域的影響已逐漸凸顯,“人工智能+教育”的新型教學模式探索成為教育領域的研究熱點。近來,文生視頻模型Sora的出現受到了廣泛關注,雖然未來Sora對于教育教學的影響尚未可知,但引入智能技術以促進教育教學高質量發展的趨勢已經不可阻擋。為此,文章梳理了文生視頻模型的技術演進,介紹了主流文生視頻模型的基本情況,并闡釋了Sora的緣起和應用優勢。在此基礎上,文章分析了Sora融入教育教學帶來的機遇,主要表現為豐富了教學資源、增強了沉浸式教學體驗、創新了交互方式;同時,文章從技術成熟度、師生技術素養、倫理安全風險、監管與治理制度四個方面,探討了Sora融入教育教學面臨的主要挑戰,以期推動Sora在教育教學中的應用,并為開展智能技術支撐的教育教學提供參考。
關鍵詞:Sora;人工智能;智能教育;大模型
【中圖分類號】G40-057 【文獻標識碼】A 【論文編號】1009—8097(2024)05—0027—08 【DOI】10.3969/j.issn.1009-8097.2024.05.003
2022年11月,美國人工智能研究公司OpenAI發布大語言模型ChatGPT,其一經問世,就憑借強大的數據處理和分析預測能力,在全球范圍內受到了各行業的廣泛關注,訊飛星火、文心一言等系列人工智能大模型產品也隨之涌現。當人們還在探索ChatGPT的潛力和挑戰并為其應用展開激烈的討論時,OpenAI又于2024年2月發布了文生視頻模型Sora,其可以通過文本描述生成最長60秒的逼真視頻,這一突破性變革再度掀起了討論熱潮并持續發酵。Sora的發布,也意味著AI技術在視頻技術領域的巨大飛躍,未來可能對金融、醫療、教育等行業都將產生深遠的影響[1]。Sora的出現,為教育教學的方式和內容帶來了新的可能,但其帶來的影響究竟如何尚未可知,因此有必要對其應用于教育教學的潛力進行探索與分析。基于此,本研究嘗試梳理文生視頻模型的技術演進及其主流的模型,并分析Sora的誕生歷程和應用優勢,來探討Sora融入教育教學帶來的機遇及其面臨的主要挑戰。
一 文生視頻模型
1 文生視頻模型的技術演進
文生視頻(Text-to-Video)模型是一種結合深度學習和視覺生成的人工智能技術,能夠基于用戶提供的文本指令信息自動識別并生成各種主題和風格的視頻片段。這類模型基于神經網絡架構,可以在處理海量視頻數據的同時,保持高速的計算和準確的內容生成能力。隨著訓練數據的增加,憑借強大的學習能力,經過不斷的迭代優化,文生視頻模型產出的內容逐漸貼合用戶的需求和想象,實現了從自然語言到動態視頻的轉換。目前,文生視頻模型尚處于起步階段,在其發展過程中先后采用了不同技術,主要有:①基于生成對抗網絡(Generative Adversarial Nets,GAN)和變分自編碼器(Variational Autoencoder,VAE)技術生成視頻內容[2]。其中,GAN利用生成器和判別器,通過迭代的對抗訓練生成動態視頻[3];VAE則通過對數據進行編/解碼以生成連貫的視頻序列[4],典型代表有Text2Filter[5]。②引入Transformer模型。先對輸入的文本進行編碼,再轉化為視頻token,然后通過特征融合以輸出視頻內容,典型代表有Phenaki[6]、NUWA[7]。③擴散(Diffusion)模型成為主流框架[8]。通過逐步添加隨機噪聲,進行逆向去噪生成視頻,典型代表有Make-A-Video[9]、Gen-2[10]。從本質上來說,Sora也是一種擴散(Diffusion)模型,但不同于傳統的文生視頻模型,Sora已在視頻持續時間、理解能力、分辨率等方面都有了全新的突破。
2 主流的文生視頻模型
當前,主流的主流文生視頻模型有Gen-2、Pika 1.0、Stable Video Diffusion等。本研究根據相關的官網信息,梳理了這些模型的基本情況,如表1所示。其中,Runway是較早研究文生視頻的開發團隊,先后推出了Gen-1、Gen-2兩個版本的模型。其中,Gen-2憑借清晰度相對較高的視頻質量而在文生視頻領域應用廣泛,但其仍存在語義理解欠佳、視頻扭曲掉幀、連貫性較差等問題。Pika 1.0具有較強的語義理解能力,且在動畫風格的視頻生成方面表現突出,新推出的Lip Sync還提供“對口型”功能,可以同步聲音與視頻角色的嘴部動作,增強畫面效果的真實感。Stable Video Diffusion作為一個開源的文生視頻模型,可以實現多視角視頻合成和幀插入功能,也在一定程度上提升了視頻內容的質量。據OpenAI官網介紹,相較于以往的文生視頻模型,Sora不僅增加了視頻的持續時長、提升了語義理解能力,還可以支持對視頻內容的編輯擴展,并涌現了一定的物理仿真能力,這些特性對于影視、廣告等傳媒行業將產生深遠影響。
二 Sora的緣起與應用優勢
1 Sora的緣起
2021年1月,OpenAI公司基于旗下產品GPT-3研發了文生圖模型DALL-E,這是一款包含120億參數的多模態預訓練模型。DALL-E具有強大的文字理解和圖像生成能力,可以實現從文字提示到對應清晰圖像的轉換,從而打破了語言與圖像之間的天然壁壘,因此迅速吸引了廣告設計、游戲制作等領域從業人員的目光,并在實際的工作生產中進行了應用。2022年4月,OpenAI公司對DALL-E進行升級,發布了DALL-E 2。相比DALL-E,DALL-E 2不僅提高了圖像生成的真實性和準確性、加快了圖像的生成速度,而且允許用戶對圖像進行編輯,故交互性更加顯著。2023年9月,DALL-E 3正式發布,其最大的亮點是集成了ChatGPT,可以更加準確地理解用戶給出的提示詞,并且在圖像的質量方面有了較大的提升——Sora正是借鑒DALL-E 3而開發的一款文生視頻大模型。
2 Sora的應用優勢
Sora來源于日語“空”,意為“天空”,代表無限的創造潛力。OpenAI公司將Sora比作“世界模擬器”,稱其為實現人工通用智能(Artificial General Intelligence,AGI)的重要里程碑[11]。作為一個DiT(Diffusion Transformer)模型[12],Sora的大致工作過程是:先將用戶提示信息進行壓縮,再分解為一系列時空潛在補丁(Spacetime Latent Patch),再利用Transformer模型進行處理后得到最終的視頻輸出內容。Sora的應用優勢主要表現為:
①降低了應用門檻。受技術操作、設備配置等因素的影響,傳統視頻制作中視頻內容創作的發揮空間有限,阻礙了視頻內容生產者數量的持續擴充,進而影響了相關行業的多元發展和創新步伐,而Sora的出現可以簡化創作流程、減少制作成本,進而降低了視頻創作的門檻,提升了創意和思維表達的自由度。這一優勢無論是對于個體創作、商業應用,還是對于教育、科研等特定領域都具有重要的意義,將進一步加速行業融合創新的步伐。②實現了對話式視頻生成。隨著以ChatGPT為代表的生成式人工智能技術的迅速崛起,人機交互的方式正在發生變革,而Sora接收用戶給定的文字提示信息并反饋動態視頻輸出的工作流程,將催生對話式新型視頻人機交流模式,以豐富多元的人機交互方式,促成更加全面的交互環境的形成,提升人機互動體驗感。③涌現了物理仿真能力。Sora在經過大規模數據的訓練后,展現了一定程度的涌現能力,這是大語言模型的重要特性,是指在模型的訓練和應用過程中出現的、之前未被編碼的意想不到的能力[13]。得益于這一能力,Sora不僅能夠學習現實世界的客觀規律,還可以根據掌握的知識推斷并模擬運動場景,實現3D一致性和長時連貫性,確保視角轉換狀態下視頻內容的穩定性。因此可以說,這一能力為Sora“構建通用世界模擬器”的未來愿景奠定了堅實基礎。
三 Sora融入教育教學帶來的機遇
當前,人工智能技術已經開始介入課堂教學,促使教學模式逐步轉向“師-機-生”三元結構,旨在為學生提供更加高效、有針對性的學習路徑,實現教育數字化轉型。如果Sora技術能在教育教學中實現落地,將會促進教學模式的多元化發展,加快推動傳統教育走向智能教育。
1 豐富了教學資源
當前,智慧課堂已成為信息技術支撐下課堂教學實踐的重要趨勢,其憑借VR、ChatGPT等智慧教育核心技術的應用,使傳統單一、枯燥的課堂模式得到了顯著改善:利用VR設計英語學習教育游戲,激發了學生的學習興趣和動機[14];基于ChatGPT構建智能數學學習系統,能為學生提供代數解題提示,幫助其反思和糾正解題過程中出現的錯誤[15]。而Sora作為一款文字視頻生成工具,是對智慧教育實踐工具的有效補充,且便捷性更強、效率更高,可以直接將文字、圖像、已有視頻轉化成全新的視頻內容,并可視化呈現復雜、抽象的知識概念,從而提高學生的理解能力,并豐富教學內容。例如,教師可以應用Sora的3D效果展示復雜的幾何圖形、動態演繹公式的推理過程等,從而加深學生對知識點的直觀印象,促進學生空間思維和邏輯思維能力的發展。同時,Sora可以幫助教師實現教學資源的有效整合,匯總不同學科的知識創建綜合性的教學視頻,在豐富教學內容的同時拓寬學生的學習視野,使其形成完整的知識體系。此外,年輕教師在教學過程中對于知識點的理解和重難點的把握等可能存在不足,導致教學內容講授效果不理想、課堂效率降低等問題的發生,從而影響了學生的學習成效。而Sora可以利用自身強大的文字理解能力,通過視頻演繹的方式表達教師難以準確表達的概念和思想,促進其內隱的實踐性知識顯性化,從而縮小新手教師與專家教師之間的差距,助力年輕教師學習成長[16]。教學設備方面,Sora還可以通過改善視頻的構圖,為手機、電腦、平板等不同的設備創建合適尺寸的內容,這擴展了教學材料的表現形式,促進了教學設計的可視化,使教師可以更高效地獲取和制作教學資源,而無須考慮視頻內容在不同設備上的兼容性問題。
2 增強了沉浸式教學體驗
據OpenAI官網介紹,Sora能夠根據接收到的提示信息模擬現實世界的人物和場景,并涌現出了一定的物理仿真能力,可以生成具有長時連貫性和3D一致性的視頻畫面。利用這一特性,可以通過動態的視覺元素展示抽象的概念知識,將教學形式拓展到更加逼真、更具體驗性的沉浸式教學情境,尤其是地理、生物等需要空間想象力的課程。例如,在地理課程中,教師可以應用Sora的3D效果動態展示不同地區的地貌、氣候變化,使學生在觀看視頻的同時,能夠直觀了解并掌握地理現象的發生過程。Sora在教學中的應用,一方面可以通過模擬現實場景吸引學生的注意力,使學生集中于課堂知識的吸收和理解,從而實現課堂環境的優化;另一方面有助于將抽象的概念具像化,幫助學生突破認知障礙,并更加直觀地理解和記憶課堂知識,從而提升自身的學習效率和能力[17],并有效降低學習門檻,實現多元立體化的課堂互動,突破自然語言形式的限制,拓展教學互動的深度和廣度[18]。
3 創新了交互方式
經過前期大量的數據訓練,Sora已經對現實世界的發展規律具有了一定程度的儲備和理解能力,可以快速實現虛擬場景的構建,并較為準確地預測和模擬事物的未來狀態。這意味著,將這一優勢應用于教學,教師可以通過逼真、生動的視頻形式將復雜問題簡單化、抽象問題具體化,使學生從更加直觀的角度學習知識,提升學生對知識的理解和記憶能力。目前,利用人工智能技術輔助課堂教學雖已成為新常態,但在具體的教學過程中,教師大多只是利用其預先設計教學內容,難以根據學生需求進行即時的靈活調整[19],不利于教學內容個性化和交互性的實現。而Sora允許教師根據學生的課堂反饋和學習進度,實時調整教學視頻內容;學生也不再只是被動地接收教師講授的知識,而是可以根據視頻內容提出問題并展開討論,甚至可以互換師生身份,直接參與教學內容的設計。在這種教學模式下,教師從教學活動的主導者變為引導者,可以將更多的精力投入到與學生的互動中,故有利于提升教學的效率和質量;而學生從課堂教學的接受者變為參與者,可以直接參與學習內容的設計過程,故有利于增強其學習的主動性,提升其邏輯思維能力和創造力。這種全新的交互方式形成了學生、教師、機器之間的多向互動,真正實現了“以教師為主導,以學生為主體”的教學理念,有助于打造全新的教育生態。
四 Sora融入教育教學面臨的主要挑戰
雖然Sora的出現為促進教育模式創新提供了新的方向,有助于推動個性化教育進程、提升人才培養效率,但仍要理性看待Sora融入教育教學的可能性并客觀認識其面臨的諸多挑戰。
1 技術成熟度不足
雖然“人工智能+”的熱潮正在全球各行業范圍內興起,但人工智能技術本身具有復雜性、擴展性、不可控性、不可預知性等特點[20],將其融入其他領域形成的產業模式存在極大的不確定性。OpenAI將Sora比作“世界模擬器”,其是否真的能夠做到理解物理世界并進行準確建模仍有待驗證。就當前OpenAI官網給出的示例來看,Sora生成視頻內容的準確性和合理性還存在明顯不足,技術成熟度還遠遠不足以投入實際生產,而技術從最初提出到投入生產需要一定的周期和復雜的條件[21],期間要經歷大量的測試和不斷的調整,而Sora尚處在這一復雜過程的第一階段。在教育領域,Sora還沒有正式發布試用,未來將其應用于實際教學的效果能否達到演示內容的程度尚未可知;另外,教育傳播對內容表達的嚴謹性和精確度要求更高,將Sora技術應用于教育教學,一旦生成的視頻內容與實際教學不符,就可能會對學生產生誤導,影響其對信息的接收和對知識的理解,從而與其應用于教育的初衷相悖。
2 師生技術素養欠缺
當前,人工智能技術正在推動教學模式向“師-機-生”三元結構轉變。這種教學模式要求師生不僅具備基本的學科知識素養,還需提升自身的智能技術素養,并將其合理應用于日常的教育和學習中[22]。然而,Sora的功能仍需要不斷完善,學校管理者和師生也尚未做好應用的準備,畢竟從了解到切實掌握一項陌生的技術需要一定的時間和經驗積累。即使Sora未來發展成熟,其運用于教育教學時也仍然需要師生具備基本的技術素養——如果缺乏相關的技術知識和應用能力,師生在教與學的過程中就可能因缺乏對Sora技術的了解而產生消極抵觸心理;如果無法正確把握Sora技術的應用界限,則可能出現師生過度依賴技術的情況,而違背了技術只是一種輔助手段的基本理念。另外,Sora因海量數據訓練而天然存在的“黑箱”特性,使其生成的視頻內容可信度存疑,如果師生不能應用批判性思維對視頻內容進行分析和辨別,而只是盲目地接收Sora得出的信息,那么師生將可能吸納錯誤的知識,出現思維的惰化,從而弱化問題的解決能力,失去對知識獲取的主動性——長此以往,將會造成思維能力的退化[23]。
3 倫理安全風險滋生
2023年9月,聯合國教科文組織發布《在教育和研究中使用生成式人工智能的指南》[24],這是自ChatGPT出現以來頒布的首份規范生成式人工智能相關內容和行為的指導性文件。該指南從顯性和隱性兩個方面分析了生成式人工智能技術可能帶來的風險,強調了生成式人工智能技術規范應用的重要性。智能技術在變革教育的同時,也衍生出了算法歧視與不透明、技術濫用與依賴等一系列倫理問題[25][26],而在生成式人工智能的數據質量風險中,偏見和歧視問題十分突出[27]。作為主要基于歐美語料庫的大模型,Sora的訓練數據內容中可能存在的價值觀沖突會對青少年的世界觀構建產生潛移默化的影響,并導致弱勢群體“數字殖民”升級的風險[28]。目前,OpenAI官網針對Sora的技術報告介紹了其宏觀框架,但沒有明確其視頻訓練數據的來源,經過大規模的數據訓練,Sora的學習內容可能會因各地文化的差異存在偏見和不穩定因素[29],這為學生自主學習中的觀念形成埋下了隱患。此外,相較于文字和圖片,視頻承載的信息量更大,容易給學生留下更加直觀、深刻的印象,如果視頻內容包含誤導信息,就會加深其帶來的負面影響,而Sora的超強涌現能力更是加大了這一風險。OpenAI公司也表示,對于Sora生成視頻可能存在的錯誤信息、仇恨內容、偏見內容等還需不斷測試。可見,師生需慎重對待Sora生成的視頻內容,如果師生的倫理安全意識不足,就可能無法正確辨認視頻內容的合理性和公平性,從而使其合法權益受到侵犯[30]。
4 監管與治理制度滯后
隨著生成式人工智能技術的快速發展,其在教育領域的應用越來越廣泛,各國政府、學校、企業等都在積極探索生成式人工智能技術與教育教學融合的發展路向,以培養契合數字化轉型要求的高水平創新型人才。而有效的監管和治理,能夠引導師生在安全范圍內將生成式人工智能技術應用于日常的教與學,從而促進智能技術融入教育教學的健康、穩定發展[31]。針對智能技術賦能教育進行監管和治理,一直是我國政府部門的重點工作之一。2023年5月,我國發布《生成式人工智能服務管理暫行辦法》,規定了生成式人工智能服務的合法使用范圍,旨在促進生成式人工智能的健康發展和規范應用[32]。但是,針對技術的立法是一個漫長且復雜的過程,需要考慮多方面的因素,致使相關監管政策推進的步伐往往落后于技術的發展速度,而缺少法規和條例的引導與治理會引發技術濫用、隱私泄露等一系列風險,從而限制生成式人工智能的發展[33]。在教學實踐中,如果沒有明確的政策引導,師生應用Sora之類的智能技術時就可能會缺乏責任感和規范約束,造成不良違規行為的滋生[34]。近年來,風險監管機制的缺失使人工智能技術應用違規行為的問題日益凸顯,加上人工智能技術尤其是具有突破性、不穩定性的Sora技術具有驚人的更新迭代速度,迫切需要政府及時提出監管措施以防范使用風險。基于此,政府部門亟需加速制定相關的法律法規或指導意見,健全數字教育技術風險監管機制,監督和治理生成式人工智能技術的合理教育應用,打造技術與教育融合的健康生態環境。
五 結語
Sora技術才剛剛啟程,未來的發展方向尚未可知,但智能技術賦能教育教學的趨勢已然形成。本研究探索了Sora應用于教育教學的潛力,期望通過對其所面臨的機遇與挑戰的討論,為推動Sora在課堂教學中的應用提供參考。技術的引入是為了更好地推動教育高質量發展,教育工作者應積極探索依托創新技術開展教育教學的方法,適應數字化轉型時代人才培養的新范式。以Sora技術融入教育教學為契機,加強對學生創新能力的培養,全面提升教師的智能教育技術應用能力,可以更好地應對新技術對教育教學的沖擊。相信隨著功能的不斷完善,ChatGPT、Sora等新一代智能技術將為師生帶來更佳的教與學體驗,助力打造和諧、優質的教育生態環境。
參考文獻
[1]Liu Y, Zhang K, Li Y, et al. Sora: A review on background, technology, limitations, and opportunities of large vision models[OL].
[2]Kim D, Joo D, Kim J. Tivgan: Text to image to video generation with step-by-step evolutionary generator[J]. IEEE Access, 2020,8:153113-153122.
[3]Vondrick C, Pirsiavash H, Torralba A. Generating videos with scene dynamics[OL].
[4]Pham D , Le T M V .Auto-encoding variational bayes for inferring topics and visualization[OL].
[5]Li Y, Min M R, Shen D, et al. Video generation from text[OL].
[6]Villegas R, Babaeizadeh M, Kindermans P J, et al. Phenaki: Variable length video generation from open domain textual descriptions[OL].
[7]Chenfei Wu, Jian Liang, Lei Ji, et al. N?WA: Visual synthesis pre-training for neural visual world creation[OL].
[8]Ho J, Chan W, Saharia C, et al. Imagen video: High definition video generation with diffusion models[OL].
[9]Singer U, Polyak A, Hayes T, et al. Make-a-video: Text-to-video generation without text-video data[OL].
[10]Runway. Gen-2: The next step forward for generative AI[OL].
[11]OpenAI. Video generation models as world simulators[OL].
[12]Yanyan Z .Construction of a smart classroom for image processing courses in colleges and universities based on artificial intelligence: Taking fundamentals of photoshop as an example[A]. 2023 IEEE 3rd International Conference on Social Sciences and Intelligence Management (SSIM)[C]. Taiwan: IEEE, 2023:84-88.
[13]陳向東,趙麗娟,劉澤民.擴展學科的疆域:大模型的涌現能力對學習科學的影響[J].現代教育技術,2024,(1):44-54.
[14]何聚厚,黃秀莉,韓廣新,等.VR教育游戲學習動機影響因素實證研究[J].電化教育研究,2019,(8):70-77.
[15]Pardos Z A, Bhandari S. Learning gain differences between ChatGPT and human tutor generated algebra hints[OL].
[16]張銘銳,閆志明,孫銘璐,等.教師知識圖譜:人工智能賦能教師專業發展的必由之路[J].現代教育技術,2023,(8):38-47.
[17]Lin Z,Shujuan X. Optimization of classroom teaching quality based on multimedia feature extraction technology[J]. International Journal of Web-Based Learning and Teaching Technologies (IJWLTT), 2024,(1):1-11.
[18]Ahmed K K, Jumaili A A A. Adopting video assignments as a tool to improve first-year pharmacy students class engagement[J]. Annales Pharmaceutiques Francaises, 2024,(2):263-270.
[19]鐘紹春.人工智能支持智慧學習的方向與途徑[J].中國電化教育,2019,(7):8-13.
[20]杜華,孫艷超.聲稱是人工智能浪潮下知識觀的再審視——兼論兩個經典知識之問的當代回應[J].現代教育技術,2024,(1),96-106.
[21]張學義,范阿翔.基于技術成熟度曲線的人工智能審視[J].科學技術哲學研究,2019,(2):14-19.
[22]楊宗凱,王俊,吳砥,等.ChatGPT/生成式人工智能對教育的影響探析及應對策略[J].華東師范大學學報(教育科學版),2023,(7),26-35.
[23]曹培杰,謝陽斌,武卉紫,等.教育大模型的發展現狀、創新架構及應用展望[J].現代教育技術,2024,(2):5-12.
[24]UNESC0. Guidance for Generative Al in Education and Research[OL].
[25]杜靜,黃榮懷,李政璇,等.智能教育時代下人工智能倫理的內涵與建構原則[J].電化教育研究,2019,(7):21-29.
[26]胡小勇,黃婕,林梓柔,等.教育人工智能倫理:內涵框架、認知現狀與風險規避[J].現代遠程教育研究,2022,(2):21-28、36.
[27]邢露元,沈心怡,王嘉怡.生成式人工智能訓練數據風險的規制路徑研究[J].網絡安全與數據治理,2024,(1):10-18
[28]苗逢春.生成式人工智能技術原理及其教育適用性考證[J].現代教育技術,2023,(11):5-18.
[29]劉明,吳忠明,廖劍,等.大語言模型的教育應用:原理、現狀與挑戰——從輕量級BERT到對話式ChatGPT[J].現代教育技術,2023,(8):19-28.
[30]黃榮懷,張國良,劉夢彧.面向智慧教育的技術倫理取向與風險規約[J].現代教育技術,2024,(2),13-22.
[31][34]劉明,吳忠明,廖劍,等.大語言模型的教育應用:原理、現狀與挑戰——從輕量級BERT到對話式ChatGPT[J].現代教育技術,2023,(8):19-28.
[32]陳子君.大數據賦能基層監督的互構邏輯——基于“技術-信息-組織”的理論視角[OL].
[33]楊建武,羅飛燕.類ChatGPT生成式人工智能的運行機制、法律風險與規制路徑[OL].
Text-To-Video Model Sora for Education and Teaching: Opportunities and Challenges
CHEN Cong-Cong1LI Chen2[Corresponding Author]WANG Ya-Fei3,4
(1. Information Technology Center, Tsinghua University, Beijing, China 100084; 2.College of Physical Education,
Xinjiang Normal University, Urumqi, Xinjiang, China 830054; 3. School of Education, Shanghai Normal University,
Shanghai, China 200234; 4. iFLYTEK Educational Technology Institute, Hefei, Anhui, China 230088)
Abstract: At present, the influence of artificial intelligence technology in the field of education has gradually become prominent, and the exploration of a new teaching model of “Artificial Intelligence + Education” has become the research hotspot in the field of education. Recently, the emergence of Text-To-Video model Sora, has received widespread attention, although the future impact of Sora on education and teaching is unknown, the trend of introducing intelligent technology to promote the high-quality development of education and teaching has been unstoppable. Therefore, this paper sorted out the technical evolution of Text-To-Video model, introduced the basic situation of mainstream Text-To-Video model, and explained the origin and application advantages of Sora. Accordingly, the opportunities brought by Soras integration into education and teaching were analyzed, which mainly manifested in enriching teaching resources, enhancing immersive teaching experience and innovating interactive methods. At the same time, the main challenges of integrating Sora into education and teaching were discussed from four aspects of technology maturity, teachers and students technical literacy, ethical safety risks, supervision and governance system, in order to promote the application of Sora in education and teaching, and provide reference for carrying out education and teaching supported by intelligent technology.
Keywords: Sora; artificial intelligence; intelligent education; large language models
作者簡介:陳聰聰,編輯,碩士,研究方向為編輯出版、教育技術等,郵箱為chencongcong@tsinghua.edu.cn。
收稿日期:2024年3月15日
編輯:小米