官網介紹,OpenAI對外發布其首個人工智能文生視頻大模型Sora,能根據文字說明創造出逼真而富有想象力的場景,連馬斯克都感嘆“人類愿賭服輸”,360創始人周鴻祎更是預言“AGI實現將從十年縮短到兩三年。”
2月16日凌晨,OpenAI發布了文生視頻大模型Sora。Sora能夠根據文本提示創建詳細的視頻、擴展現有視頻中的敘述以及從靜態圖像生成視頻場景。
在一個OpenAI提供的例子中,輸入提示語句“動畫場景的特寫鏡頭,一個毛茸茸的小怪物跪在一根融化的紅蠟燭旁邊。藝術風格3D、逼真,重點是照明和紋理,情緒包括驚奇和好奇……”時,Sora創造出了一個類似皮克斯和夢工廠電影中的動畫小怪物鏡頭。
雖然這類應用早就出現,但Sora的呈現仍然驚艷,視頻可實現多角度切換,保持視頻中出現的人物、景色的連貫性,甚至即便切換鏡頭,人物依然能夠保持一致,時長方面也有所突破,最長能生成60秒視頻。
OpenAI首席執行官薩姆?奧特曼(Sam Altman)在社交平臺下場,對網友放言“留下想看什么的評論,我為你生成視頻”,并在兩小時內“現點現做”放出了十多條視頻。這立刻引發了科技圈和影視圈的雙重“震撼”,油管粉絲高達2.39億的頂流網紅“野獸先生”直接在薩姆?奧特曼的社交賬號下哀求“求求你了薩姆,不要讓我沒有工作。”
Sora雖然是人工智能文生視頻大模型,但OpenAI并沒有單純的將其視為視頻模型,而是作為“世界模擬器”。
OpenAI表示,正在教AI理解和模擬運動中的物理世界,目標是訓練模型來幫助人們解決需要現實世界交互的問題,根據文本提示生成視頻,僅僅只是整個計劃中的一步。
目前Sora已經能夠生成具有多個角色、特定類型動作的復雜場景,不僅能理解用戶在提示中提出的要求,還了解這些物體在物理世界中的存在方式。比如一大群紙飛機在樹林中飛過,Sora知道碰撞后會發生什么,并表現其中的光影變化,它還可以在單個視頻中創建多個鏡頭。
當然,Sora也存在著一定的弱點,它可能難以準確模擬復雜場景的物理原理,并且可能無法理解因果關系,混淆提示的空間細節,難以精確描述隨著時間推移發生的事件。例如“五只灰狼幼崽在一條偏僻的碎石路上互相嬉戲、追逐”的場景中,狼的數量會發生變化,一些甚至憑空出現或消失。
多位人工智能領域人士表示,該問題可能因其概率模式的邏輯存有“硬傷”。加大訓練量、增加訓練數據與物理邏輯可改善該問題,但無法根治。
事實上,文生視頻大模型不是一條新賽道,OpenAI也并非賽道唯一的拓荒者。2023年6月,谷歌支持的人工智能初創公司Runway發布大模型Gen-2,可生成幾秒長的電影級影片;同年11月,動畫視頻生成公司Pika推出了可以生成分鐘級高質動畫視頻的產品。
但Sora此次的技術創新,仍然引起了很多人的恐慌,不少評論區中出現“不禁止必會造成失業大潮”“導演、后期要失業了”等消極話語。一時間讓“顛覆技術”“顛覆行業”成為業內熱議的關鍵詞。獵豹CEO傅盛認為AI本質上是平權工具,顛覆行業的同時也蓬勃了行業。
北京大學國家發展研究院助理研究員、BiMBA商學院副院長杜曉夢表示,效率的提升會帶來兩個選擇:人員的壓縮,或者擴大工作量。“我看到更多的情況是,因為用了這個工具,我可以接更多的工作了。所以我覺得,用這個工具的公司會PK掉那些不用這個工具的公司。”此外,杜曉夢還指出,視頻行業還有很多的環節不能被替代,比如創意。
從事后期的工作人員也表示“解放”影視后期有點難,設計軟件也好,Sora也好,都只是工具,硬件和軟件的進步都只是提高效率。后期是一個很大的范圍,涉及到拍攝、剪輯、包裝、調色、三維,這些工作還能細分,程序要把這么龐大的知識理解清楚是很難的。
隨著Sora的普及,第一批通過Sora賺錢的人已經出現了。在某電商平臺上,關于Sora的教程、解讀,售價在幾元至近百元不等。其中一個售價為99元的課程簡介寫道“Sora一鍵生成視頻,限時優惠99元。”一張網傳截圖顯示,某機構已售出2萬多份Sora培訓課程,僅一天時間就獲得了200萬的收入。
作為AI培訓付費課程領域的頭部博主,李一舟此前曾推出AI課程《每個人的人工智能課》,原價999元,現價199元。飛瓜數據顯示,該課程一年內賣出約25萬套,銷售額約5000萬。近期因違反《即時通信工具公眾信息服務發展管理暫行規定》暫停。
中國信息協會常務理事、國研新經濟研究院創始院長朱克力表示,“李一舟人工智能課程被下架,無疑給當前火熱的AI付費課程市場敲響了一記警鐘。人們對于AI技術的興趣達到了前所未有的高度,但這種興趣背后,往往伴隨著對技術的誤解和盲目崇拜。”
DCCI互聯網研究院院長劉興亮認為,Sora模型及其帶來的技術進步,也引發了一系列倫理和社會挑戰,“隨著AI生成內容與現實之間的界限變得越來越模糊,如何確保內容的真實性和透明性成為了一個重要問題。此外,版權、隱私和數據安全等問題也需要得到妥善解決。”
目前,OpenAI已經將Sora提供給了一些藝術家用于創作,但距離面向公眾發行還需要一段時間,“我們將采取幾個重要的安全措施,并進行對抗性測試,一旦公開發布,我們的文本分類器將檢查違反使用政策的文本輸入提示,例如極端暴力、色情內容、名人肖像等。”OpenAI表示。