官網介紹,OpenAI對外發布其首個人工智能文生視頻大模型Sora,能根據文字說明創造出逼真而富有想象力的場景,連馬斯克都感嘆“人類愿賭服輸”,360創始人周鴻祎更是預言“AGI實現將從十年縮短到兩三年。”
2月16日凌晨,OpenAI發布了文生視頻大模型Sora。Sora能夠根據文本提示創建詳細的視頻、擴展現有視頻中的敘述以及從靜態圖像生成視頻場景。
在一個OpenAI提供的例子中,輸入提示語句“動畫場景的特寫鏡頭,一個毛茸茸的小怪物跪在一根融化的紅蠟燭旁邊。藝術風格3D、逼真,重點是照明和紋理,情緒包括驚奇和好奇……”時,Sora創造出了一個類似皮克斯和夢工廠電影中的動畫小怪物鏡頭。
雖然這類應用早就出現,但Sora的呈現仍然驚艷,視頻可實現多角度切換,保持視頻中出現的人物、景色的連貫性,甚至即便切換鏡頭,人物依然能夠保持一致,時長方面也有所突破,最長能生成60秒視頻。
OpenAI首席執行官薩姆?奧特曼(Sam Altman)在社交平臺下場,對網友放言“留下想看什么的評論,我為你生成視頻”,并在兩小時內“現點現做”放出了十多條視頻。這立刻引發了科技圈和影視圈的雙重“震撼”,油管粉絲高達2.39億的頂流網紅“野獸先生”直接在薩姆?奧特曼的社交賬號下哀求“求求你了薩姆,不要讓我沒有工作。”
Sora雖然是人工智能文生視頻大模型,但OpenAI并沒有單純的將其視為視頻模型,而是作為“世界模擬器”。
OpenAI表示,正在教AI理解和模擬運動中的物理世界,目標是訓練模型來幫助人們解決需要現實世界交互的問題,根據文本提示生成視頻,僅僅只是整個計劃中的一步。