摘要:Sora基于一個完整且復雜的物理引擎來創作視頻,理解人類語言的描述,通過已有知識儲備外加想象,模擬并輸出運動中的物理世界和人物情緒。它的誕生顛覆了影視行業的內容生成方式。但如果拋開行業發展的問題,單從影像創作本身而言,Sora生成的影像都是在對傳統影像的模仿。Sora很好地實現了虛構與真實的多維度深入融合,其與電影創作的不同之處在于它完全通過虛構呈現出真實感。“后Sora”時代的影視藝術需要人與機器的協作,需要人有想象力、創造力和審美力,更需要擁有計算機思維的文字能力,會用文本去講故事,需要有同理心,懂人情世故。這些都與文學有關。未來影視藝術的好壞,是由作為“變量”的文學所決定的,這可能意味著一個新型文學時代的來臨。
關鍵詞:Sora;影視藝術;文學性
中圖分類號:J90-05 文獻標識碼:A 文章編號:1674-3180(2024)01-0032-06
Sora一夜之間刷屏。作為OpenAI發布的首個AI文生視頻模型,Sora根據輸入的文字提示,就能生成60秒電影級畫質的視頻:可以一鏡到底,運鏡絲滑流暢;也可以進行多鏡頭的蒙太奇無縫切換,每一個分鏡都極其講究。在鏡頭里,人的瞳孔、睫毛、皮膚紋理和行走的姿態,動物飄逸的毛發質感,大自然中雪粒子飛濺、水浪波動和拍打的效果,城市建構、光影效果以及人與時空的關系處理,都逼真到幾乎看不出一絲破綻。這意味著繼文本、圖像之后,先進的AI技術已經拓展到視頻領域,并呈現出如此完美的效果。這不禁讓人感慨:AIGC(AI-Generated Content,人工智能技術生產內容)顛覆性革命來了!也有人預測:影視從業人員準備好失業吧!那么,Sora的誕生到底意味著什么?它會給未來影視藝術創作帶來怎樣的影響?影視行業從業者以及任何一個想進行影視創作的人,又該如何面對Sora?筆者就這些問題,嘗試做一點探討,以拋磚引玉。
一、Sora的顛覆性:從AIGC到AGI
在ChatGPT橫空出世后,人們就開始從文字生成轉向圖像甚至視頻的自動生成,涌現出Runway和Pika等初創公司。但Sora誕生,使OpenAI直接碾壓了這條賽道上的所有其他公司。Sora和其他視頻生成的思路和技術完全不同,它并不是像其他的視頻生成那樣,仍基于圖形、圖像本身的操作來進行,而是基于一個完整且復雜的物理引擎來創作視頻。根據OpenAI官網發布的技術報告推測,Sora應該是通過大量訓練,掌握了人類觀察世界、描繪世界、表現世界的能力,只要給予它一定的文字提示,它就可以自己形成這些表面看起來是2D動態畫面,實則完全表現出3D世界物理規律的視頻。也就是說,Sora懂得人所看見的這個世界了,它可以理解人類語言的描述,通過已有知識儲備外加想象,模擬并輸出運動中的物理世界和人物情緒。
這是一場顛覆性的變革。一方面,它顛覆了影視行業的內容生成方式。影視行業繼PGC(Professional Generated Content,專業生產內容)和UGC(User Generated Content,用戶生產內容)之后,擁有了AIGC的新型內容的生產和創作方式,幫助創作者提升生產效率、創作形式和內容,實現創意的快速表達和傳播。Sora通過快速文本提示,創建逼真且富有想象力的高質量影像,還可以在單個生成視頻中創建多個鏡頭。除了像素質感,其生成視頻的光影效果也相當不錯。它還顛覆了以往常規CG(Computer Graphics,計算機生成圖像)電影工業的特效制作。在以往的電影CG特效中,都需要先建模,然后進行渲染,小到動物的每根毛發,大到整個城市的空間構造,所有鏡頭拍攝到的地方都需要做真實的3D建模以及3D渲染。據電影《阿凡達2》的特效團隊稱,為做出電影中大量的海浪、水波紋等特效鏡頭,團隊用粒子特效模擬出每個水分子,利用水的物理方程來模擬流體的特質,一幀幀地把它們渲染出來,歷時好幾年。水下拍攝是電影特效中最難的部分,卡梅隆曾花了大半年的時間,僅為了測試水下動作捕捉情節。但是現在,只要給Sora一堆文字提示,就可以很快生成這樣的特效視頻,大大縮短了時間和成本。特效、攝影、燈光甚至演員、導演等傳統工種,在Sora面前都不具備優勢。Sora不僅可以讓電影拍攝周期變短,更降低了影片拍攝的壁壘。
當然,從另一方面來看,Sora不僅是一個文生視頻的AIGC工具,它還讓AGI(Artificial General Intelligence,人工通用智能)成為可能。如果說,之前的ChatGPT解決了AI對人類語言的理解問題,實現了機器和人之間的互動,那么Sora解決了AI對這個世界的理解問題,實現了機器和這個世界的互動。在對世界模型的了解和認知上,AGI獲得了巨大的突破,即具有與人類相當或更高的認知能力的智能系統,能夠理解、學習、計劃和解決問題,其目標是實現類似人類的廣泛智能。Sora看似是一個工具,實際上反映出AI對這個世界已經形成了從文字到圖像,又從圖像到3D模型及物理定律的理解。而且,不只是理解,它還可以想象當世界中的萬物發生互動的時候,畫面應該如何表現。Sora不僅給影視行業帶來地震,它的出現對人工智能乃至人類社會都具有里程碑式的重要意義。英偉達創始人兼首席執行官黃仁勛認為,未來所有的行業都會成為科技行業。[1]在這種背景下,水能載舟,亦能覆舟,Sora可能是影視從業者的AIGC工具,也可能成為完全替代他們的AGI。目前看來,它完全可能擊垮廣告影視和短視頻行業。因為相較于電影,廣告影視和短視頻短平快,成片時長短,視覺呈現要求大于敘事要求,只要用戶/客戶輸入要求,它就能輸出用戶/客戶所要的視頻內容。而Sora因為現有時長限制,一時還無法完全沖擊影視行業,其工具屬性更勝。但它已經可以構建時空及富有情感的角色,也可以生成多角度的連續視頻,并實現無縫轉場,所以只要Sora突破60秒的時長,并解決好角色保留和視覺風格統一等問題,那對于傳統的影視行業可能就是真正的顛覆了。
二、影視創作的“不變”法則:虛構與真實多維度深入融合
如果拋開行業發展的問題,單從影像創作的本身來看,我們可以發現Sora為了讓自己看上去更逼真,無論是影像內容、色調、鏡頭設計,還是拍攝的對象及其情感表現、行為動作等,都在盡力對傳統影像進行模仿。
電影的誕生,始于盧米埃爾把攝像機放在工廠大門以及火車站臺前,一鏡到底地記錄真實世界里的真實生活。后來,隨著戲劇家、視覺藝術家、剪輯師以及各類新技術進入電影創作,電影在紀實的同時,也擁有了虛構性,并使紀錄片單獨成為一種類型。雖然電影理論家們對此仍有爭議,有的偏向虛構,有的堅持真實,尤其是電影本體論,該流派認為電影的使命是用世界自身的形象重塑世界,強調表現對象的真實、強調敘事的真實、強調時間的真實延續并且嚴守空間的統一。但不可否認,電影的魅力就在于它可以講述虛構的故事,可以虛構時空,可以通過虛構聲音、色彩、立體感等打造出一個幻境,但虛構時空中的虛構故事,其中的人物及其情感還是真實的,各種物理規律也都是真實的。
我們一直說,電影是“造夢機器”,但它之所以比同樣可以造夢的小說、戲劇、音樂甚至幻覺本身更讓人熱愛,是因為它可以讓人直觀地看見夢境,并可以“以假亂真”。電影的創作就是把虛構性和真實性進行多維度調和,通過可視化的情節,構建出讓人信以為真的景象。這一景象是幻境,是打造出的人類幻想,但里面必然存在著真的成分,比如真實的物理規則、真實的情感等,才得以讓觀眾信以為真,讓人接受并喜歡看這樣的“夢”。這是影視創作一直以來的不變法則。如果說以前的電影還偏向于表現或展示真實的世界,那么,現在的電影已經越來越愛打造虛擬的世界,玄幻片、魔幻片、科幻片等層出不窮,但這些電影類型依舊脫離不開真實性。比如,《侏羅紀公園》雖然讓滅絕的恐龍在現代社會起死回生,所有恐龍的行為特征卻都是真實可靠的;《阿凡達》虛構出潘多拉星球,書寫的卻是每個人都可以看懂的跨越種族的愛情故事;《星球大戰》系列打造出銀河各國,骨子里則是一個“俄狄浦斯王”的傳奇史詩故事;《盜夢空間》試圖重新界定時空,影片里面有相當令人信服的邏輯性和科學性來清晰地闡釋這個核心概念。
反觀Sora生成的影像,它很好地實現了虛構與真實的多維度深入融合。其與傳統電影創作有相同之處,也有不同之處。傳統電影可以拍攝實景、真人,當然布景和服化道也可以對真實性做一些虛構化處理。Sora則是大模型的產物,大模型里面是一個虛擬世界,無非重力、彈力、浮力等物理規則已被錄入其中了,所以,它能模擬很多現實的動作和效果,文生視頻只是其中一個功能,最終的效果是呈現出一個充滿真實感的虛擬世界。Sora生成的影像讓人們稱贊不已,不是因為其影像內容有多么特別,畫面有多么優美,拍攝對象有多么好看,而是它全部是虛構的,且里面所有的動作、表情、規律又都是符合這個世界的,是“真實”的。Sora生成的視頻大致可以分為兩類,一類是試圖表現或者建構出真實世界的視頻。比如在東京街頭走路的女人,如果是真人實景拍攝的影像,城市和人物走路的真實感根本不用擔心,但在Sora生成的這個視頻里,景和人都是虛擬的,Sora要做的是將虛擬的內容真實化,盡量讓這個馬路場景像東京街頭,讓這個女人看起來像個真人,讓她的走路姿勢看起來像真人在走路。再如雪地里打滾玩耍的一窩小金毛,狗的毛發、神態,以及用鼻子拱雪時飛濺的雪粒子,所有的效果都讓人感覺非常真實。另一類則是直接構建虛幻世界,在虛構中實現真實的物理規律或表現人物的真情實感。比如兩只海盜船在咖啡杯里的戰斗,咖啡掀起驚濤駭浪,兩只船的關系以及它們與咖啡波紋的關系都非常準確。又如在一個美術風格為3D和現實的動畫場景里,一個毛茸茸的矮個子怪物跪在融化的紅燭旁,張開嘴巴凝視著火焰,那種天真、頑皮的神態描摹,和人類幼兒第一次看見新鮮玩意的神態幾乎一致,而且火焰的光映照在怪物的臉上,光影效果也非常真實和自然。再如華麗的珊瑚礁紙工藝品世界里,到處都是五顏六色的海洋生物,視頻里出現的每個動物都有很準確的紙折質感。Sora生成的動畫也一樣符合物理運動規律,包括跟隨重疊、動作緩沖等。從這個意義來說,Sora生成的影像與傳統影像并沒有質的不同,只是兩者創作使用的技術不同、工具不同,制作的方式方法不同。但兩者仍存在一個很大的差別,即Sora完全通過虛構呈現真實感。
影視藝術的發展與技術密不可分,每次的技術發展都會給電影帶來新的表現方式,電影創作似乎也一直在技術的影響下,從記錄真實擴展到實現虛構,又在虛構性中尋找自身的真實性。人類對世界的認知、經驗與幻想,在影視創作中被多維融合并進行呈現。但Sora完全是用虛構來呈現真實。每個人的腦袋里都存在著這樣或那樣虛幻的“夢”,按傳統的影視創作方式,需要動用力量才可能拍攝出一部作品,Sora卻很容易幫助人類實現“造夢”,大大減少了影視創作的難度。如果埃隆·馬斯克旗下公司的腦機接口發展到一定程度,一旦連接Sora就將是一個新世界,人類腦中所想的,連上腦機,戴上眼鏡,就會呈現相關影像,還可以分享給別人。當然,也有可能Sora自己先學會虛構故事,然后構建看上去非常真實的畫面,輸出給人類看,甚至讓人類走進它所營造的逼真的夢境里。如果那樣,人類是否還能分清虛構與現實的邊界呢?
三、“后Sora”時代的影視藝術:作為“變量”的文學如何起作用
智能手機普及以后,拍照功能的上線,使照片的產生量指數級地增加;攝像功能疊加各種剪輯APP,使視頻的產生量指數級地增加。可以想見,Sora的出現將使很多人可以創作有電影質感的敘事性影像,影視創作的產生量也會指數級地增加。
但是,量大不代表質高。Sora會帶來行業的變化,也會讓人擁有“科技平權”的可能性,只要會使用Sora,就可以把自己的創意變成電影。OpenAI在官網陸續公布的幾十段長短不一的視頻,均根據文字提示生成。人機交互實現以后,人類自然語言就可以成為編程語言,技術鴻溝將完全彌合。人不需要懂大模型和編程語言,也不用懂渲染和構圖,只要擁有想象力、創造力和審美力,就有了視頻創作的前提條件。當然,要真正完成影視藝術的創作,還需要一些與文學有關的能力。
首先,人需要擁有計算機思維的文字能力,并學會用這樣的語言和Sora協同創作。雖說人類的自然語言就可以成為編程語言,但并不代表隨便輸入一段文字就可以讓Sora生成你想要的影像。人要學會把腦子里面想到的具象世界通過抽象的文字描述出來,與AI對話,實現創作。人想得越清晰、越細致,描述得越精準,生成的影像才越接近人想要的畫面。未來行業重新分工,可能有一個新的職業會誕生,就是“描述師”。我們看到OpenAI所發布的已有Sora生成視頻的文字提示,有的寫得很簡單,比如“與中國龍一起慶祝中國農歷新年的視頻”,這樣生成出來的影像會有很多種可能性,人的創作主體性很弱,Sora的發揮空間很大。但是,如“鏡頭跟隨一輛帶有黑色車頂行李架的白色老式SUV,它在陡峭的山坡上一條被松樹環繞的陡峭土路上加速行駛,輪胎揚起灰塵,陽光照在飛馳于土路上的SUV上,給整個場景投下溫暖的光芒。土路蜿蜒延伸至遠方,看不到其他汽車或車輛。道路兩旁都是紅杉樹,零星散落著一片片綠意。從后面看,這輛車輕松地沿著曲線行駛,看起來就像是在崎嶇的地形上行駛。土路周圍是陡峭的丘陵和山脈,上面是清澈的藍天和縷縷云彩”這樣的提示語言就很細致、精準,生成的影像就和人想象中的接近很多。提示詞里不僅需要描述人物、動作、場景,還可以對影像風格、景別設計、鏡頭運動、光影效果以及所呈現出來的藝術感覺做設定。如“一個美麗的剪影動畫展示了一只狼對著月亮嚎叫,感到孤獨,直到它找到狼群”,就設定了剪影動畫、表現孤獨之感等要素。“這張維多利亞冠鴿的特寫照片展示了它引人注目的藍色羽毛和紅色胸部。它的羽冠是由精致的花邊羽毛制成的,而它的眼睛是醒目的紅色。鳥的頭微微向一側傾斜,給人一種帝王和威嚴的印象。背景是模糊的,吸引人們注意到這只鳥引人注目的外表”,就設定了大景深、大特寫的鏡頭,以及拍攝對象的外觀、神態、動作等。句子是實在的圖像。在Sora這里確實如此:人類的幻想是具象的,但它首先要成為文字。句子成為人類對現實世界的理解和描述的一種形式。影像藝術的生成取決于句子。句子是否承載了人類有價值的思想、情感和經驗,句子是否細致準確,決定著影視作品的藝術性。
其次,人要學會用Sora講好一個故事。Sora現在能產生60秒的影像片段,但一個完整的影視故事是由大量的60秒片段組成的。片段之間要有關聯,還要有很多關于主題的設計、劇本的編寫、腳本分鏡頭的策劃、臺詞的配合等,這都給人提供了創作空間。影視創作需要講故事,但怎么講這個故事,即有無敘事的能力才是影視創作藝術水平高低之體現。敘事是從文本之初就開始滲透的,有的也由影像和剪輯效果帶出。然而,在Sora可以完成影像和剪輯效果的背景下,人類是否有能力控制文本,就變得更重要了。觀眾看影片,首先關注的往往也是文本,尤其是敘事結構和作品主題,其次才是局部的風貌描繪或影像如何呈現等。這些都屬于電影文學性的問題。實際上,熟悉中國電影史的人都知道,20世紀80年代初期,中國電影理論界曾經出現過一次非常重要且影響頗為深遠的論爭,即關于電影文學性的討論。a著名導演張駿祥在一次會上發言,強調了電影的文學性。他認為導演要在兩方面負責一部電影藝術質量,一方面要力求體現作品的文學價值,另一方面要創造性地運用好電影的表現手段。電影是藝術,而且是綜合藝術,不單是綜合藝術,而且是文學。導演一方面不能只強調電影表現手段,不考慮作品的文學價值,另一方面又要善于運用電影的特殊手段,把作品的文學價值體現出來,節奏、氣氛是由劇本提供的,風格、樣式也是由劇本決定的,這也是導演必須用電影特有的手段來體現、完成的文學價值。[2]張駿祥將電影的文學性放置在一個很高的位置。后來,他的想法遭到反駁,有理論家認為電影并非文學的復制品,有它本身的藝術規律,電影畢竟不限于運用文學表現手段,還可以通過多種藝術表現手段(畫面結構、演員表演、蒙太奇、音響、色彩等)來體現所要表達的內容,而這些東西在電影劇本中往往都只能看到有限的提示。[3]在這樣的理論影響下,第四代、第五代導演“丟掉戲劇拐杖”,確實產生了大量電影化佳片,探索出全新的電影語言和藝術表達方式,為中國電影帶來巨大的創作想象空間。但“后Sora”時代,我們要重新認識電影文學性的問題。電影語言和藝術的表達方式,在文生視頻里是通過文字描述出來的。敘事可以滲透在文本之初,也可以仍由影像和剪輯效果帶出,但創作者首先得寫出來。相較文學,電影中可調用的元素更多,環節更豐富,因此電影表達方式中的“文字”也就更加多樣化。這很像寫交響樂的樂譜,把具象轉換成抽象的符號,然后使各種符號互相配合,以形成豐富有趣的效果。未來,編劇、導演、演員、攝影、燈光等工種或許就像不同的樂器,需要通過一個人譜寫的文本,讓他們互相配合,而Sora則負責根據樂譜來演奏出交響曲。
最后,人需要找到人所擅長的部分,為Sora提供其無法生成的、不可替代之創意。當科技、知識和算力在被人工智能無限替代的時候,人的“心性”力量是每個人更應當關注的。所謂“心性”,就是人心,人要懂人。一方面,要有同理心,會共情。一個影視作品的創作,應該明白觀眾是誰,然后根據他們的情況,尤其是他們的情緒,去做問題的界定、項目的策劃、創意的構思。創意可以是一個人設計的,也可以由一群人通過頭腦風暴的方式來產生。創意還要重視觀眾的反饋,根據觀眾的感受進行調試,選出最受人歡迎的想法來做原型。另一方面,要懂人情世故。黃仁勛曾舉例說,如何將300人安排在12桌中,讓每個人都能在用餐時感受到和諧,這是一個婆婆(a mother in law)就能解決的問題;而婆婆能解決的問題,量子計算機卻不行。[1]這中間,關鍵就是人文科學的部分、文化的部分、文學的部分。研究人的學科不只有文學,其他人文社會科學諸如哲學、經濟學、政治學、歷史學、心理學、宗教等也都是以人為研究對象的。但文學更重視以人為描寫中心,創造出活靈活現的、生動的典型形象,努力理解和表現出人的思想和感情。而這些,與人的“心性”聯系最密切。愛、同理心和人情世故,是人區別于AI的本質,也是人有能力實現從0到1的創造的原因。電腦和人各有優勢,如果讓一個精通人情世故、會共情的“婆婆”運用先進的計算機,那肯定無敵。
“后Sora”時代的影視藝術創作,可能意味著一個新型文學時代即將來臨。就好像打敗方便面的是外賣和預制菜,而不是更好的方便面,影視創作也如此。未來影視藝術也許會與文學的關系更緊密,影視藝術的好壞,是由作為“變量”的文學所決定的,人在與AI協作時,需要加以文學性、“心性”和文化的助力。
多說一句關于藝術邊界的題外話。Sora是通過研究和模仿人類世界和作品來進化的,其生成的影像仍是對傳統影像的模仿,在此過程中,并沒有新藝術技法的產生。而且,Sora生成的影像都是基于3D或者仿真的,它在2D方面會有怎樣的表現還不得而知。藝術源于模仿,但最終一定要有所突破,在人類藝術發展的長河中,常常是人類的靈光一現,才推翻前人的藝術技法,探索和推進了藝術的邊界,比如動畫《小蝌蚪找媽媽》是建立在二維平面和線條上的想象,《紅辣椒》則是純感性、無理性的。就現在來看,這也是人超越Sora的地方。
參考文獻:
[1]黃仁勛. 2024年,各行業都是科技行業[EB/OL].(2024-02-10)[2024-02-12].https://ishare.ifeng.com/c/s/v002ytIqvRAECNST0qTDurn7x S853WhnU6XvhDn8BarO6vc7MjyI9MWCM8bEVX5cX-_f1k32dGtzD4xSn39zE9G9XGw.
[2]張駿祥.用電影表現手段完成的文學——在一次導演總結會議上的發言[J].電影文化,1980(2).
[3]鄭雪來.電影文學與電影特性問題——兼與張駿祥同志商榷[J].電影新作,1982(5).
(責任編輯:馮靜芳)
a 關于這場電影觀念論證的相關文章可參見中國電影藝術編輯室編:《電影的文學性討論文選》,中國電影出版社1987年版。