《股市動態分析》研究部

去年年初,尤其是春節期間,ChatGPT的橫空出世引發了普通人澎湃的討論熱情與A股AI板塊的持續上漲,此后海內外在AI大模型投資上展開了軍備競賽。一切似乎那么類似,近期,也是春節期間,OpenAI發布首個文生視頻模型Sora,在自然語言輸入基礎上可以直接輸出長達60秒的視頻,包含高度細致的背景、復雜的多角度鏡頭,以及富有情感的多個角色,加上國內魅族AllinAI和OPPO開啟AI手機新時代等動作,引發了新一輪的AI討論熱潮。
2月16日凌晨,OpenAI發布了文生視頻大模型Sora,它能夠根據文本提示創建詳細的視頻、擴展現有視頻中的敘述以及從靜態圖像生成場景。
文生視頻大模型是一種能夠由AI生成視頻內容的大型機器學習模型。文生視頻基于用戶的自然語言描述準確地生成相應視頻內容。以用戶給出的文本、圖像、音頻、視頻等內容作為提示(prompt),模型能夠處理并結合用戶提供的內容,創造出完全自主生成或拓展的視頻。這些模型通常基于深度學習,尤其是自然語言處理(NLP)、計算機視覺(CV)和語音識別(ASR)等技術的融合。
以OpenAI官方發布的范例視頻為例,輸入提示詞:“一位時尚的女士漫步在東京街頭,街上充滿了溫暖的霓虹燈和生動的城市標志。她穿著黑色皮夾克、紅色長裙和黑色靴子,手中提著一個黑色手提包。她戴著太陽鏡,涂著紅色口紅。走路時自信而隨意。街道潮濕且反光,形成了彩色燈光的鏡面效果,許多行人來來往往。”(見圖)
雖然Sora不是最早的文生視頻應用,“文生視頻大模型”也并不是一條全新的賽道。在OpenAI登場之前,頭部大模型研發商幾乎都擁有自己的文生視頻大模型,例如Google的Lumiere以及StabilityAI的SVD(StableVideoDiffusion),甚至已經誕生了垂直于多媒體內容創作大模型的獨角獸,例如視頻生成大模型Gen-2的開發商Runway,在2023年6月底完成由Google、Nvidia、Salesforce參與的C輪融資后,估值超過15億美元。
但Sora的呈現仍然驚艷,視頻中的主體穩定可控,可實現多角度切換,時長方面也突破,最長能生成60秒視頻,隱隱有了生產力工具的影子。它的推出已經標志著生成式AI迎來一個里程碑。
與此前的視頻生成模型相比,Sora主要實現了以下突破:
視頻時長達到60秒:Sora目前可以根據文本要求生成60s的連貫視頻,并保持視頻主體與背景的高度流暢性與穩定性。
文本的深度理解能力:Sora可以準確理解用戶的文本指令,無論是復雜的動作場景還是細膩的情感表達,Sora都能夠精確捕捉并展現。
對真實世界的理解:生成的視頻除滿足了文本要求的主題、要素外,Sora對物理規律的遵循程度較高,對于光影反射、運動方式、鏡頭移動等細節的呈現效果較為逼真,都展示了極高的質量。
根據OpenAI官方介紹,目前Sora具備生成包括多個角色、特定類型的運動、準確細節的主體和復雜場景的能力。同時,還能夠創建多個鏡頭,模擬復雜的攝像機運鏡效果,使得生成的視頻更加生動。

資料來源:OpenAI官網
3D一致性:Sora可以生成攝像機動態運動的視頻。隨著攝像機的移動和旋轉,人物和場景元素在3D空間中的移動會保持一致。
當然了,Sora還有很多瑕疵,還不夠好,也有人質疑把AI用在短視頻上,沒有太大價值。真正帶來壓迫感的,是Sora不可思議的進化速度。
Sora就是AI能力體現,它并不完美,但如今看起來傻傻的、只支持生成“4秒視頻生成”并且“掉幀明顯到像幻燈片”的Gen-2其實是2023年6月發布的產品,距離Sora的發布日不過8個月。
2023年11月,Meta發布的視頻生成大模型EmuVideo看起來在Gen-2上更進一步,能夠支持512×512、每秒16幀的“精細化創作”,但3個月之后的Sora已經能夠做到生成任意分辨率和長寬比的視頻,并且根據上面提到的開發者技術論文,Sora還能夠執行一系列圖像和視頻編輯任務,從創建循環視頻到即時向前或向后延伸視頻,再到更改現有視頻背景等。
2月18日,OPPO創始人、首席執行官陳明永發表員工內部信認為,2024年是AI手機元年,未來五年AI對手機行業的影響完全可以比肩當年智能手機替代功能機,這輪由大模型支撐的AI技術正在重構手機行業的未來,AI手機的全新時代正在加速到來。
同一天,魅族也官宣將AllinAI,停止傳統“智能手機”新項目,全力投入明日設備AIForNewGenerations,2024年魅族面向AI時代全新打造的手機端操作系統將進行系統更新,此外,魅族首款AIDevice硬件產品也將在今年內正式發布。
除了OPPO和魅族之外,華為、小米、OPPO等已開始在手機中接入AI大模型,vivo、三星已開始重點發布AI手機,其中三星GalaxyS24系列在全球范圍內展現出旺盛需求量,在荷蘭、印度和韓國等多個市場的創下預訂記錄。
各大手機廠商關于AI手機的重點布局表明,隨著全球手機市場換機周期延長、消費創新空間有限、行業惡性競爭加劇,手機行業呈現存量競爭態勢,同時手機產品單純依賴硬件升級和參數競爭,已無法滿足廣大消費者多樣化、全面化的使用需求和使用體驗,行業亟需尋找新的可持續發展方向,而AI技術有望在手機行業的應用加速發展,并將對手機行業產生深遠影響。
另外,隨著AI技術的飛速進步,AIPC在2024年的CES展覽上備受矚目。接近半數PC都宣稱具備AI功能,預示著AIPC市場的蓬勃發展。
群智咨詢表示,2024年,AIPC初現端倪,引領著新一輪的科技革命。PC制造商開始向AI技術領域轉型,競相推出自家的AIPC產品。群智咨詢預計,2024年作為AIPC發展的元年,AI筆記本電腦出貨量達到1300萬臺,在筆記本電腦市場滲透率達到7%,2025年滲透率預計逼近30%,2026年滲透率會超過50%,2027年AIPC成為主流PC產品的類別,市場滲透率逼近80%。
根據彭博行業研究,邊緣設備(用于控制進出網絡間邊界的數據流的硬件)推理需求可能會加速個人電腦和智能手機的升級換代(這些設備目前不太能夠跟得上AILLM的繁重處理、內存和存儲要求),同時催生出可穿戴設備和智能音箱以外的新類別。隨著更多應用在OpenAI的ChatGPT、谷歌的PaLM2和Meta的LLaMA等基礎模型之上得到開發,對推理的需求料將增加。
資本端同時傳來新消息。在完成最新交易后,OpenAI的估值已飆升至800億美元以上。這筆交易來自于ThriveCapital精心策劃的要約收購。
只不過,和去年相比,投資人的心態變了。不是人人都有機會投中OpenAI,但OpenAI的能力邊界卻實實在在影響著一批創業公司和背后的投資人。
網上有一句話可以反映其火熱:今天,所有VC的會上都在談Sora。