
1968年,美國科幻作家菲利普·迪克推出了他最負盛名的作品——《仿生人會夢見電子羊嗎》,這也是經典科幻電影《銀翼殺手》的小說原著。在小說中,作者通過講述自然人與仿生人的博弈,對人性和倫理進行了探討:當人工智能發展到一定程度,當機器人也會思考、睡覺、做夢的時候,我們該如何與人工智能相處?
自艾倫·圖靈在1950年的《計算機器與智能》論文中提出“圖靈測試”的概念以來,人工智能技術就成為人類社會對未來世界進行預想時最為常見的要素,與之相伴隨的,則是對人工智能是否會超越、替代人類的探討甚至是擔憂。如今,人工智能正在展現出越來越逼近人類智能的水平,特別是2022年以來,AIGC(人工智能生產內容)在繪畫、文字領域的應用,讓人驚呼人工智能竟可以“像人一樣”進行創作。
在2022年11月,美國人工智能研究機構OpenAI發布了全新聊天機器人模型ChatGPT,它不僅“能說會寫”,還能自動修復bug,在發布后引發全民與人工智能的“瘋狂”聊天。那么,以ChatGPT為代表的AIGC浪潮迭起的背后蘊含著哪些商機?

2022年11月30日,由馬斯克、美國創業孵化器YCombinator總裁阿爾特曼、全球在線支付平臺PayPal聯合創始人彼得·蒂爾等硅谷科技大亨創立的美國人工智能研究實驗室OpenAI發布了免費機器人對話模型ChatGPT,引發AIGC界的狂歡。
GPT(預訓練模型)是當下備受關注的AIGC背后的人工智能模型。在2018年、2019年和2020年,OpenAI先后發布了GPT-1、GPT-2和GPT-3三代模型,每一代模型擁有的參數量都較前一代增長了超10倍,甚至是100倍。
其中,作為第一個基于Transformer的預訓練模型,GPT-1采取了預訓練+FineTuning兩個階段,以Transformer的decoder作為特征抽取器,共堆疊12層,擁有1.1億參數。相比GPT-1,GPT-2使用了更多的網絡參數與更大的數據集,其最大模型共計48層,參數量達15億。GPT-3發布于2020年,結構和GPT-2一樣,其模型上到了96層,模型參數約為GPT-2的100倍。可以看到,三代模型所用到的參數量都在大幅增長。
而此次發布的ChatGPT屬于GPT-3.5階段,ChatGPT首次采用RLHF(從人類反饋中強化學習)方式,開始具備聯想能力和記憶能力,對人類語言的理解能力更強。用戶可以與ChatGPT開展聊天、信息咨詢、撰寫文章、修改代碼等互動。一時間,網絡上出現了各種使用ChatGPT的“體驗帖”。從寫郵件、寫文案到寫代碼,ChatGPT受到了大規模的圍觀。馬斯克甚至向ChatGPT提問如何設計推特,并將對話在推特上貼出。

自上線以來,ChatGPT已經擁有超過100萬名用戶。作為基于GPT-3.5的對話式AI,ChatGPT最大的特點即是能夠“理解”對話者的語義,能進行更為有效的反饋和連續對話。基于對超大規模數據的深度學習,ChatGPT在文本生成領域幾乎能“以假亂真”,讓使用者覺得它真的擁有了意識。
不過ChatGPT也并非目前的完美模型,根據OpenAI研發團隊在推出ChatGPT時給出的提醒以及全球網民們的反復試探后發現,ChatGPT至少存在三個方面的問題:其一是ChatGPT背后的大型語言模型的訓練集最近數據截止于2021年底,這也就意味著,發生在2022年的事情,它并不能給出準確答案;其二,ChatGPT的回答的質量和準確度并不穩定;其三,提問者輸入的問題描述會影響ChatGPT回答的準確性。
事實上,以GPT為代表的AIGC在今年以來在全球風靡。在元宇宙、Web3等概念火熱的大背景下,AIGC也乘勢崛起。所謂AIGC是對應于互聯網的PGC(專業生產內容)、UGC(用戶生成內容)、PUGC(專業用戶生成內容)等概念,AIGC就是通過人工智能技術來自動或輔助生成內容。
2022年以來,人工智能漫畫全網火熱,海內外涌現出多個應用軟件,包括2022年2月由谷歌推出的DiscoDiffusion,2022年4月OpenAI的DALL·E2和2022年7月Meta的Make-AScene等。
其中,DALL·E是OpenAI于2021年1月6日發布的新模型,可以根據文本生成圖像,一年多后發布了升級版本——DALL·E2。與DALL·E相比,DALL·E2在生成用戶描述的圖像時具有更高的分辨率和更低的延遲,新版本還增添了比如對原始圖像進行編輯等新的功能。DiscoDiffusion是在2022年2月初開始流行的一個人工智能圖像生成程序,它可以根據描述場景的關鍵詞渲染出對應的圖像,可以在GoogleDrive直接運行,也可以部署到本地運行。
眼下火熱的人工智能繪畫最早可以追溯到OpenAI成立前的2014年,人工智能專家伊恩·古德費洛在這一年提出了算法模型生成式對抗網絡。基于深度卷積神經網絡,生成式對抗網絡將兩個神經網絡進行對抗,即生成器與鑒別器。其中,生成器用于生成“造假數據”,鑒別器用于判斷數據的真偽。而兩者也在對抗中逐漸演化出強大的“造假能力”,這種造假能力則用于圖像的合成。2015年開始,生成式對抗網絡開始被投入應用,成為人工智能生成圖像、處理圖像任務里最常見的算法模型。
過去幾年,AIGC領域也涌現出越來越多的玩家。在OpenAI的GPT-3推出后的兩年內,也有如GoogleBERT等類似的大型語言模型涌現,不過GPT-3的地位依然無法撼動。2021年,GPT-3也被《麻省理工科技評論》評選為“全球十大突破性技術”,認為這種學習自然語言的大型計算機模型,正朝著構建可理解人類、并與人類世界互動的AI邁出一大步。
無論是AI作畫還是AI聊天、寫作、修代碼,人工智能無疑在變得越來越有創造性。2022年國際研究機構Gartner就將AIGC評定為“本年度五大影響力技術之一”。
這樣一個現象級技術應用的出現,自然逃不過嗅覺敏銳的資本家的雙眼。客觀來看,現階段各類AIGC應用雖然打得火熱,但距離大規模應用或商業化仍需時日,不過,這并不妨礙資本在AIGC領域的大力投入。目前,已有多家AIGC企業獲得資本加持。
2022年10月,主打文字生成的人工智能獨角獸公司Jasper.AI宣布完成1.25億美元的A輪融資,融資后估值達15億美元;StabilityAI亦宣布獲得1.01億美元融資,成為身價估值超10億的獨角獸,該公司表示會繼續研發用于生成圖片、語言、視頻的AI生成模型。資本的涌入也在不斷推高AIGC相關企業的估值。例如大數據加人工智能公司Databricks估值已經達380億美元,而OpenAI估值在今年10月也已經超過200億美元。
在我國,目前也涌出了多個AIGC應用,其中不乏互聯網巨頭企業的身影,比如,百度推出的人工智能藝術和創意輔助作畫平臺文心一格;騰訊打造的寫稿機器人“夢幻寫手”;阿里巴巴旗下的人工智能在線設計平臺Lubanner,幫助營銷人員生產Banner。Gartne預計到2025年,生成式人工智能生成的數據將占所有數據的10%。
可以看到,人工智能技術正在快速“進化”,其在人類社會發展道路上的分量也越來越重,隨之而來的,人類與人工智能的和諧共處也成為科技精英關注的議題,就如同馬斯克在談及OpenAI的創始初衷所說:“我們要怎樣做才能保證人工智能帶給我們的未來是友好的?”這個問題的答案或許就藏在每個科學家的努力之中。