自2022年11月30日ChatGPT橫空出世以來,世界人工智能界的焦點都聚集于此。每隔一段時間就在社交平臺引起一波討論,幾乎每次的的話題和閱讀量都能夠達到“爆”的程度。
在國內的社交平臺搜索相關內容,ChatGPT相關的話題,閱讀量達到了“億”次,話題內容也日漸豐富:“ChatGPT讓蘋果急了”“美國89%的大學生用ChatGPT做作業”“ChatGPT兩個月活躍用戶破億”“ChatGPT有多靠譜”“ChatGPT曾回答如何毀滅人類”……據瑞銀集團2月3日的一份報告顯示,在ChatGPT推出僅兩個月后,它的月活用戶已經突破了1億,成為史上用戶增長速度最快的消費級應用程序。短短一周之后,ChatGPT的官方網站已經無法登陸,官網已處于“滿負荷”狀態。

面對ChatGPT的火爆,中國工程院外籍院士、前任世界首富、微軟的聯合創始人比爾·蓋茨曾直言:不論曾經多么火爆,他本人并不看好Web3和元宇宙,但是ChatGPT則讓他“窺見了未來”,ChatGPT方法和創新速度都令他印象深刻。在人工智能業內,ChatGPT出現的意義被很多人視為:等同于“互聯網”的誕生。
人工智能技術發展到今天,從概念誕生到成果研發,再到實際應用及場景下沉,僅有短短70年左右,但是其底層技術已相對成熟,甚至早已經融入到我們生活的方方面面。比如隨口而來的“siri”“小度小度”“小愛同學”等對話機器人就是最典型的代表。如果進行寬泛的歸類,風靡全球的ChatGPT亦在其中。不過凡是使用過這些智能機器人的用戶肯定都遭遇過“命令理解不清”的尷尬。用戶提問后,被智能機器人的一句“對不起,我沒有明白你的意思”拒之門外。
ChatGPT技術領先的地方就在于強大的理解能力,雖然它同樣會被一些提問卡住。但基本上絕大多數提問,ChatGPT都能給出令人滿意甚至超乎想象的回答。
2023年2月,美國知名全科學習網站Study.com針對1000名學生進行了一項調查,結果顯示超過89%的學生使用ChatGPT完成作業。最令人感到意外和震驚的是,北美密歇根大學哲學系教授Antony Aumann在審閱作業的時候發現了一篇他認為自己教師生涯中“有史以來最好的論文”,這篇文章結構完整、邏輯縝密、言語簡介清晰、舉例恰當精準。但是最后Aumann發現,這篇文章是由ChatGPT完成的。因此,美國教育界對ChatGPT全面封殺,學術界對于ChatGPT的使用也慎之又慎,而且嚴禁將其列為“合作著者”。可見ChatGPT的智能化程度已經遠超同類的人工智能,甚至足以適應社會生活中的部分腦力勞動場景,如寫論文、編程代碼等。
ChatGPT的技術關鍵就在后綴上。所謂“GPT”是“Generative Pre-trained Transformer”的縮寫,即“生成型預訓練變換模型”的縮寫。ChatGPT使用的就是第三代GPT模型,此前還有GPT和GPT-2。
在GPT-3誕生之初,開發者就對其進行了“人工智能基本考核測試”——圖靈測試。圖靈測試,指的是是驗證一臺人工智能機器人是否需具有“類人智慧”的最基本測試,該測試是由人工智能之父艾倫·麥席森·圖靈提出,一般指的是人類和人工智能裝置在被隔開的情況下,人向人工智能裝置提問,如果被測試裝置回答的問題,讓測試者超過30%的幾率“誤判”對方是“人”,那么即認為該裝置通過了人圖靈測試,是具有“人類智能”的設備。
結果發現,GPT-3不僅順利通過了圖靈測試,而且它的回答自然流暢,相較于其他的人工智能大模型,它更像是個“人”。甚至測試者驚呼:“如果在十年前用同樣的問題做測試,我會認為答題者一定是人。現在,我們不能再以為AI回答不了常識性的問題了。”
其實ChatGPT并不是第一個通過圖靈測試的人工智能機器人,早在2014年,就有AI通過了圖靈測試,實現了“類人化”的進步。2014年6月7日,英國皇家學會舉行的2014圖靈大會上,人工智能機器人尤金·古斯特曼冒充一名13歲的烏克蘭男孩,回答了評委一系列問題,其中有33%的評委被“騙過”。這是1950年圖靈測試被提出之后首次有人工智能通過該測試。
2018年5月,Google I/O 2018大會上,Alphabet董事長 John Hennessy公開表示,谷歌的AI系統打電話給一家美發店以真人對話的形式,成功預約了理發服務。在狹義上說,本次實驗中谷歌的AI系統通過了圖靈測試。從技術層面說,這一測試確認了人類已經初步實現讓人工智能“騙過人類”的算法。而如今ChatGPT的出現,則進一步深化了這一項“能力”,甚至在某些智能工作、技術領域出現了取代人類的趨勢。
GPT-3作為人工智能大模型,其開發者是美國人工智能公司OpenAI。GPT-3的神經網絡包含了1750億個參數,發布之初是當時世界上最大的神經網絡。2020年9月22日,微軟宣布取得了GPT-3的獨家授權,這也為ChatGPT的誕生奠定了技術基礎。
雖然GPT僅僅是一種語言模型,并不能像其他AIGC,如Dall-E 2那樣直接制作視頻,也無法像Midjourney一般繪畫出《太空歌劇院》這樣的藝術品,但是僅憑借語言、文字再加上1750億神經參數的加持,GPT的學習能力和理解能力極強,能夠理解提問者的問題,并給出最正確的回答,因此顯得更加智能。
正如前文所言,人工智能機器人的真正的難點在于如何讓它學習、訓練,逐漸模仿人類的思維模式甚至是交流習慣,然后回答出符合提問者心理預期的答案,這需要巨大的訓練量。此外,除了龐大的訓練量之外,維持GPT運行的成本更算得上是天文數字,也成為橫亙在諸多科技公司面前的一座大山,底層邏輯和基層技術很多公司都已經具備,但是面對龐大的訓練量和運營成本,所有的野心都只能望而卻步。
隨著ChatGPT的火爆,其背后的運營成本也被逐層扒出。據了解,OpenAI為了能夠讓GPT-3的表現更接近于人類,用了45TB的數據量、1萬億個單詞來訓練它,平均每運算一次都要花費450萬美元。人工智能企業小冰公司為微軟全球最大的人工智能獨立產品研發團隊,其CEO李笛表示,若用ChatGPT的方法,以小冰框架當前支撐的對話交互量計算,每天成本將高達3億元,一年成本超過1000億元。對于這樣的研發成本,放眼全球都不見得有幾個公司能夠拍著胸脯說敢嘗試,更何況還要承受研發失敗的風險。
既然技術層面上已經成熟,中國何時能擁有如此自己的“ChatGPT”?可以明確的是,ChatGPT的研發門檻在于“錢”。試問有幾家企業敢于承擔失敗的風險,投入巨大的人力物力開發出市場應用場景尚不明晰的人工智能呢?此外,近些年來西方國家在芯片上對我們的制約也在一定程度上限制了我們的技術進步。中國的創新之路,任重而道遠,我們所要承擔和承受的遠超乎想象……