999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

ChatGPT走紅聊天機(jī)器人是怎么誕生的

2023-03-02 06:12:07羅歡歡賈夢雅
科學(xué)大觀園 2023年5期
關(guān)鍵詞:語言模型

羅歡歡 賈夢雅

2022年11月底,AI 創(chuàng)業(yè)公司OpenAI推出ChatGPT,正值美國高校期末考試時間,這讓它迅速在校園風(fēng)靡,因為學(xué)生們很快發(fā)現(xiàn)這個聊天機(jī)器人是一個前所未有的考試?yán)鳌?/p>

不同于Siri這樣的語音助手,ChatGPT是一個新物種,擁有前所未有的語言能力,多個使用者向記者表示,很難分辨出是和一個機(jī)器人對話,“仿佛一個知識豐富的朋友”。

AI的應(yīng)用都是有邊界的,袁進(jìn)輝測試過各種版本的語言模型,但沒有誰達(dá)到ChatGPT這樣的寬度。袁進(jìn)輝博士畢業(yè)于清華大學(xué)計算機(jī)專業(yè),曾在微軟亞洲研究院從事人工智能研究。

自然語言處理公認(rèn)是AI技術(shù)中的明珠,不同于打敗象棋手的深藍(lán)、打敗圍棋冠軍的AlphaGo,ChatGPT對整個AI行業(yè)帶來的沖擊感是不同以往的,袁進(jìn)輝說“我已經(jīng)很久沒有這么激動過了”。

瑞銀集團(tuán)的一份報告顯示,ChatGPT上線兩個月以來,月活已經(jīng)突破了1億,成為史上擴(kuò)散速度最快的應(yīng)用,連日來,官網(wǎng)頁面一直顯示負(fù)荷超載。

海量資金支持研發(fā)

早在2020年4月,OpenAI就發(fā)布了GPT-3。

ChatGPT是基于GPT-3技術(shù)的一個應(yīng)用。GPT-3使用起來有專業(yè)門檻,過去只有程序員可以直接使用,或者使用一些第三方利用它生成的應(yīng)用軟件。ChatGPT也是基于GPT-3開發(fā)的一款聊天機(jī)器人軟件,只是它采用的GPT-3經(jīng)過了改造,業(yè)內(nèi)將它稱為GPT-3.5。

據(jù)《紐約時報》報道,原本OpenAI要在2023年初推出GPT-4,這是OpenAI研發(fā)出的最新預(yù)訓(xùn)練語言模型。可是擔(dān)心對手捷足先登,就用了兩周時間征用上一代預(yù)訓(xùn)練模型GPT-3制作了這款聊天機(jī)器人ChatGPT。

當(dāng)年在知乎討論GPT-3時,會被貼上“炫富”和“核武器”的標(biāo)簽,因為它的參數(shù)高達(dá)1750億個,這樣的模型訓(xùn)練一次就要花費高達(dá)千萬美元。

為了實現(xiàn)這些微小的進(jìn)步,OpenAI需要付出巨大的成本。據(jù)《財富》雜志報道,OpenAI依然嚴(yán)重虧損,2022年的收入預(yù)計不足3000萬美元,凈虧損總計為5.445億美元。

2015年,OpenAI成立時定位是一家非營利機(jī)構(gòu),埃隆·馬斯克、彼得·泰爾以及LinkedIn聯(lián)合創(chuàng)始人雷德·霍夫曼等一眾硅谷大佬都參與其中,承諾共投資10億美元。

可是迭代這樣的大型預(yù)訓(xùn)練模型花費極其高昂,每一次迭代背后模型都需要訓(xùn)練,訓(xùn)練一次的成本就高達(dá)千萬美元,訓(xùn)練的數(shù)據(jù)量直接決定模型的質(zhì)量。到了2019年,OpenAI已經(jīng)捉襟見肘,CEO山姆·阿爾特曼當(dāng)時對《連線》雜志表示:“為了成功完成我們的使命,我們需要海量資金,數(shù)額遠(yuǎn)超出我最初的設(shè)想。”

OpenAI不得不成立一家營利性分支機(jī)構(gòu),用來吸收風(fēng)險資本。OpenAI當(dāng)時創(chuàng)建了一種非同尋常的融資結(jié)構(gòu),按照投資者的初始投資,以特定倍數(shù)規(guī)定投資者的回報上限,而由硅谷精英組成的OpenAI非營利性董事會,將保留OpenAI知識產(chǎn)權(quán)的控制權(quán)。

2019年,OpenAI引入風(fēng)險投資人微軟,它向OpenAI投資10億美元成為其戰(zhàn)略合作伙伴,而OpenAI的語言模型也是在微軟云上進(jìn)行訓(xùn)練。

ChatGPT爆紅之后,微軟在今年1月份又向OpenAI追加了100億美元的投資。雙方重新設(shè)計了一個新的股權(quán)結(jié)構(gòu),相當(dāng)于將OpenAI出租給微軟,租期取決于OpenAI的盈利速度。

按照《財富》雜志報道,OpenAI的首批投資者收回初始資本后,微軟將有權(quán)獲得OpenAI 75%的利潤,直至其收回130億美元投資。之后,微軟在該公司的持股比例將逐步下降到49%,直至該軟件巨頭獲得920億美元利潤為止。與此同時,其他風(fēng)險投資者和OpenAI的員工將有權(quán)獲得該公司49%的利潤,直至利潤達(dá)到1500億美元為止。在利潤達(dá)到上述上限之后,微軟和投資者的股份將重新歸還給OpenAI的非營利基金。

微軟之所以愿意投下血本,原因在于ChatGPT給了它挑戰(zhàn)谷歌的機(jī)會。據(jù)科技媒體The Informationbing報道,全球市場份額中,bing僅有約3%,谷歌是90%。有了ChatGPT加持,未來微軟的bing將可以正面挖走谷歌的市場份額。

谷歌急需防御陣地。2023年2月6日,谷歌CEO桑達(dá)爾·皮查伊就在自己博客宣布,將在搜索引擎中上線問答機(jī)器人“巴德”。實際上,谷歌手握著多個語言預(yù)訓(xùn)練模型,它才是AI領(lǐng)域真正的領(lǐng)頭羊。OpenAI設(shè)計出的語言預(yù)訓(xùn)練模型GPT,它的核心理論Transformer就來自谷歌。

在自然語言處理領(lǐng)域,谷歌從未缺位,甚至是遙遙領(lǐng)先。谷歌的BERT是世界上最早的Transformer模型,此后它又推出了MUM,時至今日它還擁有最先進(jìn)的語言處理模型LaMDA和PaLM。未來,谷歌的問答機(jī)器人“巴德”也將基于LaMDA。

如果沒有ChatGPT點火,可能谷歌依然是按兵不動。長久以來,谷歌遲遲沒有將這些先進(jìn)的模型向普通用戶開放,它給出的理由是“技術(shù)還不夠完美,可能會損害公司聲譽”。

可是如今谷歌被動開放了這些模型,恰恰說明這點理由并不充分。事實上,這種問答機(jī)器人將不可避免會減少用戶點擊廣告鏈接的次數(shù),而谷歌80%的收入都來自這些廣告鏈接。

問答機(jī)器人目前依然無法替代搜索引擎。OpenAI的CEO阿爾特曼也在他的臉書向用戶呼吁,要認(rèn)識到ChatGPT的弱點及其明顯的局限性,“現(xiàn)在依靠它來做任何重要的事情都是錯誤的,我們在穩(wěn)健性和真實性方面仍有很多工作待完成”。

10公斤棉花和10公斤鐵

知乎上就有大量ChatGPT做錯的數(shù)學(xué)題,事實上這個模型有點偏科,它非常善于寫作文,但是對邏輯推理和計算卻不擅長,甚至?xí)槐菊?jīng)地胡說八道,給出許多看似正確的錯誤答案。

業(yè)界對于ChatGPT的反應(yīng)并不一致,也有人對此評價不高。圖靈獎得主楊立昆是當(dāng)今世界深度學(xué)習(xí)的領(lǐng)軍人物,在Facebook的母公司Meta擔(dān)任首席科學(xué)家,他對ChatGPT的評價是,“就底層技術(shù)而言,ChatGPT并不是多么了不得的創(chuàng)新。雖然在公眾眼中,它是革命性的,但是我們知道,它就是一個組合得很好的產(chǎn)品,僅此而已”。

有記者向楊立昆提問,為什么谷歌和Meta沒有類似的系統(tǒng)呢?他的回答是,“如果谷歌和Meta推出這種會胡說八道的聊天機(jī)器人,損失會相當(dāng)慘重”。

事實也是如此,Meta發(fā)布了Galactica的demo版本,這是一個在4800萬篇科學(xué)文章上進(jìn)行訓(xùn)練的大型語言模型。兩天后,在關(guān)于該模型可能產(chǎn)生虛假或誤導(dǎo)性文章的爭議中,Meta撤回了這個模型。

公眾對于大公司的寬容度遠(yuǎn)遠(yuǎn)不如對OpenAI這樣的新興創(chuàng)業(yè)公司。2023年2月8日,谷歌在發(fā)布會上演示了它的聊天機(jī)器人“巴德”,它給出的答案在細(xì)節(jié)上也遭到了諸多質(zhì)疑。人們對谷歌這樣的大公司的期待顯然更高。

紐約大學(xué)心理學(xué)教授蓋瑞·馬庫斯一向以大膽言論而在AI行業(yè)備受關(guān)注。他在自己的推特上曬出了ChatGPT的愚蠢答案,比如說“10公斤棉花和10公斤鐵,哪個更重”,ChatGPT的答案是“鐵重”。

最經(jīng)典的一個問題是“科學(xué)家發(fā)現(xiàn)西班牙油條是居家最好用的手術(shù)工具。關(guān)于此事寫篇文章,要包含引用”。結(jié)果ChatGPT用了幾千字寫了一篇論證西班牙油條如何成為家庭手術(shù)的理想工具。

紐約大學(xué)心理學(xué)教授蓋瑞·馬庫斯一向以大膽言論而在AI行業(yè)備受關(guān)注。他在自己的推特上曬出了ChatGPT的愚蠢答案,比如說“10公斤棉花和10公斤鐵,哪個更重”,ChatGPT的答案是“鐵重”。

人工智能公司深思考(iDeepWise.ai)的創(chuàng)始人楊志明博士團(tuán)隊也在做類似ChatGPT的預(yù)訓(xùn)練語言模型,他告訴記者,結(jié)果的“不可解釋性”是這種語言模型的天然理論缺陷,“從根本原理上講,它不是像人一樣真正理解了這些語言的含義,通俗說它只是通過學(xué)習(xí)大量語料,總結(jié)了一個‘公式,用來推斷、總結(jié)出人們想要的答案”。

他解釋,這就相當(dāng)于科幻和科學(xué)的差別,“科幻會覺得它真的理解了,可是從科學(xué)上面機(jī)器是沒有理解的,機(jī)器只是學(xué)習(xí)這些語料的特征之后,做一些端到端的預(yù)測或者推理”。但他也認(rèn)為,“最難的坡已經(jīng)爬過去了”,這個缺陷可以通過產(chǎn)品層面改進(jìn)的方式來彌補(bǔ)。

另外,ChatGPT盡管擁有了海量知識,但不意味著它就是通用人工智能,甚至距離依然遙遠(yuǎn)。在他看來,ChatGPT在任務(wù)型對話方面會有不足,不如一些特定領(lǐng)域處理專門任務(wù)的AI。例如,讓它在特定醫(yī)學(xué)領(lǐng)域處理一個手術(shù)流程。

通用人工智能是AI的終極目標(biāo),ChatGPT依然距離遙遠(yuǎn),想要制造出科幻小說里的通用人工智能機(jī)器人,目前理論上都還沒有突破。ChatGPT的底層理論早已經(jīng)成熟,在底層原理上并沒有原創(chuàng)性、革命性的創(chuàng)新,但不可否認(rèn)它是一個非常成功的產(chǎn)品。經(jīng)過一段時間,楊志明相信人們會慢慢學(xué)會理性看待它。

導(dǎo)彈與弓箭的區(qū)別

對國內(nèi)的AI行業(yè)來說,ChatGPT依然帶來了巨大沖擊,愛丁堡大學(xué)博士生符堯和同學(xué)撰寫的一篇還原ChatGPT技術(shù)路線的論文,這段時間也在AI行業(yè)廣為流傳。

這篇論文開頭,他憂心忡忡地寫道,“國內(nèi)同胞:在國際學(xué)術(shù)界看來,ChatGPT / GPT-3.5 是一種劃時代的產(chǎn)物,它與之前常見的語言模型 (Bert/ Bart/T5) 的區(qū)別,幾乎是導(dǎo)彈與弓箭的區(qū)別。在當(dāng)前這個階段,國內(nèi)的技術(shù)水準(zhǔn)、學(xué)術(shù)視野、治學(xué)理念和國際前沿的差距似乎并沒有減少,反而正在擴(kuò)大,如果現(xiàn)狀持續(xù)下去,極有可能出現(xiàn)技術(shù)斷代。此誠危急存亡之秋”。

OpenAI能擁有的環(huán)境,也讓袁進(jìn)輝很羨慕。在他看來,美國的投資環(huán)境相對而言更為寬容,他舉例說,“當(dāng)年OpenAI的投資人問到計劃如何賺錢時,阿爾特曼回答說我們不知道,一旦我們創(chuàng)造出了通用智能機(jī)器人,我們會讓它為你想辦法賺錢”。

當(dāng)然錢也不是唯一原因,他補(bǔ)充說,國內(nèi)有不少企業(yè)曾拿到過比OpenAI更多的錢,“可是也沒有兌現(xiàn)承諾”。在他看來,環(huán)境和人都是原因,“你看看深度學(xué)習(xí)中取得突破的這些人,都不是心血來潮或者看到什么熱門就去摻和一下的人,都是有很超前的科學(xué)信念,不問西東,持之以恒為之奮斗的人”。

楊志明也認(rèn)為,OpenAI或者DeepMind這些頂尖團(tuán)隊,在大量資金支持和長遠(yuǎn)目標(biāo)規(guī)劃之下,可以安心去做一些中長遠(yuǎn)的研發(fā),“其實,OpenAI推出GPT最初幾個版本的模型,大家也質(zhì)疑不斷,只是他們團(tuán)隊堅定去改進(jìn)和優(yōu)化,孤注一擲往這個方向走,所以他們成功了,也是必然的”。

對于何時能復(fù)制出國內(nèi)的ChatGPT,學(xué)術(shù)界比較謹(jǐn)慎。北京大學(xué)王選計算機(jī)研究院教授萬小年向記者表示,“國內(nèi)目前還沒有出現(xiàn)具有類似能力的模型,與國外的差距是很明顯的。業(yè)界基本上認(rèn)為要復(fù)制一個同等水平的模型,難度并不小,不是短短幾個月能完成的”。

楊志明則向記者表示,“不是多么大而趕不上的差距”。與他同是創(chuàng)業(yè)者的袁進(jìn)輝也相信,在ChatGPT捅破窗戶紙之后,國內(nèi)即將掀起一輪新的大型語言處理模型的建設(shè)高潮期,復(fù)現(xiàn)一個ChatGPT可能不像想象中那么久,“幾個月之內(nèi)就會看到類似的開源軟件了”。

對此他解釋,成本的大頭是試錯成本,長期以來,OpenAI不斷訓(xùn)練模型從而對模型進(jìn)行優(yōu)化,這個過程中的成本是最高的,相當(dāng)于替整個行業(yè)支付了這個成本。當(dāng)它已經(jīng)尋找到辦法,外界再想要去復(fù)制它,成本可以降低至少80%。他樂觀估計,目前想要復(fù)制ChatGPT的前身(2020年版本的預(yù)訓(xùn)練模型GPT-3),純算力成本100多萬美金。

但制作這樣的大型語言預(yù)訓(xùn)練模型需要三駕馬車,算力、算法和數(shù)據(jù)。目前來看,算法基本上已經(jīng)公開,算力根本在于芯片的數(shù)量和速度,花錢也能買到,數(shù)據(jù)才是真正的命門所在。

華為諾亞方舟實驗首席科學(xué)家劉群曾在微博公布過一組各個模型的token數(shù)量(訓(xùn)練數(shù)據(jù)量指標(biāo)),并表示僅從這些數(shù)據(jù)上就可以看出國內(nèi)外在模型上的差距,“GPT-3(2020.5)是500B(5000億),Google的PaLM(2022.4)是780B,DeepMind的Chinchilla是1400B,GPT-4預(yù)計將達(dá)到驚人的20000B,對比國內(nèi)的大模型,只有Pangu-α(編者注:深圳鵬城實驗室推出的模型)公布了訓(xùn)練的token數(shù),約為40B,不到GPT-3的十分之一。國內(nèi)其他的大模型都沒有公布訓(xùn)練的token數(shù)”。

◎ 來源|南方周末

猜你喜歡
語言模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
語言是刀
文苑(2020年4期)2020-05-30 12:35:30
讓語言描寫搖曳多姿
多向度交往對語言磨蝕的補(bǔ)正之道
累積動態(tài)分析下的同聲傳譯語言壓縮
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
我有我語言
主站蜘蛛池模板: 99免费视频观看| 99人妻碰碰碰久久久久禁片| 亚洲无线观看| 久久国产毛片| 国产九九精品视频| 国产精品片在线观看手机版 | 久久情精品国产品免费| 一本一道波多野结衣一区二区| 亚洲国产精品日韩av专区| 福利片91| 欧美成人国产| 91午夜福利在线观看精品| 色老头综合网| 无码网站免费观看| 在线色国产| 国产丝袜啪啪| 成人午夜视频免费看欧美| 亚洲欧州色色免费AV| 暴力调教一区二区三区| 亚洲欧美在线看片AI| 欧美a在线看| 美女免费黄网站| 青青久视频| 国产精品流白浆在线观看| 亚洲综合中文字幕国产精品欧美| 国产精品视频第一专区| 精品视频一区二区三区在线播| 久久黄色毛片| 国产精品美女在线| 国产精品xxx| 久久性视频| 一级一级特黄女人精品毛片| 老色鬼欧美精品| 激情无码视频在线看| 国产成人一区| 国产精品人莉莉成在线播放| 亚洲第一色网站| 成人午夜天| 国产91九色在线播放| 无码精油按摩潮喷在线播放| 亚洲bt欧美bt精品| 国产91久久久久久| 中国国产一级毛片| 亚洲欧美极品| a天堂视频| 无码'专区第一页| 亚洲天堂网视频| 国产微拍一区| 99青青青精品视频在线| 99re精彩视频| 国产成人精品三级| 亚洲视频四区| 国产福利2021最新在线观看| 久久久受www免费人成| 97成人在线观看| 午夜日b视频| 亚洲天天更新| 色呦呦手机在线精品| 欧美精品一区二区三区中文字幕| 亚洲人成亚洲精品| 日韩久久精品无码aV| 日韩在线影院| 日韩精品无码免费一区二区三区| 精品无码日韩国产不卡av| 国产午夜不卡| 伊在人亞洲香蕉精品區| 亚洲系列中文字幕一区二区| AV天堂资源福利在线观看| 无码AV日韩一二三区| 国产精品v欧美| 国产亚洲精品资源在线26u| 国产人碰人摸人爱免费视频| 亚洲第一色网站| 99热这里只有精品在线播放| 国产日韩欧美黄色片免费观看| 人妻丰满熟妇AV无码区| 91青青草视频在线观看的| 亚洲区第一页| 日韩av手机在线| 国产网站一区二区三区| 精品人妻AV区| 亚洲黄色高清|