999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

人工智能從“大煉模型”到“煉大模型”

2021-06-02 23:58:14崔爽
科學導報 2021年27期
關鍵詞:人工智能模型

崔爽

人工智能可以分為幾個發展階段:基于數據的互聯網時代、基于算力的云計算時代,以及接下來可能將進入的基于模型的AI時代,這相當于把數據提升為超大規模預訓練模型。未來,研究人員可以直接在云模型上進行微調,很多公司甚至不用維護自己的算法研發團隊,只需要應用工程師即可。

寫小說、和人聊天、設計網頁、編寫吉他曲譜……號稱迄今為止最“全能”的AI模型GPT-3,當然遠遠不止會這些。作為2020年人工智能領域最驚艷的模型之一,GPT-3無疑把超大規模預訓練模型的熱度推向了新高。

3月下旬,我國首個超大規模人工智能模型“悟道1.0”發布,該模型由智源學術副院長、清華大學教授唐杰領銜,帶領來自清華大學、北京大學、中國人民大學、中國科學院等單位的100余位AI科學家組成聯合攻關團隊,取得了多項國際領先的AI技術突破,形成了超大規模智能模型訓練技術體系,訓練出包括中文、多模態、認知和蛋白質預測在內的系列超大模型。

1、已啟動4個大模型開發

據悉,“悟道1.0”先期啟動了4個大模型研發項目:以中文為核心的超大規模預訓練語言模型文源、超大規模多模態預訓練模型文瀾、超大規模蛋白質序列預測預訓練模型文溯,以及面向認知的超大規模新型預訓練模型文匯。

唐杰介紹,文源擁有26億參數,文瀾則為10億,文溯是2.8億,文匯則達到了百億以上。雖然相對于GPT-3的1750億參數而言還有差距,但“接下來會有更大的模型”。

目前,文源模型參數量達26億,具有識記、理解、檢索、數值計算、多語言等多種能力,并覆蓋開放域回答、語法改錯、情感分析等20種主流中文自然語言處理任務,在中文生成模型中達到了領先的效果。

“目前這些模型既有一些交集,但也存在明顯差異。文源的重點是在中文和跨語言,未來也會加入知識;文瀾的重點主要是圖文;文匯則更多地瞄向認知。”唐杰表示,認知是人工智能技術發展的趨勢和目標,關系到機器是否能像人一樣思考這個終極問題。

被問及為何會選擇這4個預訓練模型項目時,唐杰說,這是綜合考慮了國內外同行的相關工作、國內人工智能發展的現狀、團隊人員構成、北京區域優勢等作出的決定。“當時GPT-3剛發布不久,悟道團隊認為首先要對標其卓越的少樣本學習能力,同時還要做出差異化,做短、中、長3個階段的布局。于是,中文版GPT-3即清源CPM(文源的前身)應運而生,這是短期布局。之后,文源要向中英文模型乃至多語言模型發展,這是中期布局。最后走向認知智能,這是長期布局。”唐杰說,與此同時,國內頂尖的企業人才、學術人才和自然科學人才所組成的團隊給了項目巨大的想象空間。

2、大模型有大智慧

自2018年谷歌發布BERT以來,預訓練模型逐漸成為自然語言處理(NLP)領域的主流。

2020年5月,OpenAI發布了擁有1750億參數量的預訓練模型GPT-3。作為一個語言生成模型,GPT-3不僅能夠生成流暢自然的文本,還能完成問答、翻譯、創作小說等一系列NLP任務,甚至可以進行簡單的算術運算,并且其性能在很多任務上都超越相關領域的專有模型。

以GPT-3為代表的超大規模預訓練模型,不僅以絕對的數據和算力優勢取代了一些小的算法模型,更重要的是,它展示了一條通向通用人工智能的可能路徑。在此背景下,建設國內的超大規模預訓練模型和生態勢在必行。

在唐杰看來,為了提高機器學習算法的效率,改變傳統的行業布局,過去幾年,大家拼命做模型,導致模型越做越多。然而,一般的模型訓練效果并不如人意,花了大量財力精力卻達不到理想的訓練效果,“為了優化效果、提高精度,模型越來越復雜,數據越來越大,很多公司的能力不足以應對這種狀況,效率越來越低。”

唐杰舉了個例子,小煉鋼廠往往條件簡陋,能煉鋼,但質量不好。大煉鋼廠買得起設備、花得起電費,煉出的鋼質量就好,大模型就是大煉鋼廠,它可以獲得大量數據,并把數據清洗干凈,提升算力,滿足要求。

與此同時,“小模型可能只需要幾個老師和學生就能完成算法的設計,但是大模型的每一層都要找專人來做,這樣可以把模型的設計和訓練精細化,模型設計也從單打獨斗變成了眾人拾柴。”唐杰說。

3、小團隊將成最大受益者

據唐杰透露,團隊目前正在跟北京冬奧會合作,開發可通過文本自動轉成手語的模型,“醫療方面我們的主要方向是癌癥早篩,如上傳乳腺癌圖像,找到乳腺癌相關預測亞類,通過影像識別宮頸癌亞類等。”

而談到“悟道1.0”的發展,唐杰坦言,目前還存在需要持續攻關的問題。

一是模型能否持續學習的問題,即能否不斷地從新樣本中學習新的知識,并能保存大部分以前已經學習到的知識。就目前來看模型還需要調整,其效果還有待加強;二是面對一些復雜問題,目前模型還無法回答;三是萬億級模型的實用性問題,即如何在保證精度的同時壓縮模型,從而能讓用戶低成本地使用。

“這是一個全新的產業模式。原來大家數據上云、算力上云,現在模型上云。”唐杰說。

他認為,人工智能可以分為幾個發展階段:基于數據的互聯網時代、基于算力的云計算時代,以及接下來可能將進入的基于模型的AI時代,這相當于把數據提升為超大規模預訓練模型。

未來,研究人員可以直接在云模型上進行微調,很多公司甚至不用維護自己的算法研發團隊,只需要應用工程師即可。

唐杰表示,隨著超大規模預訓練模型系統的開放,小團隊是最大的受益者,大家不必從零開始,預訓練基線智能水平大幅提升,平臺多樣化、規模化,大家在云上可以找到自己所需的模型,剩下的就是對行業、對場景的理解。這將給AI應用創新帶來全新的局面。

唐杰透露,“悟道1.0”只是一個階段性的成果,今年6月將會有一個規模更大、水平更高的智慧模型發布。屆時,模型規模會有實質性的進展:模型會在更多任務上突破圖靈測試,其應用平臺的效果也會更加讓人期待。

猜你喜歡
人工智能模型
一半模型
我校新增“人工智能”本科專業
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
2019:人工智能
商界(2019年12期)2019-01-03 06:59:05
人工智能與就業
IT經理世界(2018年20期)2018-10-24 02:38:24
數讀人工智能
小康(2017年16期)2017-06-07 09:00:59
3D打印中的模型分割與打包
下一幕,人工智能!
南風窗(2016年19期)2016-09-21 16:51:29
下一幕,人工智能!
南風窗(2016年19期)2016-09-21 04:56:22
主站蜘蛛池模板: 精品国产免费第一区二区三区日韩| 国产亚洲欧美日本一二三本道| 亚洲午夜国产片在线观看| 久久天天躁狠狠躁夜夜躁| 少妇精品在线| 国产精品污污在线观看网站| …亚洲 欧洲 另类 春色| 再看日本中文字幕在线观看| 国产激情国语对白普通话| 99re在线免费视频| 欧美精品成人一区二区视频一| 欧美97欧美综合色伦图| 欧美成在线视频| 国产免费一级精品视频| 欧美午夜在线播放| 国产乱子伦无码精品小说| 国内精品久久久久久久久久影视 | 免费国产小视频在线观看| 2021国产v亚洲v天堂无码| 亚洲女同欧美在线| 98超碰在线观看| 国产成人高清在线精品| 18禁黄无遮挡网站| 亚洲人成网站观看在线观看| 久久一级电影| 天天色综合4| 综合网天天| 免费a级毛片视频| 2021国产精品自产拍在线| 香蕉在线视频网站| 污视频日本| 国产拍在线| 欧美成人综合视频| 亚洲系列无码专区偷窥无码| 激情亚洲天堂| 国产 在线视频无码| 粉嫩国产白浆在线观看| 亚洲国产综合自在线另类| 成人无码区免费视频网站蜜臀| 亚洲福利视频网址| 日韩黄色大片免费看| 日韩在线影院| 91无码视频在线观看| 日韩无码视频专区| 精品视频一区二区三区在线播| 国产91精选在线观看| 国产熟睡乱子伦视频网站| 精品欧美视频| 日本精品αv中文字幕| 素人激情视频福利| 国产成人h在线观看网站站| 日韩天堂网| 在线国产毛片手机小视频| www成人国产在线观看网站| 视频国产精品丝袜第一页| 国产色爱av资源综合区| 亚洲手机在线| 亚洲综合色在线| 国内精品小视频在线| 国产毛片一区| 最新国产你懂的在线网址| 亚洲精品波多野结衣| 国产高清又黄又嫩的免费视频网站| 免费高清a毛片| 干中文字幕| 色综合日本| 丁香婷婷激情综合激情| 国产人成在线视频| 国产一级无码不卡视频| 精品国产一区91在线| 国产亚洲现在一区二区中文| 看你懂的巨臀中文字幕一区二区| 久久久久免费精品国产| 国产av剧情无码精品色午夜| 亚洲美女一区二区三区| 一区二区三区四区精品视频 | 国产精品成人观看视频国产| 国产成人区在线观看视频| 亚洲小视频网站| 国产一级在线播放| 就去色综合| 亚洲日韩精品综合在线一区二区 |