
[摘 要:在經濟發展過程中,通用目的技術(GPT)的作用是至關重要的。作為一種新出現的技術,生成式AI具有GPT所要求的普遍適用性、進步性和創新孕育性等特征,因而很可能會成為全新的GPT。生成式AI領域最具代表性的模型就是OpenAI的GPT系列等,這里的GPT全稱是“生成式預測訓練”(Generative Pre?Training)模型。無論是出于高質量發展的需要,還是出于加強我國國際競爭力的考量,發展生成式AI都是當務之急。從目前看,我國在發展生成式AI方面還存在著很多障礙,這就要求政府用好產業政策,為其發展掃清障礙。與此同時,作為GPT,生成式AI的發展一定會伴隨著“創造性毀滅”過程,由此帶來技術性失業、收入分配惡化,以及壟斷和不正當競爭等問題。對于這些問題,應當用好相關政策加以應對,盡可能趨利避害,讓生成式AI更好地為經濟發展服務。
關鍵詞:生成式AI;GPT;ChatGPT
中圖分類號:F49文獻標識碼:A文章編號:1000?176X(2023)06?0041?18???? ]
最近,由美國人工智能研究公司OpenAI開發的大型語言模型ChatGPT引發了各界熱議。相比于過去的AI產品,ChatGPT不僅可以更為順暢地與用戶交流,而且可以十分高效地按照要求完成包括文本寫作、資料整理,甚至程序編寫等在內的多種任務,因而廣受用戶青睞。自2022年11月30日正式上線以來,ChatGPT的用戶數量就保持了高速增長。僅僅5天時間,其用戶量就突破了100萬;不到兩個月,用戶量就超過了1億。2023年3月14日,OpenAI又發布了多模態的AI應用GPT-4。這一新模型不僅可以和ChatGPT一樣識別文本,還可以進行圖像識別,而且其問題解答、人機交互能力都有了質的提升。
從分類上看,ChatGPT和GPT-4都屬于“生成式AI”(Generative AI)的范疇。隨著ChatGPT的爆火,這種類型的AI逐步被人們關注。過去市場上的AI產品主要是所謂的“分析式AI”(Analytical AI),這類AI的主要功能是對數據進行學習和分析,以此來預測、輔助用戶進行判斷。與這類AI不同,生成式AI的主要功能是通過學習來生成與訓練數據不同的新數據。例如,ChatGPT會生成不同于其學習材料的文本,Dall?E2、Stable Diffusion等圖片生成AI則會生成不同于其學習材料的圖形。得益于這種創造能力,生成式AI可以比分析式AI應用于更多不同的場景、完成更為多樣化的任務,因而生成式AI正在成為一種“通用人工智能”(Artificial General Intelligence)[1]。
既然生成式AI的表現已經如此之好,那么一個直接的問題就是,它是否可能成為經濟學意義上的“通用目的技術”(General Purpose Technology,GPT)?1如果這個答案是肯定的,那么這種技術將會對經濟發展產生怎樣的影響?又應該用怎樣的政策去促進這種技術的發展?本文將對以上所有問題展開討論。
一、GPT及其影響
(一)GPT的定義和特征
“通用目的技術”是現代經濟增長理論中經常被提及的一個概念。與僅用于某些具體用途的專用目的技術(Specific Purpose Technology,SPT)不同,GPT的應用范圍通常十分廣泛,對經濟的影響是整體性的。例如,蒸汽機、電氣化等技術就是最常被提及的GPT。在文獻當中,這些技術通常被稱為“經濟增長的引擎”。Bresnahan和Trajtenberg[2]最早對GPT進行了研究。根據他們的定義,GPT應該具有如下三個基本特征:
普遍適用性(Pervasiveness)。GPT可以作為投入品,被廣泛地應用到各個部門。例如,作為GPT的新能源在不同的行業都能夠使用,而作為GPT的計算機也可以為各個行業賦能。
進步性(Improvement)。通過持續的創新和學習,GPT的表現會隨著時間的推移而不斷改進。這種改進是多維度的:可能表現為與GPT相關產品、系統及組件的成本降低,也可能表現為質量改善。隨著GPT表現的優化,使用它們將會變得越來越有利可圖,而這也會有助于它們的進一步擴散。
創新孕育性(Innovation Spawning)。GPT的創新會促進相關應用技術的創新,進而提高應用部門的研發生產率,而應用部門的技術進步又會反過來促進GPT自身的進步。顯然,創新孕育性的存在會讓GPT創新和應用部門創新的回報率同時得到提升。
后來的經濟學家對Bresnahan和Trajtenberg[2]的上述標準提出了一些修正。例如,Carlaw和Lipsey[3]認為,GPT的特征應該包括:最初只用于一些特殊用途;隨著在經濟中的擴散,它會演化成更為復雜的形式,其效率會不斷提升;它會被用于幫助眾多領域的生產;它會產生更多新產品,演化出新的生產流程。后來,Bekar等[4]進一步總結出GPT的六個特征:與定義和支撐它的一組技術互補;與由它賦能的技術具有互補性;與一系列在社會、政治和經濟上具有變革性的技術具有互補性;沒有相近的替代方案;具有廣泛的應用;開始時比較粗糙,但會演化得越來越復雜。不過,盡管有了這些論述,Bresnahan和Trajtenberg[2]的標準依然被認為是判斷GPT的最重要標準。按照上述標準衡量,盡管人類歷史上技術發明眾多,但能稱之為GPT的卻很少。Lipsey等[5]曾對歷史上的GPT進行過專門研究。在他們看來,從公元前9 000年至今,只有24種技術可以稱為GPT。按照出現的順序,它們分別為:植物馴化、動物馴養、礦石冶煉、輪子、寫作、青銅、鋼鐵、水車、三桅帆船、印刷術、蒸汽機、工廠體系、鐵路、鐵輪船、內燃機、電力、汽車、飛機、大規模生產、計算機、精益生產、互聯網、生物技術、納米技術。
按照不同的標準,可以對GPT進行不同的分類。例如,在Lipsey等[5]就給出了兩種分類方法:一種是按照技術呈現的形態進行分類,可以將GPT分為產品型技術、流程型技術和組織型技術;另一種則是根據技術的最終用途進行分類,可以將GPT分為材料技術、能源技術、交通技術、組織技術、信息和通訊技術。(二)GPT與生產率的關系
與SPT不同,GPT的發明并不能立即帶來生產率的顯著變化。具體來說,GPT作用的發揮在很大程度上依賴于基礎設施,以及與其相關的具體應用的數量和普及程度。一般來說,在一項GPT被發明出來后會經歷兩個階段:在第一階段,與GPT相關的各項基礎設施沒有普及,各項相關應用也沒有被開發出來。此時GPT并不會馬上對生產率產生提升效果。甚至由于在這個階段需要對基礎設施和應用發明進行大量的投資,產生大量的成本,因而從總體上看整個經濟的生產率甚至會是下降的。在第二階段,隨著基礎設施的建成、具體應用的開發,GPT對生產率的作用就會逐漸體現出來。在Helpman和Trajtenberg[6]的研究中,以上兩個階段分別被稱為“播種階段”(Time to Sow)“收獲階段”(Time to Reap)。以美國經濟為例,在電氣化技術被發明出來之初,其對經濟的影響微乎其微,但到了19世紀90年代,以尼亞加拉水電站為代表的一批重要電力設施建立起來后,電氣化對美國經濟的提升作用就開始體現。1915年之后,電力網絡在美國逐步普及,獨立輔助發電器開始廣泛應用,電氣化對生產率的影響才隨之變得明顯。同樣,在IT技術發展的早期,其對生產率的影響也并不顯著,由此還誕生了著名的“索洛悖論”。但是,隨著計算機普及,互聯網、云計算等基礎設施的建立,IT技術在提升生產率方面的作用終于得到體現。歐洲央行在一份報告中指出,“從歷史視角來看,索洛悖論并不是什么悖論”,其原因正在于此[7]。
需要指出的是,GPT對生產率的影響在很大程度上取決于其擴散的程度。例如,Jovanovic和Rousseau[8]曾經對電氣化和IT技術這兩種GPT對生產率的影響進行過比較。結果發現,截至其研究發表時,IT技術對生產率的影響要遠小于電氣化的影響。Jovanovic和Rousseau[8]認為,這是由于電氣化技術可以更為平穩地與更多資本存量結合,從而迅速融入更多部門當中,相比之下,IT技術在其發展初期只能應用于較少部門,其傳播和擴散速度較為緩慢。不過,他們也發現,與電氣化相比,IT技術的動態性更強,與其相關的技術發明速度和專利申請量都要勝過電氣化,同時其相關產品的成本下降趨勢也更為明顯。因此,他們預期IT技術對生產率的影響將會在未來逐步顯露出來。
(三)GPT的社會影響
GPT的擴散通常表現為一個“創造性毀滅”(Creative Destruction)的過程。它可能在促進生產力提升的同時,顛覆既有的經濟秩序。在這個過程中,可能會造成一系列復雜的經濟、社會和組織影響。限于篇幅,本文集中討論其中的三種影響。
1.GPT對競爭的影響
從理論上講,GPT的擴散可能會重新配置企業之間的競爭優勢,從而可能讓固守舊技術的在位大企業沒落,而率先采用新技術的中小企業則可能趁勢興起,但現實卻并非如此[9]。1一些實證研究證實了這一點,如Jovanovic和Rousseau[8]曾考察過1988—2001年間不同規模的資本回報狀況。他們發現,從長期看,小企業的年資本增值率要比大企業高出7.5%。但是,在電氣化和IT技術這兩種GPT的主要擴散時期,大小企業在資本增值率方面的相對差異并沒有明顯變化。也就是說,“創造性毀滅”的作用效果并不明顯。
對于這種現象有很多解釋。其中的一個解釋來自Schumpeter[10]。他認為,當技術引發的“創造性毀滅”到來時,在位企業不愿意就此退出市場,因而會采用各種不正當的競爭手段來阻礙新興企業超越自己。另一種解釋則來自Aghion等[11]。他們認為,大企業也可能率先成為新技術的推動者。在這種情況下,它們相對小企業的競爭優勢將會進一步凸顯,而這可能會反過來打擊小企業的創新動力,甚至讓它們放棄競爭。無論根據上面哪種解釋,都意味著在GPT迅速擴散的同時,也可能會發生比較嚴重的壟斷和不正當競爭問題。事實上,歷史也在一定程度上印證了這一理論。以美國為例,電氣化擴散的同時,也恰好是美國大型托拉斯興起的時期;在IT技術擴散的同時,一大批平臺巨頭也迅速崛起,并由此引發了平臺壟斷問題。
2.GPT的就業效應
從歷史上看,很多GPT的發明和擴散都會對既有的工作方式產生重大沖擊,并帶來明顯的就業影響。一方面,新技術的擴散會讓很多采用舊技術的人失去工作,從而產生“技術性失業效應”;另一方面,新技術的擴散又會催生很多新的就業,從而產生“補償效應”[12]。例如,蒸汽機和工廠體系的出現搶走了很多手工業者飯碗的同時,卻創造出工人這個新職業;汽車的出現搶走了馬車夫生意的同時,卻創造出司機這個新就業崗位。盡管從長期看,后一種效應通常會勝過前一種效應,從而使新增的就業數量超過消失的就業數量,但從短期看,前一種效應通常會更占優勢,因而技術性失業就成為了新技術,尤其是GPT擴散過程中經常出現的一種現象。
3.GPT對收入分配的影響
GPT的擴散會從多個機制對收入分配產生影響。技術的影響是有偏向性的,如果某種技術是資本偏向性的,就可能減少對勞動力的需求,這會讓勞動力的工資下降,從而導致勞動力收入在總收入中所占的份額也隨之減少[13]。例如,經濟史學家Allen[14]曾經對18世紀早期至20世紀初的工資狀況進行過研究,結果發現在這個曾出現眾多GPT的時間段內,企業的利潤率出現了大幅增長,但與此同時,真實工資水平卻一直維持不變。在經濟史上,這一現象被稱為“恩格斯停滯”(EngelsPause)。1從技術偏向性的角度看,“恩格斯停滯”產生的主要原因是這個時期主要GPT幾乎都是替代勞動力的。例如,蒸汽機、火車、汽車等的出現,都大幅降低了市場對勞動力的需求,這就導致了工資的停滯不前。此外,GPT的擴散可能還有助于“巨星”企業的發展,使其在行業內的份額變得更高。由于這類企業通常都有高資本密集度的特點,因而“巨星”企業的發展就會加劇勞動力份額在總收入中占比減少的趨勢[15]。
二、生成式AI:原理和發展
(一)生成式AI的技術原理簡介
生成式AI和分析式AI的根本區別是:后者采用的是“判別式建模”(Discriminative Modelling),其目的是通過訓練樣本數據來提升模型的判斷能力,從而能夠幫助人們實現對訓練外樣本性質的判斷;而生成式AI采用的則是“生成式建模”(Generative Modelling),它學習的目的是創造出和訓練樣本中數據類似的新數據(如圖1所示)。舉例來說,一個分析式AI通過學習大量梵高的作品,就可以在遇到一幅新作品時判斷出它是否為梵高所畫;而一個生成式AI在進行了類似的學習后,就可以創造出類似梵高風格的新作品。
雖然從表面上看生成式AI非常神奇,但從本質上看,生成式AI就是一個概率模型。通過對樣本數據的學習,生成式AI可以形成一個關于數據的分布模型,所謂“生成”新數據的過程就是從這個分布模型中進行重新抽樣的過程。目前,人們已經提出了很多不同的生成模型,它們之間在分布模型的構建,以及樣本的抽取上都存在著很大差別,各方面表現也不盡相同。在這些分布模型中,最有代表性的有五類:自回歸模型、生成式對抗網絡模型(GAN模型)、變分自編碼模型(VAE模型)、流模型和擴散模型。
第一,自回歸模型[16]。自回歸模型是文本生成模型中經常用到的一種模型,ChatGPT在訓練中就采用了這一模型。這種模型的原理非常直觀,即根據之前出現的語句來對后續可能出現語句的概率分布進行建模,并挑選概率最高的那個語句作為生成內容。例如,當AI學習了大量文本后發現,如果在一段文字中出現了“生成式”這三個字,后面出現“AI”的可能性是最高的,那么它在遇到“生成式”之后就會生成“AI”。
第二,生成式對抗網絡模型[17]。GAN模型的基本思想來自博弈論中的零和博弈。具體來說,它構造兩個相互對抗的網絡,分別作為生成器和判別器。其中,生成器通過訓練樣本進行學習,并根據學習結果生成數據,其目的是讓判別器相信所生成的數據是真實的;而判別器則根據訓練樣本的學習結果對訓練外的數據進行判別,其目標是正確判斷這些數據是否是生成的。通過這種對抗,生成器和判別器的性能就可以同時得到提升,由該模型生成的數據也就越來越接近真實。不過,GAN模型的缺陷也很明顯。由于它不直接對訓練樣本進行建模,因而其可解釋性非常差,并且也難以保證生成數據和訓練數據來自同一分布。
第三,變分自編碼模型[18]。和GAN模型不同,VAE模型會直接對訓練樣本進行概率建模。包含兩個部分:編碼器和解碼器。其中,編碼器負責對訓練樣本中各潛變量(Latent Variable)的均值和方差信息進行建模,解碼器則利用這些信息生成新的數據。VAE模型會不斷將生成的數據和訓練數據進行對比,以此對潛變量的均值和方差信息進行重復校正。這樣,生成內容的信息質量就能得到持續改進。由于VAE模型對訓練樣本直接進行概率建模,因而具有很強的可解釋性,并且可以有效保證生成數據和訓練數據來自同一分布。
第四,流模型[19]。流模型會直接計算決定數據表征的潛變量的分布和數據表征分布之間的轉移函數,并由此直接反推出潛變量的分布狀況,完整地還原出訓練數據的概率模型。顯然,流模型具有很強的可解釋性,并且可以保證生成數據和訓練數據來自相同分布。不過,其對計算的要求很高,因而需要較強的算力支持。
第五,擴散模型[20]。擴散模型由前向擴散過程和反向生成過程構成。在前向擴散過程中,模型會根據事先學習的一些參數,通過一個馬爾可夫過程對原數據逐步加入噪聲,直到將數據變為近似純噪聲的水平為止。在反向生成過程中,模型則對之前處理的數據進行逐步減噪,由此生成新的數據。通過不斷將新生成數據與原數據進行對比,就可以不斷校正參數,讓模型的質量更高。
2.重要訓練架構
除了訓練方法之外,訓練架構也是生成式AI的重要支柱。在對神經網絡進行訓練時,人們開發了很多訓練架構模型,如卷積神經網絡(Convolutional Neural Networks,CNN)模型、循環神經網絡(Recurrent Neural Network,RNN)模型等。這些模型在生成式AI的訓練中依然被廣泛使用。但是,與這些經典模型相比,對生成式AI發展推動更大的模型則是Transformer模型。
Transformer模型最早的應用場景是自然語言處理(Natural Language Processing,NLP)。在處理這類問題時,模型需要對之前處理過的信息有所記憶,但CNN、RNN等經典模型要么難以處理記憶問題,要么不能處理并行計算,運作效率很低。Transformer通過創造性地引入了一種被稱為“自注意”(Self?Attention)機制成功地解決了這些問題[21]。這種機制可以根據某個詞語所處的位置來確定與這個位置關聯最大的詞語的概率分布,從而不僅可以處理記憶問題,還可以支持并行計算。借助Transformer模型,NLP的處理效率得到了突飛猛進的發展,ChatGPT等明星級產品最終得以出現。當然,目前Transformer模型的應用已經不再局限于NLP,而是被廣泛應用到了圖形、語音處理等各個領域,從而成為了生成式AI,是整個深度學習的一種通用訓練架構。
正是在上述這些訓練模型和訓練架構的支撐之下,生成式AI才在當前實現了高速發展。
(二)生成式AI發展簡史
生成式AI的歷史原型可以追溯到20世紀60年代的聊天機器人Eliza,但直到2014年GAN模型被提出,它才開始了實質性發展。最早引起人們關注的生成式AI用例是“深度偽造”(Deepfake)。所謂“深度偽造”是指借助GAN模型,將人的形象、表情、聲音進行拼接,并合成音頻和視頻的技術。2018年,互聯網上出現了很多利用“深度偽造”合成的虛假視頻,并引發了爭議,但客觀上,它也首次讓人們認識到生成式AI的力量。此后,隨著VAE、擴散模型等新訓練方法的提出和應用,生成式AI迎來了高速發展。尤其是在2022年,諸如Dall?E2、Stable Diffusion、MidJourney、Flamingo等產品相繼面世,生成式AI市場開始進入繁榮時期。
當然,生成式AI領域最大的突破還是來自“大型語言模型”(Large Language Models,LLM)。2017年,Transformer模型架構被提出,NLP模型的發展取得了突破。從此,很多企業都開始構建自己的LLM。其中,最有代表性的模型就是OpenAI的GPT系列和谷歌的BERT系列。GPT的全稱是“生成式預訓練”(Generative Pre?Training)模型,其采用的訓練方法是自回歸算法,通過前面出現過的文字來推斷下文。人們現在所熟知的ChatGPT、GPT-4等都是這個系列的產物。BERT模型(Bidirectional Encoder Representations from Transformers,BERT)則采用了自編碼技術,根據前后文來生成內容,其邏輯類似于完形填空。盡管現在BERT模型的知名度并不如GPT系列產品,但它在很多方面的性能甚至比GPT系列更優。谷歌正在研發中的很多大模型就是基于BERT模型開發的。
最近一段時間,生成式AI迎來了大爆發。在ChatGPT的爆火引發了人們對生成式AI的關注后,國內外各大企業都將生成式AI作為重點發展方向,大量的生成式AI在短期內紛紛涌現。與此同時,生成式AI的普及也十分迅速,目前已經有很多企業將生成式AI應用于自己的業務,并構造出了對應的商業模式。從各方面看,生成式AI已經從孕育期轉入了爆發期。
三、生成式AI的GPT屬性
關于AI是否是一項GPT,已經有不少文獻進行過討論。一些觀點認為,AI已經被廣泛應用于多個領域,并且發展十分迅速,因而具有了GPT屬性;另一些觀點則認為,雖然廣義上的AI被應用于很多領域,但AI本身的含義過寬,在不同領域應用的AI模型在原理上存在著很大的差別,并不能被稱為是一類技術。例如,知識圖譜和機器學習雖然都歸于AI的范疇,但其實是兩種差異化的技術。從這個角度看,它們不應該被認為是GPT。
本文不對廣義上的AI模型是否應該屬于GPT進行討論,本文關注的焦點是生成式AI。如前所述,生成式AI模型從本質上都屬于深度學習模型的分支,在訓練方法、模型架構上也都有很強的共性,因而大致上可以屬于一種單獨的技術類別。那么,這種技術是否可以被歸入GPT的范疇呢?為了回答這個問題,需要檢驗它是否具有普遍適用性、進步性和創新孕育性。
(一)關于普遍適用性的檢驗
檢驗一種技術是否屬于GPT的首要標準是它是否可以普遍使用。具體到生成式AI,需要檢驗它是否可以在垂直領域內得到大規模的應用。這個問題的答案是肯定的。無論是在消費端,還是在產業端,生成式AI都有廣泛的應用前景。在很多領域,使用者只需要用提示詞(Prompt)對預訓練模型進行引導就可以得到符合專業需要的版本。相比于過去的分析式AI,生成式AI在各用途之間的轉換成本非常低。
1.消費端的應用
在消費端,生成式AI可以為互聯網生態提供大量的內容產品,從而豐富互聯網的多樣性,提升用戶的使用體驗。眾所周知,在Web1.0時代,互聯網的內容產品主要來自“專業生產內容”(Professional Generated Content,PGC),其內容數量很小,難以滿足用戶需要;在Web2.0和Web3.0時代,“用戶生產內容”(User Generated Content,UGC)開始大幅增加,這在很大程度上豐富了互聯網的生態[22]。不過,受創作者水平、激勵措施等因素的制約,UGC產品的質量良莠不齊,其供給量也很難滿足用戶需求[23]。隨著生成式AI的面世,一種全新的內容生產方式——“AI生產內容”(AI Generated Content,AIGC)隨之誕生。相比于PGC和UGC,AIGC在內容制作成本和內容數量、質量的穩定性等方面都更有保證。這些特點決定了它可以被應用到相當多的領域。目前,生成式AI在消費端的很多領域得到了應用。限于篇幅,這里只對其中的五個領域進行介紹:
第一,日常辦公。生成式AI可以在用戶的指導下生成對應的內容,因而日常辦公中相對重復、創造性較低的任務都可以由生成式AI輔助完成。最近,不少企業已經將生成式AI植入到辦公軟件當中。例如,2023年3月16日,微軟發布了Office 365 Copilot,這款新的應用不僅可以根據用戶的提示直接生成Word、PPT和Excel等,還可以幫助用戶完成整理會議摘要、處理郵件等多種任務。也就是說,人們日常辦公中的大部分任務都可以由Office 365 Copilot輔助完成。
第二,搜索。在搜索領域,目前微軟已經將GPT-4模型應用到搜索引擎中,形成了“新必應”(New Bing)。新必應可以根據用戶的需要實時從網上獲取相關信息,并將信息整理成文本進行輸出。和之前的ChatGPT不同,新必應在對用戶的要求作答時,會給出確切的參考信息來源,這樣就可以在很大程度上保證輸出信息的可靠性。很多評論都認為,這種“AI+搜索”模式可以大幅提升人們從海量信息中檢索出自己所需要信息的效率,因而可能會成為新一代的搜索方式。
第三,教育。生成式AI可以幫助用戶創造獨特的學習環境和學習內容,并根據其學習的反饋自動進行調整。通過這種方式,用戶的學習體驗和學習質量就可以得到十分有效的提升。目前,已經有不少平臺將生成式AI應用于教育的實踐。例如,著名的在線語言學習平臺Duolingo就將GPT-3應用于語法修改,這一舉措顯著提升了學習者的外語寫作能力。又如,一項來自教育機構Knewton的研究表明,通過引入GPT-3為高校學生提供個性化教學,可以有效提升教學質量;另一項來自教學機構Querium的研究則顯示,GPT-3可以很好地幫助數學和自然科學的教學,讓學生更為直觀地理解教學內容。
第四,金融服務。生成式AI在經過進一步訓練之后,可以充當個人的金融顧問,為個人提供投資理財、風險管理等各方面的建議。例如,在一項研究中,人們對ChatGPT的金融知識進行了測試。結果顯示,其得分已經達到了充當金融顧問的水平。并且,由于相比于人類顧問,ChatGPT作為顧問會被人們認為更加客觀,因而在實踐中更加容易被人們所接受[24]。
第五,醫療。以ChatGPT為代表的生成式AI不僅可以輔助用戶診斷病情,針對病情給出特定的就醫和用藥建議,還可以根據患者的描述和醫生的診斷自動生成病例記錄,從而大幅提升患者就診和醫生診斷的效率。需要指出的是,GPT-4目前已經可以支持圖形識別,這為計算機根據圖形診斷病情提供了基礎,從而可以大幅提升診斷的準確率。
2.產業端的應用
在產業端,生成式AI的應用同樣非常廣闊。根據著名咨詢機構Gartner的研究,其中最有代表性的應用場景包括工業設計、藥物研發和材料科學。
第一,工業設計。當前的工業設計通常采用線性化的流程,不僅步驟繁多,耗費巨大,而且在每一步都可能產生錯誤,導致設計原型報廢,從而產生嚴重浪費。如果采用生成式AI輔助設計,上述問題就可以得到較好的解決。AI不僅可以根據設計人員的思路迅速提出多套方案,還可以直接對各套方案進行比較評估,供設計人員選擇,這樣就可以有效節省設計成本、縮短設計時間,還可以有效減少浪費[25]。以芯片設計為例,在設計過程中,設計人員需要在微小的晶片上嘗試各種組件的排列方案。實踐中,可供選擇的排列方案非常多,甚至可能達到數十億種。如果依靠人力對這些方案一一嘗試,就會產生巨大的成本,研發周期也會非常久。針對以上問題,很多企業已經開始將生成式AI應用到芯片的設計當中。例如,谷歌正在利用生成式AI輔助設計TPU1芯片,英偉達也在其GPU芯片的設計當中使用了生成式AI。
第二,藥物研發。在藥物研發的過程中,研究人員需要在海量的化合物當中不斷試錯,探索可供入藥的成分。這使得藥物的研發成為了一項周期長、成本高的工作。研究數據顯示,美國研究一款新藥的平均時間為12年,平均成本則高達26億美元[26]。如果引入生成式AI來輔助研究人員識別化合物的分子結構,并根據需要對分子結構進行重構和修改,那么研發時間就可以大幅度縮短,研發成本也可以大幅度降低[27]。以DeepMind的AlphaFold對蛋白質結構的預測為例:在AlphaFold投入應用之前,人們用實驗方法了解的蛋白質折疊結構大約為幾萬種。而AlphaFold則用很短時間就破解了現在已知的一百多萬個物種的2.14億種蛋白質結構[28]。在被破解的結構中,35%已經達到了和實驗方法破解相當的精度,80%的結果有很高的可靠性,可以被用于后續的分析研究。
此外,生成式AI在直接的藥物研發上也已經有了不少的應用。例如,英矽智能(Insilico Medicine)曾利用生成式AI開發治療纖維化的新型DDR1激酶抑制劑,整個開發過程僅僅用了21天[29]。這個速度要遠遠高于傳統的開發方式。
第三,材料科學。生成式AI既可以幫助研究人員更好地了解各種材料的結構及化學性質,還可以根據需要對材料進行“反演設計”(Inverse Design),因而在材料科學領域大有用武之地[30]。幾年前人們已經開始將GAN、VAE等生成技術應用于新材料的研發。例如,德國馬克斯·普朗克科學促進會下屬的鋼鐵研究所不久前提出了一種基于機器學習的高熵合金設計方案,從而大幅提升了設計效率。應用這個方法,該研究團隊已經成功設計出了多種高熵因瓦合金[31]。又如,沙特阿卜杜拉國王大學的研究團隊也借助生成式AI對光學納米材料進行反演設計,其設計效果也得到了很大的改進[32]。
綜合以上分析不難看到:生成式AI在各個領域都有巨大的應用潛力。事實上,在以ChatGPT為代表的生成式AI爆火之后,已有大量的企業和個人開始使用ChatGPT。例如,不久前美國的《財富》雜志進行了一次調查,結果顯示在被訪的一千多家企業中,有50%的企業已經開始使用ChatGPT,另有30%的企業計劃使用[33]。由此可見,生成式AI確實具有GPT所要求的普遍適用性。
(二)關于進步性的檢驗
作為一種技術,生成式AI的進步是十分迅速的,主要表現為如下四個方面:
1.模型規模的膨脹
以GPT系列的發展為例:2018年6月,GPT-1面世時,其參數僅為1.1億,預訓練數據量也僅有5GB;到2019年2月GPT-2推出時,參數達到了15億,預訓練數據量也增加到了40GB;而到2020年5月GPT-3推出時,參數已經猛增到1 750億,預訓練數據量也猛漲到45TB。此后,OpenAI又在GPT-3的基礎上增加了參數量和訓練數據量,將其升級為GPT-3.5,并用GPT-3.5訓練ChatGPT。盡管ChatGPT并沒有對外公布其確切的參數量和預訓練數據量,顯然這些數字都要高于GPT-3。在GPT-4推出之前,曾有傳聞說,其參數量將達到100萬億,與人類大腦神經元數量相當。盡管該消息最終被確認為不實消息,但可以肯定的是,GPT-4模型的體量應該比GPT-3.5有很大的增加。
2.模型性能的提升
由于AI模型的性能很大程度上取決于其參數和訓練數據的量,因而隨著這兩者的飛速增長,生成式AI模型的表現也出現了突飛猛進的發展。仍以GPT系列為例,在GPT-3之前,由于模型的參數量和訓練數據量都很少,其表現并不突出,而GPT-3和ChatGPT在大幅增加參數量和訓練數據量之后,無論是語義識別能力、邏輯推理能力,還是問題解決能力都有了質的飛躍。到了GPT-4,這種提升就更加明顯。根據OpenAI官方公布的技術報告,如果讓ChatGPT參加總分400分的美國律師資格考試,其得分為213分,大約只能勝過10%的人類考生;而如果讓GPT-4參加這一考試,則可以得到298分,可以勝過90%的人類考生[34]。
3.模型使用成本的下降
以ChatGPT的使用成本為例:在OpenAI開放ChatGPT的API接口之前,對外開放的一直是instructGPT版本。這個模型的性能比ChatGPT稍差,其收費大約為每千個令牌(Token)0.02美元。按此計算,進行一輪對話的成本大約與目前推送一次搜索廣告的成本相當。2023年3月1日,OpenAI開放了ChatGPT的API,其收費下降到了每千個令牌0.002美元,僅為原來的1/10。這樣一來,ChatGPT相對搜索廣告的成本優勢就十分明顯了,這為其未來的商業應用創造了無限的想象空間。
4.從單模態到多模態的跨越
在生成式AI發展的早期,模型大多是單模態的。例如,從GPT-1到GPT-3,以及ChatGPT都是文本輸入、文本輸出,而最近,多模態模型成為更為流行的選擇,Dall-E2、Midjourney等模型都可以根據輸入的文字信息輸出圖形,GPT-4可以從圖形中讀取信息并生成文字,也能根據文字生成圖形,而微軟的Kosmos-1模型則可以同時處理文字、圖形、音頻和視頻。
總而言之,生成式AI的進步十分迅速。不久前,OpenAI的創始人Altman在自己的社交媒體上提出了一個“智能摩爾定律”:“宇宙中的智能數量每18個月翻一番。”盡管有不少評論人士批評該“定律”語焉不詳,甚至有炒作之嫌,但在某種程度上,它其實是對過去一段時間內生成式AI發展的很好概括。由此可見,對于GPT所要求的進步性,生成式AI也可以很好的滿足。
(三)關于創新孕育性的檢驗
生成式AI對創新的孕育表現在如下三個層面:
1.對人工智能創新的推進
近十多年來,人工智能的發展主要來自機器學習領域,而這個領域的發展對數據有非常高的依賴性。在具體的實踐當中,數據的搜集和整理不僅成本高、質量難控制,還可能衍生出侵犯個人隱私、威脅數據安全等問題,這些都制約機器學習的發展。為了應對這些問題,一些學者建議可以使用合成數據作為真實數據的補充,供機器學習使用。與真實數據相比,合成數據至少具有以下三點優勢:
第一,從訓練效果上看,用合成數據進行訓練的效果并不比真實數據差,在一些場合,它們的表現甚至更優異。在真實數據的形成過程中,可能混入很多不必要的噪聲信息,這就可能對其質量造成影響,而合成數據則沒有這樣的問題。麻省理工學院、波士頓大學和IBM曾聯合做過一項研究,用真實數據和合成數據分別訓練模型識別人類行為,結果是采用合成數據進行訓練的模型表現要比采用真實數據進行訓練的模型更優[35]。
第二,從成本上看,合成數據要遠遠低于真實數據。例如,合成數據服務提供商AI.Reverie曾提供過一組數據:用人工方式標注一張圖片,平均成本需要6美元,而如果用AI合成一張圖片則只需要6美分,其成本僅為前者的1%[36]。由于在機器學習過程中用到的數據通常是海量的,因而用合成數據代替真實數據將會產生巨大的成本節約。
第三,從法律上看,合成數據可以規避很多風險。合成數據都是由AI生成的,而非向個人采集的,因而就可以避免漏露隱私、數據安全等眾多問題。對于企業而言,用這樣的數據來訓練模型就更加沒有后顧之憂。
綜合以上原因,用生成式AI合成數據將有助于突破阻礙機器學習發展的數據瓶頸,這對于促進機器學習的進步將會起到十分重要的作用。
2.對其他科研領域創新的促進
著名哲學家懷特海在回顧科技進步的歷史時曾經說過:“19世紀最大的發明是找到了發明的方法。”由此可見,找到新的“發明方法”或“發現方法”對于推進創新是十分關鍵的。從某種意義上講,生成式AI的出現其實就是發現了一種新的發明或發現的方法。
從本質上講,發明創新是一種對各種要素的組合。傳統上,人們基于既有知識對要素的組合進行探索,因而具有很強的路徑依賴性。正是因為這個原因,在早期的內生增長文獻中,都習慣于將創新(也就是知識的增長)視為既有知識的函數。在應用了生成式AI這個新工具后,人們可以以更低廉的成本去探索更多組合的可能,這就讓創新可以在更大程度上突破既有知識的藩籬,有了更大的可能性。正如前文中已經指出的,生成式AI已經在生物、化學、制藥等需要大量試錯的領域得到了廣泛應用,并對這些領域的知識和要素重組起到了很大的促進作用。顯然,這種“組合式創新”將會大幅提升這些領域的技術進步速度[37]。
3.技術進步的回振作用
生成式AI在促進各垂直領域技術進步的同時,這些垂直領域的技術進步也會反過來促進生成式AI本身的進步。一個典型的例子就是生成式AI和機器人學的互動。不久前,谷歌的機器人團隊和谷歌創新團隊聯合研發了一款生成式語言模型PaLM?E[38]。這款模型可以根據不同類型的數據,如圖像、聲音、文本等對機器人進行控制,讓它們完成各種任務。應用PaLM?E,研究者可以更容易地完成對機器人性能的各種測試,從而促進機器人技術的進步。反過來,機器人技術的進步也要求更好的控制技術,從而對PaLM-E的性能提出更多要求,促進其進步。通過這種互動關系,生成式AI和機器人學就可以同時獲得進步。
綜合以上分析可以看到,生成式AI確實具有GPT所要求的創新孕育性。至此,Bresnahan和Trajtenberg[2]提出的關于GPT的三條標準已經全部檢驗完畢。因此,筆者得出的結論是生成式AI應當可以被認為是GPT。
四、對GPT的生成式AI提出的挑戰
由GPT的一般理論可知,生成式AI的發展和普及過程會遭遇很多問題和挑戰[39]。無論是對政策制定者還是研究者,這些問題和挑戰十分值得重視。
(一)制約生成式AI發展的障礙
1.基礎設施的缺乏
在GPT的研發和擴散過程中,基礎設施的作用是十分突出的。例如,如果沒有電力網絡,那么電力這種GPT的力量就無法發揮作用;而如果沒有網絡基礎設施,那么計算機和互聯網等GPT的作用也會受到很大的限制。同樣的道理,對于生成式AI來說,如果沒有對應的基礎設施,其發展速度也會大打折扣。
具體到生成式AI,其發展需要的“硬性”基礎設施和“軟性”基礎設施在我國現階段都是比較缺乏的。
第一,“硬性”基礎設施。所謂“硬性”基礎設施,即支撐生成式AI發展所需要的硬件設施。限于篇幅,本文僅聚焦其中的兩樣:算力和存儲。
首先,算力。雖然生成式AI的產生主要得益于算法層面的改進,但其能夠迅速成熟、迅速擴散則主要依賴于算力的助推。相關研究已經表明,在深度學習中,即使算法本身沒有進步,當訓練數據大幅增加時,“涌現”效應就會出現,模型的性能就會出現質的變化。當然,大規模數據訓練并不是沒有成本的,需要巨大的算力投入。例如,在訓練GPT-3時,OpenAI建立了專門的數據中心,動用了上萬塊英偉達A100 GPU芯片。正是這種龐大的算力投入,才保證了后來GPT-3和ChatGPT模型的出色性能。隨著大模型的普及,生成式AI對算力的依賴性正變得越來越強[40]。總體上看,提升算力水平的途徑有如下三條:一是通過采用高性能芯片,提升單位計算單元的算力水平;二是通過建設數據中心、智算中心,通過集中大量運算單元來提升算力水平;三是通過對量子計算等新型方式的開發和應用,從根本上改變計算方式。從目前看,這三條路徑都會遭遇不少障礙:一是客觀上講,我國的芯片研發和生產能力還和西方存在著差距,在短期內難以生產滿足生成式AI大模型訓練所需要的芯片,加之西方對我國的封鎖和禁運,要購買高性能芯片也很困難,這就決定了我國很難通過采用高性能芯片來提升算力;二是雖然我國已經建立了大量的數據中心,但這些數據中心安裝的要么是CPU,要么是相對低端的GPU,很難支撐生成式AI大模型的訓練;三是雖然我國在量子計算的理論和實踐上已經有很大的突破,但受量子計算特性的影響,很難直接用量子計算解決大模型所需要的算力。綜合以上三點,至少在未來的幾年內,算力依然可能是制約我國生成式AI發展的一大瓶頸。
其次,存儲設施。在生成式AI模型的訓練過程中會產生大量的數據存儲需求,而在這些需要存儲的數據中,非結構化數據將會占據很大部分。為了能夠對這些非結構化數據進行更好的整理、檢索和存儲,人們提出了向量數據庫的解決方案。向量數據庫專門用于存儲、索引和查詢嵌入向量,這些向量都是通過機器學習模型傳遞非結構化數據而生成的。對于構建專有大型語言模型的組織而言,向量數據庫至關重要,但至今為止,我國向量數據庫的建設依然是落后的。
顯然,如果要在未來一段時間內大力發展生成式AI,就必須首先在算力、存儲等基礎設施上進行大量投入。
第二,“軟性”基礎設施。影響技術發展的“軟性”基礎設施有很多,包括法律制度環境、研發環境等。限于篇幅,本文僅強調影響生成式AI的“軟性”基礎設施之一,即開源環境。
隨著IT技術的發展,開源平臺和開源社區在軟硬件研發當中的重要性正在日益凸顯。在開源平臺上,來自不同國家、不同企業的研究人員可以相互交流思想,交換各自的發明發現,很多重要的技術革新都首先出現在開源平臺上。以生成式AI為例,無論是重要的訓練算法,還是訓練架構的核心思想,都最先在開源平臺上出現,然后在開源社區經過討論、打磨后逐步完善。由此可見,對于未來生成式AI的發展來說,開源平臺和開源社區是必不可少的。
現在,世界上已經有很多著名的開源平臺和開源社區,我國很多企業也都深度參與其中,但總體來說,我國企業在這些開源平臺和開源社區的影響力和話語權都不夠大。更為重要的是,當前國際形勢風云變幻,這些開源平臺和開源社區對我國企業的態度很容易受到國際形勢變化的影響。如果它們對我國企業進行了封鎖,那么我國企業在生成式AI的研發過程中就會失去重要的交流環境。顯然,這會對相關研發進程產生非常負面的影響。
2.技術擴散過程中的協調問題
GPT要發揮作用,就必須擴散到各個具體領域當中,產生出各種具體的用途。在這個過程中,就會產生協調問題。具體來說,GPT的研發和推廣會涉及很多不同的子系統,而各子系統的發展速度、行業標準通常會不一致[41]。如果這種不一致得不到很好的解決,那么GPT的擴散就會受到影響。例如,隨著生成式AI的火熱,國內很多企業都開始研發相關產品,但與此同時,國內生成式AI的應用生態相比于國外還存在著很大的差距。如果不解決好應用生態相對技術研發滯后的問題,那么即使相關的產品研發得到突破,也很難從中獲得對應的經濟回報,其長期可持續發展也會因此受到阻礙。
(二)生成式AI帶來的“創造性毀滅”
和所有的GPT一樣,生成式AI的發展也會帶來“創造性毀滅”,由此會引發技術性失業、收入分配惡化,以及壟斷和不正當競爭等問題。
1.技術性失業問題
從凱恩斯開始,經濟學家們就開始對技術進步引發的失業問題表示關切。從“深度學習革命”后,人工智能就一直被視為可能引發新一輪技術性失業的重要源頭。早在2013年,牛津大學的學者Frey和Osborne[42]就曾對人工智能可能產生的就業沖擊進行過分析。他們的研究表明,在二十年內,美國的702個職業崗位中的47%都可能會受到人工智能的沖擊,由此可能造成上千萬人失業。需要指出的是,根據他們的研究,在人工智能時代,一個職業所受沖擊的大小與其所要求的教育水平,以及其所提供的薪酬都是負相關的。總體來說,一個職業要求的教育水平越高,從業者的薪酬越高,那么這個職業可能受人工智能的沖擊就越小。
與分析式AI一樣,生成式AI的發展也可能引發大規模的技術性失業。最近,OpenAI的幾位研究員Eloundou等[34]發表了一篇論文指出,大約 80% 的美國勞動者可能至少有 10% 的工作任務會受到 GPT等生成式AI大模型的影響,其中大約 19% 的勞動者至少有 50% 的工作任務會受到影響。
需要指出的是,不同于Frey和Osborne[42]的研究,他們認為,對教育水平要求更高、對從業者支付薪酬更高的崗位會受生成式AI大模型的沖擊。例如,根據Frey和Osborne[42]的估計,程序員、律師等崗位都是受人工智能影響較小的工作,但根據OpenAI的估計,這些都可能是生成式AI沖擊之下的“高危”職業。
2.收入分配惡化問題
生成式AI的發展可能會帶來收入分配格局的重大變化:
一方面,作為帶有技術偏向性的技術,生成式AI可能會引發不同職業勞動者薪酬的變動[43]。對于那些可能被生成式AI替代的職業,如程序員、設計師等,其薪酬水平可能會因此而大幅下降;而對于那些和生成式AI互補性較強的職業,如提示工程師(Prompt Engineer)、AI工程師等,其薪酬水平則可能出現大幅上漲。由于技術帶來的職業沖擊需要一定的時間消化,至少在短期內,受到生成式AI負面影響的人應該會比受到其正面影響的人更多,這就會導致整個勞動力群體獲得的總收入下降。另一方面,由于生成式AI帶有十分明顯的資本密集型特征,因而隨著這一技術的發展,資本的收益率將會大幅提升。尤其是主導該技術的頭部“巨星企業”[44],更可能在這一輪技術革命中獲益豐厚。
綜合以上兩個方面,如果不加干預,生成式AI的發展很可能導致資本回報在國民收入中的比例大幅上升,而勞動力回報在國民收入中的比例則大幅下降。
3.壟斷和不正當競爭問題
同每一次GPT的引入一樣,生成式AI的發展和擴散可能會對市場競爭格局產生重大的影響,與此同時,也會帶來很多新的競爭問題。
第一,由持股關系導致的合謀。現在很多生成式AI模型的研發都是由巨頭企業和其所投資的新創企業合作開發的。例如,ChatGPT雖然是OpenAI推出的,但其背后離不開微軟的巨大支持,并且微軟還持有大量的OpenAI股份。這種合作形式可以給研發活動帶來很多的便利:由于像微軟這樣的上市企業受嚴格的財務制度制約,因而很難長時間、大投入、無回報地支持某種技術的研發;而OpenAI這樣的初創企業雖然沒有這樣的制度約束,但其自身通常沒有足夠的資金從事研發活動。因此,通過類似的投資和持股關系,就可以很好地避免制度約束,讓更有創新力的新創企業獲得足夠的資金從事顛覆性技術研發。不過,這種合作關系也客觀上造成兩者之間的合謀。在OpenAI通過高密度研發,推出了ChatGPT、Dall?E2等先進的AI模型后,OpenAI就選擇了微軟作為其唯一的合作對象,而微軟也迅速將這些AI模型結合到自己的各種產品中。容易看到,面對微軟和OpenAI的這種合作,它們的對手將很難與之開展競爭。
第二,濫用市場支配地位。由于類似ChatGPT這樣的大型生成式模型的研發都需要大量的資金和技術投入,因而只有少數力量雄厚的巨頭企業,或者由巨頭支持的初創企業有能力進行研發。這樣一來,一個大模型一旦面世,也就自然地獲得了一定的市場力量。為了排擠潛在的對手,擁有大模型的企業可能會對其市場力量進行濫用。例如,此前OpenAI大幅下調了ChatGPT的API接入價格,這固然有模型運營成本降低的因素,但一些猜想也認為,這更有可能是微軟和OpenAI用低價限制潛在對手進入的一種手段。如果這些猜想屬實,那么微軟和OpenAI就涉及掠奪性定價問題。又如,ChatGPT在市場上獲得成功后,微軟立即將其集成到自己的各種產品當中,這一行為很可能會涉及搭售問題。再如,不久前微軟對一些采用必應搜索數據進行AI助手研發的企業提出警告,要求它們停止類似活動。考慮到搜索引擎檢索到的數據本身為公開信息,而重新在網絡層面建立索引數據庫的成本非常高,因而它在某種程度上可能構成開發AI應用的必需設施。如果是這樣,那么微軟的這一行為就可能涉及拒絕交易問題。
第三,并購控制問題。如前所述,現在很多科技巨頭為了在生成式AI領域取得優勢,都對優秀的AI初創企業進行了大量的投資。例如,微軟對OpenAI的投資總計已經達到了數百億美元。在現實中,接受投資的初創公司和進行投資的巨頭之間通常會一致行動,從而對市場競爭格局造成顯著影響,但到目前為止,反壟斷監管機構很少對這種合作關系進行關注。
所有上述現象都可能給正常的競爭秩序帶來干擾,并影響生成式AI技術的進步和普及。因此,監管者應該對這些問題給予足夠的重視。
五、關于促進生成式AI發展的政策思考
通過前面的分析可知,作為GPT,生成式AI在未來的發展中將扮演至關重要的角色。目前生成式AI的發展還存在著很多障礙,并且在其發展過程中,還會引發很多問題。在這種情況下,要促進生成式AI的健康、平穩、高速發展,并盡可能減少其發展過程中伴生的各種負面影響,就必須用相關的政策加以引導,本文將主要討論以下三類政策:
(一)產業政策
根據Lipsey等[45]的觀點,在支持GPT的發展方面,一直有兩種不同的觀點:新古典觀點和結構—演化觀點(Structure?Evolution Lenses,簡稱S?E觀點)。其中,新古典觀點假設政府具有完全信息和完備知識,可以識別出最優的均衡狀態,因而政府可以通過直接指令、補貼或稅收來誘導均衡的實現;而S-E觀點則認為,GPT的擴散是通過演化實現的,政府并不能事先識別出最優的均衡。因此,政府應該做的就是建設支撐GPT研發和擴散的基礎設施,同時作為協調者,解決GPT擴散當中遭遇的協調問題。在實踐中,新古典觀點對應的是“挑選贏家”的產業支持政策,S?E觀點對應的則是現代的以塑造發展環境為主的產業政策。新近的研究表明,后一種產業政策通常是更有效的[46-47]。因此,在促進生成式AI方面,政府也應該采用這種觀點,并以此來指導產業政策的制定。具體來說:
1.在扶持目標的選擇上,不宜以特定的產品或技術目標為對象,應該更加重視塑造競爭環境,讓不同的產品、技術路徑可以彼此競爭
在ChatGPT獲得成功之后,有不少地方政府都表示要支持企業研發對標ChatGPT的產品,這種政策是值得商榷的。從目前看,生成式AI無論是在訓練方法、訓練框架,還是在產品構思方面,都存在著很多彼此競爭的路徑。例如,在NLP領域,就有GPT和BERT這兩種重要的競爭路徑,雖然前者由于ChatGPT的流行而暫時獲得了優勢,但這并不意味著從長期看BERT路徑一定不如GPT路徑。類似地,在文字生成圖片領域,GAN、流模型及擴散模型的競爭仍然十分激烈。在這種情況下,如果政府過度強調對標某一產品或技術路徑,就會對其他可能的技術發展方向造成抑制,從而不利于生成式AI整個領域的長期發展。相比之下,對所有產品、技術路徑都一視同仁,在政府采購、招標時只提性能、質量要求,不對工藝技術進行強行規定,則是一種更為可取的思路。這樣的做法可以激勵各種技術路徑展開競爭,倒逼技術進步,最終促進生成式AI的健康發展。
2.應當集中力量突破高性能芯片等“卡脖子”技術,保障生成式AI“硬性”基礎設施的供給
對于生成式AI的發展來說,高性能芯片等技術的作用十分關鍵,單個企業很難突破這些關鍵技術。在這種情況下,政府應該集中全國的科研力量,做好這些技術的攻關工作。具體來說,在進行技術攻關的過程中,可以參考美國的經驗,組建一個類似“國防部高級研究計劃局”(Defense Advanced Research Projects Agency,DARPA)的機構來協調分散在各機構和企業中的科研力量[48]。這個機構可以采用相對松散的組織機構,根據項目從不同的企業抽調所需的技術人員。一旦相關研發取得突破,該機構還可以通過項目發包的方式提供資金支持,讓這些技術更快地實現產業化。借助這種模式,就可以比較好地整合各種研究資源,從而促進生成式AI的研發,以及研發成果順利轉化。
3.應當強化相關“軟性”基礎設施的供給,尤其是應該引導國內開源生態的形成
在促進技術發展方面,“軟性”基礎設施的作用不容忽視,政府應當予以高度重視。具體到生成式AI的發展,政府應當關注相關法律、法規,以及行業標準的建設,做好這些“軟性”基礎設施的供給者。尤其需要指出的是,目前我國在開源生態方面的建設還很落后,這會在很大程度上制約生成式AI的發展。針對這一問題,政府應當投入專項資金支持開源平臺的建設,并鼓勵企業積極參與建設開源生態。通過這些舉措,就可以有效激活生成式AI研發的交流生態,對這一技術的發展產生顯著的推進作用。
4.應當扮演好“協調者”角色,引導不同角色之間的相互配合,促進生成式AI的擴散
作為GPT,生成式AI對生產率的促進作用很大程度上取決于其擴散程度,因而政府需要積極促進生成式AI在各部門之間的擴散。在現實中,制約技術擴散的因素有很多。例如,不同行業所使用的技術標準不一,技術的發展程度、接受程度不同,以及一些具有市場力量的企業拒絕與其他企業互聯互通等,都有可能減緩技術擴散的速度。針對這些問題,政府應當積極制定相關的通用標準,引導不同企業之間的互聯互通和技術合作。通過這些舉措,就可以有效加強不同企業之間的協調,從而促進生成式AI在不同領域、不同部門之間的迅速擴散。
(二)就業和社會保障政策
隨著生成式AI的發展和普及,大量崗位都可能受到劇烈沖擊。至少在短期內,失業和收入分配惡化的問題可能會非常突出。針對這一情況,政府必須積極出臺相關的就業和社會保障措施來加以應對。
1.應當積極鼓勵服務業的發展
由于生成式AI具有較強的創造能力,對技術性的、以物為工作對象的就業崗位替代性非常強。相比之下,服務業尤其是那些以人為工作對象的、以為人提供情緒價值為主要目標的就業崗位則相對難以被AI替代。政府應當積極鼓勵服務業的發展,創造更多就業崗位。
2.應當積極鼓勵和引導零工經濟、共享經濟等新就業形態的發展
隨著生成式AI的普及,工作的性質會發生很多改變:一方面,由于很多任務都可以由AI代為完成,大量就業崗位將不再需要全職勞動者;另一方面,隨著生成式AI的擴散,不斷會有新的就業崗位被替代,因而失業的人們會經常需要暫時的工作機會。在這種情況下,社會上對更靈活、更具彈性的工作形態的需求就會增加。顯然,零工經濟、共享經濟等就業形態非常符合上述要求,不僅可以有效利用碎片化時間,還可以很好地充當“就業蓄水池”的作用,在技術性失業壓力增大時提供大量就業機會。因此,政府應當對彈性工作的發展多加鼓勵和支持。
3.應當建立終身培訓體系,幫助因AI沖擊而失業的人實現再就業[49]
當人們因AI的沖擊失業后,會因缺乏相關技術而難以再就業。為了幫助這部分人實現再就業,政府有必要建立培訓體系,提供有針對性的培訓服務。需要指出的是,即使是政府也未必掌握完整的市場信息,因而其提供的培訓也可能不符合市場需求。為了解決這個問題,需要用相關機制來加強政府、用人企業及勞動者之間的協調。具體來說,可以設計一種“就業抵押貸款”機制:用人單位可以先和勞動者簽訂就業合同,并對其提出相關的技能要求。勞動者根據要求,以其未來的收入作為抵押,去相關培訓機構進行培訓,學成相關技能后再上崗。政府可以根據用人單位提供的信息為勞動者提供相應的補貼,作為其參與技能培訓的費用。利用這種方式,就可以有效減少因搜索和協調問題產生的成本,促進整個勞動力市場更高效的運作。
4.應當做好社保的托底工作
無論政府如何引導,在生成式AI的沖擊面前,總有一部分勞動者會因此而長期失業。對于這部分群體,政府應該做好托底,滿足其基本生活需求。在未來機會合適時,還可以考慮探索“全民基本收入”(Unconditional Basic Income,UBI)制度,為全體公民按月提供一筆基本收入。至于托底性收入及未來的UBI資金來源,可以考慮向AI提供商及大規模使用AI的企業收稅來獲得。借助這種制度設計,就可以有效緩和因生成式AI普及而帶來的收入分配惡化問題,引導生成式AI創造的財富更好地為共同富裕事業服務。
(三)競爭政策
在生成式AI的發展過程中,容易引發很多新型的壟斷和不正當競爭問題。為了維護市場秩序正常運作,監管機構必須重視這些問題。
1.對科技巨頭與新創企業之間的合作關系應當予以重點關注
一方面,對那些巨頭企業通過投資獲得初創企業控股權或決策權的情形,應當進行并購審查;另一方面,對那些表面上不涉及控股問題的投資合作,應當評估合作雙方的各種一致行動是否會帶來反競爭效果,是否構成合謀。如果在審查和評估中發現問題,當立即予以糾正。
2.對于生成式AI所涉及的相關市場界定,以及市場力量的決定等基本問題,應當主動開展研究
作為一個新事物,生成式AI的應用潛力還沒有完全開發出來,生成式AI究竟可以替代哪些產品,和哪些產品形成競爭,涉及的相關市場究竟有哪些進入壁壘,這些問題都不是非常清楚。出于監管的需要,應當立即對這些基礎問題進行研究,摸清相關情況。
3.對于生成式AI的應用合規問題,應當出臺相關指南和細則
為了規范企業在生成式AI市場中的競爭行為,防止壟斷企業濫用市場支配地位,應當在加強調查研究的基礎上,盡快出臺相關的行為指南和細則,有利于企業在競爭中有法可依,規范競爭。
六、結 語
在經濟發展過程中,GPT是一類非常重要的技術,其發展和傳播不僅會為經濟發展注入新的動力,還會對整個經濟的結構進行重塑。作為一種新出現的技術,生成式AI具有GPT所要求的普遍適用性、進步性和創新孕育性等特征,因而很可能會成為全新的GPT,對經濟的貢獻潛力巨大。因此,無論是出于高質量發展的需要,還是出于加強我國國際競爭力的考量,都需要大力支持生成式AI的發展,用好產業政策,對其進行支持。
與此同時,作為GPT,生成式AI的發展一定會伴隨著“創造性毀滅”過程。這會帶來技術性失業、收入分配惡化,以及壟斷和不正當競爭等問題。對于這些問題絕不能放任不管,必須用好相應的政策來加以應對。
總而言之,生成式AI的出現是一個巨大的發展機會。只要能夠用好政策加以妥善引導,就可以揚長避短,讓生成式AI的力量得到更好發揮,讓這種新技術更好地造福人民。
參考文獻:
[1]???? HACKER P,ENGEL A,MAUER M. Regulating ChatGPT and other large generative AI Models[R].ArXiv Preprint,2023.
[2]???? BRESNAHAN T,TRAJTENBERG M. General purpose technologies: ‘engines of growth?[J].Journal of econometrics,1996,65(1): 83-108.
[3]???? CARLAW K,LIPSEY R. Externalities,technological complementarities and sustained economic growth[J].Research policy,2002,31(8-9): 1305-1315.
[4]???? BEKAR C,CARLAW K,LIPSEY R. General purpose technologies in theory,application and controversy: a review[R]. Simon Fraser University Department of Economics Working Papers,2016.
[5]???? LIPSEY R,CARLAW K,BEKAR C. Economic transformations: general purpose technologies and long?term economic growth[M].Oxford: Oxford University Press,2005:132.
[6]???? HELPMAN E, TRAJTENBERG M. A time to sow and a time to reap: growth based on general purpose technologies [R]. NBER Working Paper,1994.
[7]???? ANDERTON R. Virtually everywhere?? Digitalisation and the euro area and EU economies[R].European Central Bank,2020.
[8]???? JOVANOVIC B, ROUSSEAU P. General purpose technologies [C]// AGHION P,DURLAUF S. Handbook of economic growth( Volume 1B). Amsterdam: North Holland,2006: 1181-1225.
[9]???? CHRISTENSEN C. The innovators dilemma[M].Boston,MA: Harvard Business School Press,1997:257-261.
[10]??? SCHUMPETER J. The theory of economic development[M]. New York: Oxford University Press,1911:99-133.
[11]??? AGHION P,ANTONIN C,BUNEL S. The power of creative destruction: economic upheaval and the wealth of nations[M]. Cambridge: Belknap Press,2021:55-74.
[12]??? PETIT P. Employment and technological change [C]// STONEMAN P. Handbook of the economics of innovation and technological change. Amsterdam: North Holland,1995:366-408.
[13]??? ACEMOGLU D. Technical change,inequality,and the labor market[J].Journal of economic literature,2002,40(1):7-72.
[14]??? ALLEN R. Engels pause: technical change,capital accumulation,and inequality in the British industrial revolution[J].Explorations in economic history,2009,46(4): 418-435.
[15]??? AUTOR D,DORN D,KATZ L F,et al. The fall of the labor share and the rise of superstar firms[J].Quarterly journal of economics,2017,135(2): 645-709.
[16]??? BENGIO Y,DUCHARME R, VINCENT P. A neural probabilistic language model [J].Journal of machine learning research,2000,3(6):932-938.
[17]??? GOODFELLOW I ,POUGET?ABADIE J ,MIRZA M,et al. Generative adversarial nets [R]. Advances in Neural Information Processing Systems,2014.
[18]??? KINGMA D,WELLING M. Auto?encoding variational Bayes[R].ArXiv Preprint,2014.
[19]??? DINH L,KRUEGER D,BENGIO Y. NICE: Non?linear independent components estimation[R].ArXiv Preprint ,2014.
[20]??? HO J,JAIN A,ABBEEL P. Denoising diffusion probabilistic models[R]. Advances in Neural Information Processing Systems,2020.
[21]??? VASWANI A,SHAZEER N,PARMAR N,et al. Attention is all you need[R]. Advances in Neural Information Processing Systems,2017.
[22]??? 陳永偉,程華.元宇宙經濟:與現實經濟的比較[J].財經問題研究,2022(5):3-16.
[23]??? 陳永偉.Web 3.0:變革與應對[J].東北財經大學學報,2022(6):27-39.
[24]??? NISZCZOTA P,ABBAS S. GPT as a financial advisor[R].SSRN Working Paper,2023.
[25]??? YOO S ,LEE S ,KIM S ,et al. Integrating deep learning into CAD/CAE system: generative design and evaluation of 3D conceptual wheel[J].Structural and multidisciplinary optimization,2021,64(4):2725-2747.
[26]??? BIAN Y,XIE X. Generative chemistry: drug discovery with deep learning generative models[J].Journal of molecular modeling,2021,27(3):1-18.
[27]??? WALTERS P,MURCKO M. Assessing the impact of generative AI on medicinal chemistry[J].Nature biotechnology,2020,38(2):143-145.
[28]??? CALLAWAY E. The entire protein universe: AI predicts shape of nearly every known protein[J].Nature,2022,608(7921):15-16.
[29]??? TANG B,EWALT J,NG H. Generative AI models for drug discovery[M]. Cham: Springer International Publishing,2021:221-243.
[30]??? LU S,ZHOU Q,CHEN X,et al. Inverse design with deep generative models: next step in materials discovery[J].National science review,2022,9(8):8.
[31]??? SANCHEZ?LENGELING B,ASPURU?GUZIK A. Inverse molecular design using machine learning: generative models for matter engineering[J].Science,2018,361(6400):360-365.
[32]??? LIU Z,ZHU D,RODRIGUES S P,et al. Generative model for the inverse design of metasurfaces[J].Nano letters,2018,18(10): 6570-6576.
[33]??? WILLIAMS T. Some companies are already replacing workers with ChatGPT,despite warnings it shouldnt be relied on for ‘anything important [EB/OL].(2023-02-25)[2023-03-03].https://fortune.com/2023/02/25/companies?replacing?workers?chatgpt?ai/.
[34]??? ELOUNDOU T,MANNING S,MISHKIN P,et al. GPTs are GPTs: an early look at the labor market impact potential of large language models[R]. ArXiv Preprint, 2023.
[35]??? ZEWE A. In Machine learning,synthetic data can offer real performance improvements [EB/OL].(2022-10-03)[2023-03-03].https://news.mit.edu/2022/synthetic?data?ai?improvements?1103.
[36]??? ANDREWS G. Hat is synthetic data? [EB/OL].(2021-06-08)[2023-03-03].https://blogs.nvidia.com/blog/2021/06/08/what?is?synthetic?data/.
[37]??? AGRAWAL A,MCHALE J,OETTL A. Finding needles in haystacks: artificial intelligence and recombinant growth[M].Chicago: University of Chicago Press,2018: 149-174.
[38]??? DRIESS D,XIA F,SAJJADI M,et al. PaLM?E: An embodied multimodal language model[R]. ArXiv Preprint,2023.
[39]??? 陳永偉.超越ChatGPT:生成式AI的機遇、風險與挑戰[J].山東大學學報(哲學社會科學版),2023(3).
[40]??? SEVILLA J ,HEIM L ,HO A ,et al. Compute trends across three eras of machine learning[R]. International Joint Conference on Neural Networks ,2022.
[41]??? LIPSEY R,CARLAW K,BEKAR C. Economic transformations: general purpose technologies and long?term economic growth[M]. Oxford: Oxford University Press,2005:37-42.
[42]??? FREY B,OSBORNE M. The future of employment[R]. Oxford Martin School Working Paper,2013.
[43]??? ACEMOGLU D. Technical change,inequality,and the labor market[J].Journal of economic literature,2002,40(1):7-72.
[44]??? AUTOR D ,DORN D ,KATZ L F ,et al. The Fall of the labor share and the rise of superstar firms[J].Quarterly journal of economics,2020,135(2): 645-709.
[45]??? LIPSEY R,CARLAW K,BEKAR C. Economic transformations: general purpose technologies and long?term economic growth[M]. Oxford: Oxford University Press,2005:499-515.
[46]??? RODRIK D. Industrial policy for the Twenty?first Century[R]. SSRN Working Paper,2004.
[47]??? AGHION P,JING C,DEWATRIPONT M,et al. Industrial policy and competition[J].American economic journal: macroeconomics,2015,7(4):1-32.
[48]??? 郝君超,王海燕,李哲.DARPA科研項目組織模式及其對中國的啟示[J].科技進步與對策,2015(9):6-9.
[49]??? 陳永偉.人工智能與經濟學:近期文獻的一個綜述[J].東北財經大學學報,2018(3):6-21.GPT as GPT:Opportunities and Challenges of the New Generation of Artificial Intelligence
CHEN Yong?wei
(Research Department, Journal of Comparative Studies, Beijing 100871, China)
Summary:This paper provides an overview of opportunities and challenges of the new generation of artificial intelligence (AI) from the perspective of general purpose technology (GPT). It also introduces recent development in generative AI, such as ChatGPT and GPT-4.
This paper first discusses whether AI can be considered a GPT. The first criterion for determining whether a technology is a GPT is its universality. In terms of generative AI, it needs to be examined whether it can be widely used in vertical fields. The answer to this question is yes.? Generative AI has broad application prospects in both consumer and industrial sectors. In many fields, users only need to guide pre?trained models with prompts to obtain results that meet professional needs at low conversion costs compared with traditional analytical AI. Generative AI can provide a large number of content products for the internet ecosystem on the consumer side, enriching internet diversity and improving user experience. On the industrial side, generative AI can help researchers better understand protein folding structures or design materials through inverse design methods based on their structure and chemical properties. The second criterion for determining whether a technology is a GPT is its progressiveness. Generative AI has made significant progress in recent years, especially with the development of deep learning models and training methods. The third criterion for determining whether a technology is a GPT is its innovation. Generative AI has the potential to create new business models and industries, as well as new products and services.
However, there are still many obstacles to the development of generative AI. One of the biggest challenges is the need for high computing power during model training. Another challenge is the need for large?scale facilities for data storage, especially for non?structured data. In addition to technical challenges, generative AI causes social challenges such as technological unemployment and income inequality. Governments need to adopt appropriate policies to address these issues while promoting the development of generative AI.
To promote the development of generative AI, governments should focus on following key areas. (1) R&D investment. Governments should invest in R&D of generative AI technologies to improve the performance and reduce costs. (2) Infrastructure construction. Governments should build high?performance computing facilities and large?scale data storage facilities to support the development of generative AI. (3) Promoting collaboration. Governments should encourage collaboration between academia, industry and government agencies to promote innovation in generative AI. (4) Talent training. Governments should invest in education and training programs to develop talent with expertise in generative AI technologies. (5) Addressing social challenges. Governments should adopt appropriate policies to address social challenges such as technological unemployment and income inequality that may arise from the development of generative AI.
Key words:generated AI; GPT; ChatGPT
(責任編輯:鄧 菁)