金珺,朱晨希,趙苑婷,吳敏儀
(1.浙江大學管理學院,杭州 310058)
2020年初,人工智能被國家納入“新基建”范疇,進一步助推人工智能產業發展。隨后,《中共中央關于制定國民經濟和社會發展第十四個五年規劃和二〇三五年遠景目標的建議》指出,要瞄準人工智能等前沿領域進行重點布局。因此,預測人工智能技術的未來,找準我國在全球人工智能產業中的定位,發揮優勢,對發展人工智能的重點城市而言顯得尤為重要。
NeurIPS 是人工智能領域的頂級會議論文,通過NeurIPS(2021)收錄論文主題分布中可以總結人工智能領域的技術熱點(如圖1):計算機視覺和人類語言技術兩大人工智能主要技術任務合計占比約30%,而機器人與自動化技術任務以及人工智能相關的基礎設施、數據智能以及前沿智能技術合計僅占約5%左右的論文份額[1]。

圖1 2021年人工智能期刊收錄論文主題分布
綜合所有人工智能相關技術,趨勢指數排名前10 的分別為:語音識別、卷積神經網絡、云計算、GPU、深度學習、推薦系統、機器翻譯、定位、大規模預訓練模型及情感分析。從近3 年的變化來看,綜合對比增幅最大排名前5的技術分別是語音識別、文本分類、數據挖掘、物體識別以及 GPU 技術。
從人工智能技術應用來看,根據2021 年國際數據公司IDC 針對企業對于人工智能技術的應用現狀調研的結果,計算機視覺目前仍為最主要的應用技術類型,視頻監控、圖像識別、智能攝像頭、人臉識別以及圖像處理等企業應用率位居前列(如圖2)。

圖2 2021年企業已部署的人工智能場景
在人工智能技術開發和使用方面處于領導者的國家將塑造人工智能的未來,并顯著提高其經濟競爭力,而落后的國家則面臨在該關鍵行業失去競爭力的風險[2]。我們選擇以中國、歐盟和美國為研究對象,因為它們在絕對類別中表現普遍優于其他國家。到目前為止,美國已經成為人工智能領域的早期領先者,但中國正在挑戰其領先地位。歐洲持續落后,但在努力追趕。本報告從科研、硬件和領先企業3個方面衡量美國、歐洲和中國人工智能技術發展的能力[3]。
本節從中國、歐盟和美國的人工智能學術論文數量、論文質量和專利情況3個方面進行研究,以評估美歐中三者在科研方面的實力。
2.1.1 論文數量
一個地區每年發表的人工智能研究論文的數量是衡量其研究能力的一項指標。該指標追蹤了由Scopus搜集的2021 年每個地區發表的人工智能論文的數量,該數據庫包含了來自數千份同行評審期刊的數百萬份文檔。根據《美國數據創新中心2021 年中美歐人工智能領跑報告》,中國在2021 年發表的人工智能論文數量(24929 篇)領先了歐盟(20418篇)和美國(16233篇)。
自2015 年以來,歐盟占全球人工智能論文的份額一直在下降,當時歐盟發表了人工智能論文的近29%。自那以后,歐盟論文份額在 2019 年(26.3%)、2020 年(25.5%)和2021年(23.1%)均有所下降。如果不把英國包括在內,歐盟在2021 年的份額將會下降到19%——英國僅略高于美國的份額(18%)。在同期(2015—2021年),中國的研究論文份額從23%以下增加到28%以上(如圖3)。

圖3 2000—2020年按地理區域展示的AI期刊出版文獻
2.1.2 論文質量
論文質量通常會用被引次數來衡量,也就是跟蹤每個地區的FWCI(領域加權被引)。這個數字衡量了每個地區的出版物與世界各地類似出版物相比被引用的頻率。根據《美國數據創新中心2021 年中美歐人工智能領跑報告》,2021 年美國以 1.4 的 FWCI 值領先于歐盟(1.1)和中國(0.8),這意味著其論文的被引用率比世界平均水平高出40%。相比之下,歐盟的FWCI 自2015 年以來一直在上升。因此,盡管歐盟在全球人工智能論文產量中所占的份額正在下降,但其出版質量卻在不斷提高。相比之下,中國的FWCI從2017年(0.6)到2021年(0.8),穩步上升。
2.1.3 專利情況
在世界領域,2012 年至2021 年這10 年間,中國的人工智能專利申請數量(695630 件)最多[4],占全世界申請總量的52%,呈現壓倒性優勢,遠超過美國、日本和歐洲(如圖4)。美國這十年間的人工智能專利數量占全球的19%。只比較中美兩國的人工智能專利,則可看出,在2012 年,中國和美國的人工智能專利申請數量還較為接近,分別為16463件和11584件;而在2021年,中國和美國的人工智能專利數量差距拉大,中國(136885 件)已經高出美國(22943 件)一個數量級。歐洲的人工智能專利數量只占全球范圍內的5%,落后于美國和中國。

圖4 世界人工智能專利申請數量占比
計算能力對人工智能來說正變得越來越重要。例如,自2012年以來,訓練最大的人工智能系統的計算能力每3—4 個月就增加一倍。本小節分析了半導體銷售、半導體研發支出、按性能排名前500 的超級計算機數量,以及在中國、歐盟和美國的超級計算機的總系統性能?,F有的最新數據顯示,美國在硬件方面領先(6.3 分),其次是中國(2.3 分)和歐盟(1.4 分)。在勞動力規模的控制下,美國(7.7分)領先于歐盟(1.5分)和中國(0.8分)。
2.2.1 半導體芯片
美中兩國之間的貿易爭端等事件的存在,可能會使一個國家面臨包括人工智能芯片在內的半導體產品供應風險。此外,一些公司還發現,明確設計用于訓練和運行人工智能系統的芯片可以提高這類系統的性能。根據《美國數據創新中心2021 年中美歐人工智能領跑報告》,到2021 年,美國至少有62 家公司在開發人工智能芯片,中國有29家,歐盟有14家。
2.2.2 按性能排名前500的超級計算機數量
越來越多的研究人員認為,計算能力對人工智能系統的發展至關重要。根據每秒可以執行多少浮點計算,能評選出性能方面排在前500名的超級計算機。根據《美國數據創新中心2021年中美歐人工智能領跑報告》,中國的超級計算機數量為214臺,高于美國的113臺和歐盟的91 臺。如果沒有英國,歐盟有79 臺超級計算機排名前500。在過去的10年里,中國在這一指標上經歷了顯著的增長。2012年,中國只有68臺電腦進入了前500名,美國有252 臺。然而,中國只用了4 年時間就超過了美國,進而迅速發展至超過美國100多臺。
2.2.3 總系統性能排名前500的超級計算機數量
另一種評估一個國家超級計算機實力的方法是衡量其頂級系統的總性能。該指標跟蹤在每個地區排名前500的超級計算機的總系統性能。根據《美國數據創新中心2021 年中美歐人工智能領跑報告》,2021 年,綜合系統性能排名前500 強的計算機中,美國占比27.5%,領先中國的23.3%和歐盟的16.8%。如果沒有英國,歐盟的數據則為15.4%。2021 年,由于日本企業的崛起,中國和美國在前500 個系統中所占的比例都低于2020 年。日本從2020 年占總系統性能的8%以下增長到2021 年的24%以上。日本現在擁有世界上最快的系統,超級計算機Fugaku,其最大性能幾乎是第二快的超級計算機的3倍。
沒有足夠資金的人工智能公司不太可能開發創新的人工智能產品或服務。因此,衡量每個地區有多少公司有足夠的資金來對人工智能產生影響是很重要的。該指標關注了人工智能行業中獲得至少100 萬美元聯合資金的公司數量。根據《美國數據創新中心2021 年中美歐人工智能領跑報告》,美國以2130 家企業數量,遠遠領先歐盟的890家和中國的398家。
在過去幾年中,大多數算法由美國的 Facebook、谷歌、微軟等大型科技類公司發現和開創。例如,Deep-Mind 通過 Alpha Zero 在人工智能強化學習方面取得了獨特的進展,實現了完全基于“自我游戲”的學習,沒有涉及實際數據。此外,美國公司還開發了主要工具箱和軟件框架,例如 TensorFlow、Pytorch、Caffe,被世界各地的工業界和學術界廣泛應用于人工智能的研究。這些平臺的突出地位有助于美國在人工智能方面的核心領導地位,包括在數據積累方面取得優勢。
相比之下,中國在塑造人工智能的核心技術工具方面仍然落后。但是,中國在計算機視覺、語音識別和自然語言處理方面擁有世界領先的公司,如商湯科技、Unisound、科大訊飛和 Face++等[5]。
歐洲由于沒有互聯網巨頭公司,能夠接觸到的數據量相對于中美的公司少很多?,F在最火的機器學習算法,比如神經網絡,都是基于大數據的分析和處理?!叭斯ぶ悄堋备拍畛藱C器學習,還包括了計算機視覺、自動駕駛等很多概念。歐洲在這方面有一定實力。慕尼黑工業大學、馬克斯·普朗克研究所(Max Planck Institute,MPI)等都有一些世界領先的人工智能成果。在自動駕駛領域,奧迪是第一家在量產車上推出Level 3自動駕駛系統的(搭載在最新一代奧迪A8上)[6]。
通過中國和美國、歐盟人工智能實力的比較可以發現:美國科技巨頭對人工智能相關技術的研究起步早,投入高,人才、芯片及算法都走在中國前面;歐洲在人工智能方面長于理論研究和實驗室技術,但缺乏科技巨頭企業,難以轉化為市場力量;中國雖然在人工智能創新企業數量和規模方面和美歐存在差距,在智能傳感器、高性能中央處理器、智能芯片等方面與美歐也有較大差距,但中國具有人口及市場優勢。我國人工智能產業發展具備龐大的數據源及應用場景,有較好的發展前景。
人工智能是引領新一輪科技革命和產業變革的戰略性技術,具有溢出帶動性很強的“頭雁”效應。因此,預測人工智能技術的未來、提早布局顯得尤為必要。
技術成熟度曲線是企業用來評估新科技的可見度,利用時間軸與市面上的可見度(媒體曝光度)決定要不要采用新科技的一種工具。此曲線由著名國際咨詢公司Gartner(高德納咨詢公司)于1995 年開始分析預測與推論各種新科技的成熟演變速度及要達到成熟所需的時間。參考高德納“2021 人工智能技術成熟度曲線”,可以預測人工智能技術未來的趨勢。處于技術萌芽期的主要是實驗室內的人工智能技術,包括模型運維、神經形態硬件等技術;處于期望膨脹期的主要是行業領先者開展小規模實驗和部署的人工智能技術,包括知識圖譜、智能機器人、決策智能等技術;處于泡沫破裂低谷期的主要是技術能力及相關基礎設施開始發展的人工智能技術,包括機器學習、自然語言處理、計算機視覺、自動駕駛和深度學習等技術;處于穩步爬升復蘇期的主要是經過驗證、經過商業化的但能力發展不大的人工智能技術,包括語義搜索等技術[7]。
參考高德納“2021人工智能技術成熟度曲線”可知全球人工智能即將步入生產成熟期的技術有計算機視覺、語音識別、機器學習等,這些技術的預計成熟時間為2—5年,意味著未來5 年內將十分有望普及市場并廣泛應用。其中還有8項技術顯示未來需5—10年達到成熟期,包含機器學習中的深度學習、智能機器人、數字倫理、自然語言處理等技術,這些技術賽道屬于人工智能產業未來重點發展方向,目前正處于“期望膨脹期”,表明世界對人工智能的最高期待(如圖5)。

圖5 2021人工智能技術成熟度曲線
另外,前沿智能技術領域前景比較廣闊的當屬可穿戴、沉浸式技術以及腦機接口這3個比較接近的技術領域門類(如圖6)。一方面,可穿戴智能設備的形態越來越多樣化,應用領域也不斷擴展,表現出廣闊的潛力;在未來,可穿戴設備的針對性和目標性會更強,伴隨著 VR、AR 等沉浸式技術的逐漸成熟,可穿戴設備將成為人工智能技術普及的一大重要方向。而腦機接口作為神經工程與可穿戴技術的交叉領域,在技術進步、成本降低以及相關的道德隱私安全等方面還有諸多問題與挑戰需要解決[8]。

圖6 前沿智能技術領域熱門技術詞云圖
從人工智能單點技術應用來看,根據 2021 年 IDC針對企業對于人工智能技術的應用現狀調研的結果,預計未來3 年,企業在持續增加計算機視覺應用的同時,也會加深語音識別、自然語言處理等技術場景的應用(如圖7)。

圖7 未來三年企業將部署的人工智能場景
人工智能已成為引領新一輪科技革命和產業變革的重要驅動力量和戰略性技術。通過本文的分析可知,中國在人工智能領域全球競爭中的短板和優勢。中國在人工智能創新企業數量和規模方面和美歐存在差距,在智能傳感器、高性能中央處理器、智能芯片等硬件方面與美歐也有較大差距,但中國具有人口及市場優勢,可以為人工智能提供龐大的數據源及應用場景,發展勢頭很好。在未來,中國如果想要在人工智能這輪科技革新中占得先機,就需要加強技術預判,提早部署,特別是在一些基礎性、突破性的領域精準布局,加大對人工智能相關軟硬件的研發投入,提高核心技術的自主能力[9]。本文依據2021年人工智能技術成熟度曲線并結合人工智能技術的發展現狀預測,在下一個10年,深度學習、智能機器人、數字倫理、自然語言處理等技術都屬于人工智能產業未來重點發展方向。在未來幾年,這些技術的成熟和商用化將會進一步影響產業發展、社會發展和人們的生產生活。