


編者按:當前,人工智能(AI)正在從一項前沿技術(shù)躍升為驅(qū)動經(jīng)濟社會變革的核心生產(chǎn)力,以前所未有的深度和廣度重塑著全球的經(jīng)濟結(jié)構(gòu)、社會形態(tài)乃至國際力量。在這場席卷全球的浪潮中,世界主要經(jīng)濟體無不將發(fā)展AI提升至國家戰(zhàn)略高度,力圖在這場關(guān)乎未來的競賽中占據(jù)領(lǐng)先地位。面對這一情況,如何科學、客觀地評估本國的AI發(fā)展水平,同時精準洞察競爭對手的戰(zhàn)略動向與技術(shù)路徑,便成為一項至關(guān)重要的任務。在此背景下,各類AI評價指標體系和深度分析報告應運而生,如全球AI指數(shù)(GAII)、斯坦福AI指數(shù)(AII)等,它們既多維度地衡量了本國在AI領(lǐng)域的綜合實力、優(yōu)勢方向與短板所在,也深入揭示了主要競爭對手(包括國家層面和頂尖機構(gòu)層面)的技術(shù)路線、研發(fā)重點、人才儲備、政策扶持以及產(chǎn)業(yè)化進程,從而研判競爭格局、預測未來發(fā)展趨勢。然而,無論是當前學術(shù)界的前沿探索,還是產(chǎn)業(yè)界的市場分析、決策者和公眾的目光,常常為最終的排名、得分或趨勢預測所吸引,相對忽略了“我們應該用什么樣的尺子去測量AI的發(fā)展”這一根本性的認知問題。
基于上述背景,本刊特邀請李廣建教授組織了“人工智能指標體系研究”專題。本組專題文章從全球AI評價指標體系的現(xiàn)狀出發(fā),展開全球AI發(fā)展水平評價指標體系的梳理、比較、影響及中國特色AI評價體系的構(gòu)建研究,既全面展現(xiàn)了全球三十余種AI發(fā)展水平評價體系的內(nèi)容以及每一體系所反映的所在國家或地區(qū)的戰(zhàn)略重心與價值取向,也從情報學視角構(gòu)建了我國AI發(fā)展水平評價體系。
相信本專題可為AI評價研究提供一個切入點和思考框架,也能為情報學領(lǐng)域中科技評價的理論深化與實踐創(chuàng)新注入活力,豐富和促進情報學的研究與發(fā)展。
關(guān)鍵詞:人工智能評價;評價指標體系分類;人工智能指數(shù);人工智能評價范式中圖分類號:TP18 文獻標識碼:A DOI:10.11968/tsyqb.1003-6938.2025041
The Classification, Development Status,and Trend Analysis of Global Artificial Intelligence Evaluation Index Systems
AbstractArtificial intellgenceevaluation indexsystems notonly serve as a weather vane for the innovative developmentof globalAIbutalsoimplicitlyeflectthenationalwillandstrategicinterestsoftheiroriginatingcountries.Thispaper begins byreviewing 22 representative AIevaluation indices fromaroundtheworld.Basedontheevaluation subjects and objectives,itconstructsaclasificationframeworkforAIvaluationindexsystems,comprisingfivecategories:comprehensive strength,development foundation,Ramp;Dcapabilities,ethics and governance,and market application.Secondly, the paper provides ananalysis of thediferences among these various evaluation index systems in terms of their goal-setting,areasofemphasis intheirindicators,ndmethodologies,reveaingtheunderlyingnationalstrategies,policyorentations,and values.Finally,itsystematicallyanalyzesfour majortrends incurrent global AIevaluation indexsystems from the perspectivesofevaluationparadigms,therighttodiscourse in evaluation,evaluationobjectives,ndthe timeliesof evaluation.
Key words artificial intelligence evaluation; clasification of evaluation index systems;AI index;AI evaluation paradigm
人工智能作為引領(lǐng)未來發(fā)展的戰(zhàn)略性技術(shù),在社會、經(jīng)濟、國防、政治等領(lǐng)域產(chǎn)生了深遠的影響,已成為國際競爭的新焦點。全球主要國家和地區(qū),特別是發(fā)達國家持續(xù)加強人工智能的戰(zhàn)略布局和全球人工智能的影響力,全球人工智能發(fā)展已進入更加激烈的競爭階段。近年來,美國、日本、英國、德國等國家和經(jīng)濟體密集發(fā)布人工智能相關(guān)戰(zhàn)略規(guī)劃,紛紛加大人工智能領(lǐng)域公共投入,圍繞人工智能的基礎(chǔ)研究、技術(shù)開發(fā)、產(chǎn)業(yè)應用、法律法規(guī)等方面加強系統(tǒng)性部署,以期在新一輪人工智能發(fā)展中獲取競爭優(yōu)勢。
在此背景下,各類用于評價人工智能的指標體系應運而生。人工智能評價指標體系是一種非常重要的洞察全球人工智能創(chuàng)新水平和發(fā)展趨勢的工具。它不僅能反映全球人工智能的創(chuàng)新發(fā)展現(xiàn)狀,還能洞察其發(fā)展趨勢,是全球人工智能創(chuàng)新發(fā)展的風向標。以往研究更多關(guān)注評價結(jié)果而很少關(guān)注評價體系,然而,人工智能評價指標體系具有非常高的情報價值,其評價體系往往隱含了發(fā)起國的國家意志和國家戰(zhàn)略。特定的人工智能指數(shù)往往服務于特定的決策目標,具有不同的立場,還會通過對各國人工智能的評價來塑造有利于本國的全球人工智能敘事。人工智能評價指標體系本身已超越單純的測量工具屬性,演變?yōu)榫哂懈叨葢?zhàn)略意涵和情報價值的復雜載體。如歐盟委員會聯(lián)合研究中心人工智能觀察指數(shù)2服務于其以人為本的人工智能戰(zhàn)略目標與價值觀,美國喬治敦大學新興技術(shù)觀測指數(shù)3更是將挑戰(zhàn)美國人工智能霸權(quán)的國家視為對標國家和監(jiān)測對象,隱含了其維持美國技術(shù)霸權(quán)及西方倫理觀的考量。在全球技術(shù)地緣競爭格局下,人工智能指數(shù)更是爭奪人工智能發(fā)展話語權(quán)、影響全球人工智能治理規(guī)則與標準制定的重要工具。自2016年以來,各類國際組織、智庫、高校及商業(yè)機構(gòu)相繼發(fā)布了眾多人工智能評價報告,其中不乏被國際社會和政府廣泛引用和采納的權(quán)威指數(shù),如美國斯坦福大學人工智能指數(shù)4已被多個國際組織和政府作為制定人工智能政策的重要依據(jù)。
當前學界對人工智能指數(shù)的應用和引用頗多,但鮮有研究將評價指標體系本身作為獨立的分析對象。基于此,本研究將指標體系作為一個整體的研究對象,聚焦于宏觀層面的評價體系構(gòu)建邏輯和戰(zhàn)略意圖闡釋。具體而言,首先基于國家創(chuàng)新理論提出全球人工智能評價指標體系的系統(tǒng)分類框架,系統(tǒng)分析各類評價的發(fā)展趨勢和核心特征,其次深入探討當前全球人工智能評價指標體系的發(fā)展趨勢,并揭示其作為地緣競爭與話語權(quán)博弈工具的深層價值,為理解全球人工智能評價指標體系提供更深層次的見解。在實踐層面,本研究為我國政策制定者提供了一幅全球人工智能評價的全景視圖,使其能超越排名表象,洞察不同評價體系背后的國家戰(zhàn)略與價值導向。同時,也為我國構(gòu)建自主的、具有國際影響力的人工智能評價體系、爭奪全球人工智能的治理話語權(quán)提供策略參考。
1人工智能評價指標體系分類
為系統(tǒng)地分析全球人工智能評價指標體系,本研究將為全球人工智能評價指標體系構(gòu)建一套科學的遴選標準和分類框架。
1.1研究對象的界定與選取
據(jù)不完全統(tǒng)計,目前全球針對人工智能的評價指標體系共有三十多種。為保證選取的指標體系足以構(gòu)成一個能夠反映全球人工智能評價的整體態(tài)勢和具有廣泛代表性的樣本集,能夠有效洞察當前全球人工智能評價的宏觀格局和主流范式。本研究根據(jù)以下四項原則進行遴選,人選的指標體系必須同時滿足以下四項原則:(1全球性原則,評價的范圍應覆蓋主要的人工智能國家或區(qū)域;(2)透明度原則,評價框架、方法論、數(shù)據(jù)來源及評價結(jié)果可以公開獲取;(3)權(quán)威性原則,評價發(fā)布的機構(gòu)應為具有國際影響力的機構(gòu);(4)影響力原則,評價結(jié)果應具有廣泛的國際影響力,被國際組織、主流媒體或?qū)W術(shù)界引用或采納。遵循上述原則,對全球現(xiàn)有的人工智能評價進行了系統(tǒng)性摸底與甄別,經(jīng)過篩選,最終確定了22個符合條件的人工智能評價作為本研究的核心研究對象(見表1)。
1.2人工智能評價指標體系分類框架
上述入選的22個人工智能評價指標體系的評價目標、核心理念與側(cè)重維度呈現(xiàn)出顯著的多樣性與異質(zhì)性,這本身即反映了人工智能技術(shù)發(fā)展的多面性及其與社會經(jīng)濟系統(tǒng)互動的復雜性。為此,亟須建立一個科學、統(tǒng)一的分類框架,將各類評價體系納入其中,以便進行更具系統(tǒng)性與深入性的比較分析。
為確保分類框架的科學性與系統(tǒng)性,本研究借鑒了創(chuàng)新研究領(lǐng)域的經(jīng)典理論一國家創(chuàng)新體系(National Innovation System,NIS)理論[5-6]。該理論將國家的創(chuàng)新活動視為一個由企業(yè)、大學和政府研究機構(gòu)等多元主體,在特定的制度、政策與文化環(huán)境中互動而形成的復雜網(wǎng)絡。已有研究將此理論框架應用于分析各國的人工智能發(fā)展戰(zhàn)略與生態(tài)系統(tǒng)[],將一個國家的人工智能創(chuàng)新與發(fā)展從整體上看作一個國家的人工智能創(chuàng)新體系[8]。體系中的創(chuàng)新主體及其互動主要驅(qū)動了研發(fā)能力和市場應用;支撐這些主體運行的宏觀環(huán)境,如基礎(chǔ)設(shè)施和產(chǎn)業(yè)結(jié)構(gòu),構(gòu)成了發(fā)展基礎(chǔ);而體系中的制度安排,即法律、法規(guī)與政策規(guī)范,則對應了倫理治理的維度。最后,整個國家創(chuàng)新體系的整體運行效率與綜合產(chǎn)出能力,正是國家綜合實力的體現(xiàn)。
基于此理論框架,本研究采用定性內(nèi)容分析法[9]對指標體系進行分類。通過系統(tǒng)研讀與編碼22個評價指標體系的官方報告與方法論文檔,提取其核心評價目標、主要評價對象與關(guān)鍵指標域,并將其與國家創(chuàng)新體系的各構(gòu)成部分進行映射匹配。最終,形成了涵蓋綜合實力型、發(fā)展基礎(chǔ)型、研發(fā)能力型、倫理治理型相印場應用型五T尖別的分尖框策(見圖1)。
(1)綜合實力型評價指標體系。該類評價體系的主要評價對象為國家人工智能的綜合性表現(xiàn)和實力,此類評價致力于對一國在人工智能領(lǐng)域的整體戰(zhàn)略態(tài)勢與綜合競爭力進行全景式評估,旨在標定該國在全球人工智能地緣格局中的相對位次,其評價結(jié)果主要表征了特定國家創(chuàng)新系統(tǒng)在人工智能領(lǐng)域的宏觀績效與系統(tǒng)性輸出能力。(2)發(fā)展基礎(chǔ)型評價指標體系。主要評價對象為與人工智能相關(guān)的基礎(chǔ)資源與賦能要素,此類評價的核心目標在于診斷一個國家有效吸納、部署及擴散人工智能技術(shù)所必需的先決條件與賦能環(huán)境。其考察重點主要關(guān)聯(lián)與人工智能相關(guān)的基礎(chǔ)設(shè)施層面、人力資本的稟賦與質(zhì)量,以及相關(guān)政策法規(guī)、制度安排等創(chuàng)新生態(tài)的支撐性構(gòu)件的成熟度和就緒度。(3)研發(fā)能力型評價指標體系。主要評價對象為人工智能的知識創(chuàng)造與技術(shù)研發(fā),此類評價高度聚焦于人工智能領(lǐng)域知識生產(chǎn)與前沿技術(shù)探索的核心活動。其評價內(nèi)容直接反映了國家的人工智能研發(fā)生態(tài)的內(nèi)在能力與效率,側(cè)重于評估創(chuàng)新價值鏈上游的關(guān)鍵要素。(4)倫理治理型評價指標體系。主要評價對象為人工智能的監(jiān)管和倫理,此類評價體系旨在引導、規(guī)范并約束人工智能發(fā)展的制度架構(gòu)與倫理準則的建設(shè)與實施狀況。其評價對象聚焦于人工智能規(guī)范性與制度性維度,深入考察國家在構(gòu)建負責任、可信賴、風險可控的人工智能發(fā)展范式方面的戰(zhàn)略承諾、政策工具選擇與治理能力建設(shè)。(5)市場應用型評價指標體系。主要評價對象為人工智能產(chǎn)業(yè)應用與市場生態(tài),此類評價的核心關(guān)切在于追蹤人工智能技術(shù)在市場環(huán)境中的商業(yè)化進程及其所產(chǎn)生的經(jīng)濟影響與價值,致力于衡量人工智能技術(shù)的經(jīng)濟價值實現(xiàn)程度、相關(guān)創(chuàng)業(yè)生態(tài)系統(tǒng)的活躍度,以及人工智能對宏觀經(jīng)濟活動與特定產(chǎn)業(yè)部門的實質(zhì)性滲透效應。
2全球人工智能評價指標體系發(fā)展現(xiàn)狀
基于前文構(gòu)建的分類框架,本章的核心目標是從宏觀視角出發(fā),深入考察當前全球人工智能評價
表1全球人工智能評價指標體系

圖1全球人工智能評價指標體系分類框架圖

指標體系在五個關(guān)鍵類別,即綜合實力、發(fā)展基礎(chǔ)、研發(fā)能力、倫理治理及市場應用中的發(fā)展現(xiàn)狀及其背后的戰(zhàn)略深意和構(gòu)建邏輯。
2.1綜合實力型評價指標體系
綜合實力型評價指標體系包括:英國烏龜智庫的全球人工智能指數(shù)、美國塔夫茨大學頂級人工智能國家指數(shù)[1]、美國斯坦福大學人工智能指數(shù)[4]、歐盟委員會聯(lián)合研究中心人工智能觀察指數(shù)2。這類評價指標體系的共性目標是提供一種宏觀視角,評估國家或區(qū)域在人工智能領(lǐng)域的整體績效、系統(tǒng)狀態(tài)或全球競爭力。對此類別評價進行對比分析(見表2)后發(fā)現(xiàn),這類評價往往通過整合國家創(chuàng)新系統(tǒng)在人工智能領(lǐng)域的多個維度信息,如研發(fā)投入與產(chǎn)出、人才儲備與流動、產(chǎn)業(yè)發(fā)展與投資、基礎(chǔ)設(shè)施建設(shè)、政府戰(zhàn)略與治理效能等,來量化評估一個國家或區(qū)域的整體人工智能競爭力、全球地位或發(fā)展態(tài)勢,回答“該國或區(qū)域的人工智能綜合實力如何\"的問題。
人工智能綜合實力本身是一個高度抽象的概念。可以看出,各綜合實力類人工智能評價對綜合實力的量化和評價并非單一模式。它們在評價視角、指標側(cè)重、方法論等方面展現(xiàn)出顯著差異,反映了對綜合實力這一復雜概念的不同理解和評價意圖。美國斯坦福大學人工智能指數(shù)在評價策略上獨樹一幟,其核心目標并非構(gòu)建一個單一的綜合實力得分或進行國家排名,而是致力于對全球人工智能發(fā)展的關(guān)鍵維度進行長期追蹤、數(shù)據(jù)匯集與趨勢呈現(xiàn)[2]。其量化綜合實力的方式體現(xiàn)在其廣泛地覆蓋和精細地刻畫上,從基礎(chǔ)研究、技術(shù)性能、經(jīng)濟影響到教育、倫理挑戰(zhàn)及政策響應等多個方面,搜集并展示大量的原始數(shù)據(jù)和標準化指標。通過多維度的、分解的數(shù)據(jù)指標來量化人工智能發(fā)展的不同側(cè)面,將綜合判斷的權(quán)力留給使用者。英國烏龜智庫的全球人工智能指數(shù)明確以國家人工智能綜合能力排名為導向,其評價核心在于構(gòu)建一個綜合性的指數(shù)得分[13]。其特點是采用了“投入-活動-實施\"的邏輯框架作為評價體系的構(gòu)建依據(jù),在此基礎(chǔ)之上選取涵蓋人才、基礎(chǔ)設(shè)施、研發(fā)投入、商業(yè)化活動、政府戰(zhàn)略實施等多個維度的具體指標,通過明確的加權(quán)方案聚合成最終得分,以此生成國家排名。這種量化方式的優(yōu)點在于直觀、易于比較,直接回應了“誰領(lǐng)先”的問題,滿足了快速對標的需求。然而,該指數(shù)在指標的選擇、權(quán)重的分配上缺少依據(jù)。歐盟人工智能觀察指數(shù)的量化策略具有強烈的政策驅(qū)動和價值導向特征。它并非追求一個中立的、普適性的綜合實力定義,而是圍繞歐盟自身的人工智能戰(zhàn)略目標和核心價值觀來選擇和組織指標,如以人為本、可信賴人工智能[14]。其量化特點在于監(jiān)測歐盟及其成員國在特定政策優(yōu)先領(lǐng)域的進展,并與全球主要競爭對手進行比較。這意味著它的綜合實力評估是嵌入在歐盟特定政策框架和價值體系之中的,關(guān)注點不僅在于實力的大小,更在于其發(fā)展方向是否符合歐盟的預期和規(guī)范。這種評價服務于歐盟內(nèi)部的政策制定、評估與調(diào)整,同時也對外傳遞歐盟的人工智能發(fā)展理念,帶有顯著的戰(zhàn)略評估色彩。美國塔夫茨大學頂級人工智能國家指數(shù)的評價特點在于其更側(cè)重于挖掘和評估支撐國家人工智能發(fā)展的深層次、結(jié)構(gòu)性要素。它著眼于學術(shù)視角,深人探討數(shù)字基礎(chǔ)設(shè)施的質(zhì)量、制度環(huán)境的優(yōu)劣、創(chuàng)新生態(tài)系統(tǒng)的活力以及人才技能基礎(chǔ)等基礎(chǔ)性驅(qū)動力對國家人工智能發(fā)展?jié)摿透偁幍匚坏挠绊憽R虼耍鼘C合實力的量化更像是一種基于結(jié)構(gòu)性因素的潛力診斷與歸因分析,強調(diào)理解“為什么強”以及未來發(fā)展的可持續(xù)性,而不僅僅是“當前有多強\"的快照式排名。
表2綜合實力類人工智能評價指數(shù)對比分析

通過對上述四種綜合實力型評價指標體系進行分析,發(fā)現(xiàn)綜合實力型評價指標體系相比其他類型的評價指標體系具有更強的國際影響力,它們不僅是綜合實力的測量工具,更是一種影響力工具。這四種綜合實力評價指數(shù)在發(fā)揮影響力方面各有側(cè)重。英國烏龜智庫的全球人工智能指數(shù)通過其鮮明的排名機制,直接強化了國家人工智能競賽的敘事,對公眾認知和短期政策行為產(chǎn)生顯著影響;美國斯坦福大學的人工智能指數(shù)憑借其全面的數(shù)據(jù)追蹤和趨勢分析,在全球范圍內(nèi)扮演著重要的議程設(shè)置角色,通過數(shù)據(jù)呈現(xiàn)塑造了關(guān)于重要人工智能進展的主流認知框架,被許多國際組織和機構(gòu)廣泛引用和采納;歐盟人工智能觀察指數(shù)則利用其政策監(jiān)測功能,不僅服務于內(nèi)部協(xié)調(diào),更致力于對外輸出歐盟的可信賴人工智能價值觀和治理模式,積極建構(gòu)一種將實力與規(guī)范相捆綁的人工智能發(fā)展話語,參與全球規(guī)則競爭。而美國塔夫茨大學指數(shù)則以其學術(shù)深度和對基礎(chǔ)驅(qū)動要素的關(guān)注,主要影響學界與政策研究圈,引導對人工智能實力來源和可持續(xù)性的深層思考,建構(gòu)了更側(cè)重人工智能發(fā)展內(nèi)在邏輯與潛力的實力話語權(quán)。
2.2發(fā)展基礎(chǔ)型評價指標體系
發(fā)展基礎(chǔ)型評價指標體系包括:牛津洞察的政府人工智能準備度指數(shù)[15、國際貨幣基金組織的人工智能準備度指數(shù)[1以及法國發(fā)展署的人工智能投資潛力指數(shù)[17]。這類評價的同性目標是評估國家或區(qū)域為有效吸納、部署并規(guī)模化應用人工智能技術(shù)所必需的先決條件、基礎(chǔ)資源與賦能環(huán)境。對其對比分析(見表3)后發(fā)現(xiàn),盡管這類評價名稱中包含了“準備度\"“潛力\"等關(guān)鍵字,但其本質(zhì)上是評估一個國家人工智能創(chuàng)新系統(tǒng)中的基礎(chǔ)資源與賦能要素。評價的維度一般涉及國家人才資本的儲備與質(zhì)量、人工智能特定基礎(chǔ)設(shè)施,尤其是算力、數(shù)據(jù)資源及其治理的建設(shè)水平與可及性,以及有利于創(chuàng)新的政府治理能力、監(jiān)管友好度、投資環(huán)境等維度。因此,發(fā)展基礎(chǔ)型評價指標體系重在提供一種前瞻性的診斷評價,評估一個國家或區(qū)域在多大程度上具備了承接人工智能技術(shù)并從中獲益的結(jié)構(gòu)性潛力或準備狀態(tài),回答“該國或區(qū)域是否為人工智能發(fā)展奠定了堅實基礎(chǔ)”問題。
表3發(fā)展基礎(chǔ)型評價指標體系指數(shù)對比分析

對政府人工智能準備度指數(shù)、人工智能準備度指數(shù)以及人工智能投資潛力指數(shù)進行深入分析可以發(fā)現(xiàn),它們都聚焦于評估國家發(fā)展人工智能的基礎(chǔ)條件與潛力,但在評價目標設(shè)定、核心指標側(cè)重以及具體方法論選擇上,展現(xiàn)出顯著的差異性,這深刻反映了評價的機構(gòu)屬性、核心使命以及獨特視角(見表3)。牛津洞察的政府人工智能準備度指數(shù)更像是一個面向政府自身的體檢報告,其核心目標在于評估各國中央政府在采納人工智能技術(shù),賦能公共服務和治理方面的政府機構(gòu)方面的就緒程度[18]。因此,它的指標體系高度聚焦于政府的戰(zhàn)略規(guī)劃能力、政府主導的數(shù)字基礎(chǔ)設(shè)施與數(shù)據(jù)治理水平、本土技術(shù)部門對政府的支持能力以及公務員和國民的數(shù)字素養(yǎng),并通過橫向比較為各國政府提供改進自身治理能力的參照基準。相比之下,國際貨市基金組織的人工智能準備度指數(shù)則是從國家宏觀經(jīng)濟與社會結(jié)構(gòu)視角出發(fā),評估一個國家在多大程度上具備了吸收人工智能所帶來的經(jīng)濟增長紅利并同時能有效緩沖其潛在負面沖擊(如勞動力市場結(jié)構(gòu)調(diào)整、社會不平等加劇等)的韌性[19]。這一評價目標與國際貨幣基金組織維護全球經(jīng)濟金融穩(wěn)定、促進包容性增長的核心職責緊密有關(guān)聯(lián)。因此,人工智能準備度指數(shù)的指標不僅涵蓋數(shù)字基礎(chǔ)設(shè)施和人力資本,更重點納入了勞動力市場政策的靈活性與保護性、社會保障體系的健全度以及相關(guān)法規(guī)倫理框架的完善性等反映國家宏觀適應能力的維度。而法國發(fā)展署的人工智能投資潛力指數(shù)則具有鮮明的發(fā)展議程和投資指引特點,其特別關(guān)注發(fā)展中國家和新興經(jīng)濟體[]。它的目標并非簡單衡量準備度,而是評估人工智能投資在特定國家促進可持續(xù)發(fā)展的潛力。其評價的創(chuàng)新之處在于,不僅考察基礎(chǔ)設(shè)施、技能、治理等基礎(chǔ)要素,還評估了人工智能技術(shù)與國家發(fā)展需求契合度。這種評價方法可以很好地識別人工智能投資最有可能產(chǎn)生顯著回報和具備可持續(xù)性發(fā)展的國家,從而為其發(fā)展資金的有效配置提供決策依據(jù)。
綜上所述,這三個指數(shù)雖然都可歸入發(fā)展基礎(chǔ)型評價指標體系的范疇,但它們分別從政府治理優(yōu)化(政府人工智能準備度指數(shù))宏觀經(jīng)濟適應(人工智能準備度指數(shù))和可持續(xù)發(fā)展投資回報(人工智能投資潛力指數(shù))的獨特角度切入,構(gòu)建了各自的評價邏輯和指標體系。這充分說明對國家人工智能發(fā)展基礎(chǔ)條件的評估并非單一視角,而是可以根據(jù)不同的評價目標進行多元化的評價,這些評價為研究者理解不同國家的人工智能發(fā)展基礎(chǔ)提供了互補的視角。同時,這類指數(shù)不僅是排名的工具,更是診斷性的框架,能幫助各國識別自身在人工智能準備和潛力方面的具體優(yōu)勢與短板。其中,政府人工智能準備度指數(shù)指導政府公共服務在采納和利用人工智能方面的內(nèi)部改革,人工智能準備度指數(shù)指導一國在人工智能影響下的宏觀經(jīng)濟政策調(diào)整,而人工智能投資潛力指數(shù)則指導國家在人工智能發(fā)展相關(guān)資源的戰(zhàn)略配置。
2.3研發(fā)能力型評價指標體系
研發(fā)能力型評價指標體系的共同之處是量化評估國家或區(qū)域在人工智能知識生產(chǎn)與前沿人工智能技術(shù)探索活動的實力與活力。此類評價的指數(shù)眾多且各有側(cè)重(見表4),該類別包括:關(guān)注頂尖人才流動的保爾森基金會全球人工智能人才追蹤器[20]、側(cè)重高影響力學者的清華大學AI2000全球人工智能學者排名[21]、評估機構(gòu)或國家科研產(chǎn)出的AIRank-ings[22]、評價大學人工智能研究水平的韓國軟件政策研究中心的人工智能研究指數(shù)23用于量化人工智能期刊影響力的Scimago人工智能期刊排名[24]、追蹤專利活動的世界知識產(chǎn)權(quán)組織《技術(shù)趨勢:人工智能報告》25以及結(jié)合美國技術(shù)安全視角監(jiān)測技術(shù)態(tài)勢的喬治敦大學的新興技術(shù)觀測站3。此類評價的核心關(guān)注點精準地映射國家人工智能創(chuàng)新的知識創(chuàng)造與技術(shù)研發(fā)。它們專注于測量該層面運行的關(guān)鍵要素與績效,具體涵蓋:創(chuàng)新投人,如頂尖科研人才的規(guī)模、質(zhì)量與流動,研發(fā)經(jīng)費投人強度、核心創(chuàng)新活動,如重大研究項目的布局、關(guān)鍵技術(shù)發(fā)明的進展,以及主要創(chuàng)新產(chǎn)出,如高水平學術(shù)論文的數(shù)量與影響力、人工智能相關(guān)專利的申請與授權(quán)、具有國際影響力的學者或研究機構(gòu)的涌現(xiàn)等。評價的對象包括人工智能科技研發(fā)活動本身及大學、研究機構(gòu)、學者、企業(yè)研發(fā)部門等關(guān)鍵參與者的表現(xiàn)與全球影響力。因此,研發(fā)能力型評價指標體系本質(zhì)上衡量的是一個國家人工智能知識生產(chǎn)與技術(shù)創(chuàng)新的核心能力與基礎(chǔ)潛力,試圖回答“該國或區(qū)域的人工智能研發(fā)實力究竟如何”的問題。
研發(fā)能力型評價指標體系雖然都聚焦于知識生產(chǎn)與技術(shù)創(chuàng)新活動,但其具體的評價側(cè)重點、數(shù)據(jù)來源和方法論選擇上呈現(xiàn)出顯著的差異。深入分析可以發(fā)現(xiàn),根據(jù)其核心關(guān)注點與主要數(shù)據(jù)來源,又可以將7個指標評價歸為三種類型:(1)面向人才資本的評價,此類評價的核心在于識別、量化和追蹤人工智能領(lǐng)域的頂尖人才。如保爾森基金會的全球人工智能人才追蹤器通過分析頂級人工智能會議的作者信息,側(cè)重于刻畫全球頂尖研究人才的地理分布、跨國流動路徑及其職業(yè)軌跡,旨在揭示全球人工智能人才競爭格局與智力資本的流向[26]。而清華大學AI2000全球人工智能學者排名則聚焦于識別過去十年中最具學術(shù)影響力的個體學者,主要依據(jù)其發(fā)表論文的被引次數(shù)來衡量其影響力[27]。這兩者雖都關(guān)注人才,但前者更側(cè)重于人才作為一種戰(zhàn)略資源的跨國流動,后者則更側(cè)重于基于學術(shù)產(chǎn)出的個體聲譽與貢獻。這種差異也反映了不同評價機構(gòu)對頂尖人才定義和價值的不同理解。(2)面向科研產(chǎn)出評價,此類評價主要依賴文獻計量學和科學計量學方法,通過量化分析學術(shù)出版物和引文數(shù)據(jù)來評估人工智能研究的產(chǎn)出和質(zhì)量。如AIRankings、人工智能研究指數(shù)以及Scimago人工智能期刊排名均屬此類。它們通常利用Scopus、WebofScience等大型文獻數(shù)據(jù)庫,統(tǒng)計國家、機構(gòu)或?qū)W者在人工智能相關(guān)領(lǐng)域的論文發(fā)表數(shù)量、被引頻次、高被引論文比例、期刊影響力等指標。AIRankings試圖同時衡量產(chǎn)出的數(shù)量與質(zhì)量,人工智能研究指數(shù)則側(cè)重于評估大學和研究機構(gòu)的整體研究能力[28],而Scimago人工智能期刊排名則關(guān)注人工智能期刊的表現(xiàn)。(3)面向技術(shù)創(chuàng)新與轉(zhuǎn)化評價,此類評價更關(guān)注從基礎(chǔ)研究到技術(shù)原型乃至潛在應用的轉(zhuǎn)化過程。如世界知識產(chǎn)權(quán)組織的《技術(shù)趨勢:人工智能報告》主要通過分析全球人工智能相關(guān)專利的申請和授權(quán)數(shù)據(jù)來追蹤技術(shù)創(chuàng)新的熱點領(lǐng)域和地理分布[29],將專利視為衡量技術(shù)研發(fā)產(chǎn)業(yè)化潛力的關(guān)鍵代理指標。而美國喬治敦大學的新興技術(shù)觀測站則采取更廣闊的視角,監(jiān)測包括人工智能在內(nèi)的一系列新興技術(shù)的整體發(fā)展態(tài)勢,并特別嵌入了國家安全與地緣政治的考量維度,其數(shù)據(jù)來源更為多樣。
2.4倫理治理型評價指標體系
倫理治理型評價指標體系包括全球負責任人工智能指數(shù)[30]、中國主導的全球人工智能安全指數(shù)[31]和全球人工智能治理評估指數(shù)[32],以及經(jīng)濟合作與發(fā)展組織(OECD)的人工智能政策觀測站[33]等。它們的共性目標是評估國家或區(qū)域針對人工智能技術(shù)研發(fā)和應用的治理能力和符合倫理的程度。這類評估涵蓋了從國家戰(zhàn)略、政策法規(guī)、倫理準則、技術(shù)標準到風險評估與管理機制、監(jiān)管機構(gòu)能力、多方參與和社會對話機制等一系列復雜的治理要素。倫理治理型評價指標體系本質(zhì)上就是聚焦于一個國家人工智能發(fā)展的規(guī)則體系構(gòu)建與風險管理能力,致力于評估其人工智能發(fā)展的負責任程度與安全性,回答“該國或區(qū)域如何有效治理人工智能\"的問題。
表4研發(fā)能力型評價指標體系對比分析

深入對比分析這四項代表性的倫理治理型評價指標體系,可以發(fā)現(xiàn)它們在評價側(cè)重點、視角及方法論上展現(xiàn)出顯著的差異性與互補性(見表5),深刻反映了全球人工智能治理本身的復雜性、多維性以及規(guī)范競爭的態(tài)勢:(1)全球負責任人工智能指數(shù)的顯著特點在于其強烈的規(guī)范性導向和對負責任原則實踐性落實的聚焦。它不僅關(guān)注公平、透明、問責等已被廣泛討論的人本價值,更突出強調(diào)了包容性與可持續(xù)性,并明確致力于將評價指標體系納入全球南方國家的聲音與視角。這使其評價超越了單純的技術(shù)或政策層面的評價,試圖構(gòu)建一個更具全球普遍性和發(fā)展關(guān)懷的負責任人工智能生態(tài)系統(tǒng)評估框架[34]。然而,其挑戰(zhàn)在于如何將這些宏大的原則有效地操作為可衡量、可比較的指標,并能夠真實反映各國復雜的實踐落地情況。(2)全球人工智能安全指數(shù)由中國的研究機構(gòu)主導發(fā)布,體現(xiàn)了對人工智能治理中一個更為具體但也極其關(guān)鍵的維度的深度聚焦,即國家層面的人工智能安全能力與準備度。它系統(tǒng)性地評估了從技術(shù)安全研究、安全開發(fā)部署的政策法規(guī)到風險評估、應急響應乃至前沿風險治理等多個環(huán)節(jié)。這種對安全的專門化、體系化評估,凸顯了中國對于人工智能潛在風險,尤其是技術(shù)層面和社會穩(wěn)定層面的高度關(guān)切。從地緣政治角度看,全球人工智能安全指數(shù)的推出也被看作是在關(guān)鍵的人工智能安全領(lǐng)域提出中國標準、中國方案,向國際社會倡導“AI向善\"的嘗試。(3)全球人工智能治理評估指數(shù)同樣由中國機構(gòu)主導,該指數(shù)側(cè)重于追求更宏觀、更全面評估國家整體人工智能治理框架成熟度。相較于全球人工智能安全指數(shù)對安全的側(cè)重,全球人工智能治理評估指數(shù)試圖涵蓋從國家戰(zhàn)略規(guī)劃、倫理準則推廣、監(jiān)管模式選擇、機構(gòu)能力建設(shè)到公眾參與和國際合作等幾乎所有治理要素。它的出現(xiàn),進一步表明各國意圖在全球人工智能治理領(lǐng)域提供一個一站式的綜合評估方案。(4)OECD人工智能政策觀測站與前三者不同,OECD觀測站并非一個提供國家排名或單一分數(shù)的指數(shù),其核心定位是一個動態(tài)的、權(quán)威的全球人工智能政策與數(shù)據(jù)信息中心。它的主要功能在于系統(tǒng)性地監(jiān)測、收集、分類和分析各國的人工智能戰(zhàn)略、政策工具及治理實踐,為成員國提供循證決策支持和政策學習平臺[35]。其特點在于信息的動態(tài)性、權(quán)威性和實用性,服務于特定國家集團內(nèi)部的政策協(xié)調(diào)與信息共享,體現(xiàn)了發(fā)達國家在人工智能治理領(lǐng)域的合作與規(guī)范趨同努力。
表5倫理治理型評價指標體系對比分析

綜上,倫理治理型評價指標體系已演變?yōu)橐粋€人工智能規(guī)范競爭場域,全球負責任人工智能指數(shù)力主一種包容性的人本主義范式,其核心在于將公平、問責等原則普世化,并通過突出全球南方國家視角,試圖重塑全球治理的話語權(quán)平衡。相比之下,由中國主導的全球人工智能安全指數(shù)與全球人工智能治理評估指數(shù)則代表了一種戰(zhàn)略性的國家主導評價范式。它們通過提供系統(tǒng)性的治理解決方案,不僅旨在應對國內(nèi)風險,更是在全球?qū)用娣e極輸出標準,力求在塑造未來人工智能國際規(guī)則中占據(jù)主動權(quán)。而OECD人工智能政策觀測站則代表了第三種邏輯,即發(fā)達經(jīng)濟體的技術(shù)官僚與合作主義范式。作為一個經(jīng)濟體內(nèi)部的政策協(xié)調(diào)與知識共享平臺,其核心目標是在理念相近的國家之間促進最佳實踐的交流、維護政策環(huán)境的一致性,并鞏固基于共同價值觀(如民主、人權(quán)、法治)的治理趨同。這是一種旨在強化內(nèi)部共識并以集體力量影響全球規(guī)范走向的策略。
2.5 市場應用型評價指標體系
市場應用型評價指標體系包括:全球創(chuàng)新生態(tài)報告[36]、STOXX全球人工智能指數(shù)[37]、iSTOXX全球人工智能大型100指數(shù)[38]、Nasdaq全球人工智能與大數(shù)據(jù)指數(shù)[39]。對比分析該類別指標體系(見表6)發(fā)現(xiàn),它們的共性之處是并不直接深入評估人工智能技術(shù)本身的先進性、算法的優(yōu)劣或研究的突破性,而是更側(cè)重于評估支撐人工智能商業(yè)化的外部環(huán)境或人工智能相關(guān)企業(yè)在市場中的財務和交易表現(xiàn)。在量化特點上,此類評價高度依賴人工智能市場數(shù)據(jù)、企業(yè)財務信息以及創(chuàng)業(yè)活動指標,在不同層面上反映人工智能技術(shù)商業(yè)化應用的動態(tài)過程以及市場主體對人工智能未來商業(yè)前景的認知和預期。市場應用型評價指標體系反映了國家人工智能創(chuàng)新的產(chǎn)業(yè)應用與市場生態(tài),目標是量化和評價人工智能技術(shù)轉(zhuǎn)化為經(jīng)濟價值的能力及其在市場中的實際影響。此類評價試圖回答“人工智能在市場上的表現(xiàn)如何”等關(guān)鍵問題,
四項市場應用型評價指標體系根據(jù)其各自服務的目標群體,又可以將其劃分為創(chuàng)業(yè)生態(tài)系統(tǒng)評估和金融市場指數(shù)。其中全球創(chuàng)新生態(tài)報告屬于創(chuàng)業(yè)生態(tài)系統(tǒng)評估,它服務于各國政府的政策制定者。而STOXX全球人工智能指數(shù)、iSTOXX全球人工智能大型100指數(shù)以及Nasdaq全球人工智能與大數(shù)據(jù)指數(shù)屬于金融市場指數(shù),它們共同服務于金融市場投資者。具體而言:(1)創(chuàng)業(yè)生態(tài)系統(tǒng)評估,對特定區(qū)域內(nèi)人工智能初創(chuàng)企業(yè)的數(shù)量、融資總額、成長速度、退出事件(IPO、并購)獨角獸企業(yè)數(shù)量以及人才、資本、市場觸達能力等環(huán)境要素進行評分[40]。其側(cè)重點在于診斷與評估全球特定城市或區(qū)域作為人工智能創(chuàng)新策源地的生態(tài)系統(tǒng)健康度與績效。在評價策略上,并非直接衡量人工智能技術(shù)本身或單個企業(yè),而是著眼于區(qū)域?qū)用娴暮暧^環(huán)境要素,如資本可得性、人才儲備、市場觸達能力、知識溢出效應以及創(chuàng)業(yè)產(chǎn)出效率等,從而識別和對標全球最具活力的人工智能初創(chuàng)企業(yè)孵化器和成長沃土,為政策制定者和生態(tài)建設(shè)者提供決策支持,其本質(zhì)是一種區(qū)域創(chuàng)新環(huán)境的競爭力評估。(2)金融市場指數(shù)的量化特點在于追蹤人工智能相關(guān)上市公司的股價表現(xiàn)、市值變化、營收增長、市盈率等財務和市場交易等數(shù)據(jù)。在方法上,通過設(shè)定標準(如人工智能業(yè)務營收占比、人工智能專利持有情況、特定行業(yè)歸屬等)篩選出人工智能成分股,將這些成分股的股價表現(xiàn),通常按市值加權(quán)匯總,構(gòu)建反映特定人工智能市場板塊整體表現(xiàn)的指數(shù)。這類指數(shù)的側(cè)重點聚焦于資本市場對人工智能商業(yè)價值的即時反映與追蹤。如STOXX全球人工智能指數(shù)旨在捕捉全球人工智能相關(guān)上市公司的整體表現(xiàn)[4],其變體iSTOXX全球人工智能大型100指數(shù)則進一步聚焦大型成熟的人工智能企業(yè)[42]。Nasdaq全球人工智能與大數(shù)據(jù)指數(shù)則關(guān)注人工智能和大數(shù)據(jù)這兩個緊密相關(guān)領(lǐng)域的綜合市場表現(xiàn)。它們的共同評價目的是為投資者提供決策工具、投資基準和交易的金融產(chǎn)品基礎(chǔ),引導資本流向其定義的人工智能相關(guān)資產(chǎn)類別。
市場應用型評價指標體系共同揭示了人工智能技術(shù)從創(chuàng)新潛力到市場價值的轉(zhuǎn)化全過程。一方面,以全球創(chuàng)新生態(tài)報告為代表的評價扮演了人工智能商業(yè)價值策源地的診斷者角色。它著眼于地理區(qū)域,通過評估人才、資本、網(wǎng)絡等創(chuàng)新要素的聚合效能,衡量一個生態(tài)系統(tǒng)孕育未來人工智能商業(yè)巨頭的生產(chǎn)能力與環(huán)境健康度。這是一種前瞻性指標,旨在識別未來具有潛力的人工智能企業(yè)的誕生地。
表6市場應用型評價指標體系對比分析

另一方面,以STOXX和Nasdaq發(fā)布的人工智能指數(shù)為代表的金融市場工具則充當了人工智能商業(yè)價值的晴雨表。它們通過追蹤那些已成功將人工智能商業(yè)化的上市公司的市場表現(xiàn),量化了資本市場對人工智能當前盈利能力與未來增長預期的即時定價。
3全球人工智能評價指標體系發(fā)展趨勢
人工智能評價作為一個快速成長的研究領(lǐng)域,伴隨著人工智能的持續(xù)創(chuàng)新及其應用的不斷深化,人工智能評價研究和評價實踐也在不斷演進。通過對當前全球范圍內(nèi)主流的人工智能評價指標體系的發(fā)展脈絡進行梳理和分析,可以觀察到全球的人工智能評價正呈現(xiàn)出幾個顯著的發(fā)展趨勢。
3.1評價范式從技術(shù)導向向系統(tǒng)性評估演進
全球人工智能評價指標體系的演進軌跡正在經(jīng)歷一個根本性的范式轉(zhuǎn)變,即評價范式正從早期狹隘的技術(shù)導向,向系統(tǒng)性評估演進。技術(shù)導向范式常聚焦于研發(fā)投人、頂尖人才規(guī)模、關(guān)鍵知識產(chǎn)權(quán)產(chǎn)出,如清華大學發(fā)布的AI2000全球人工智能學者排名所遴選的高影響力學者,或韓國軟件政策研究中心的人工智能研究指數(shù)對大學研究實力的排名等。然而,這種范式因其固有的視角局限,已難以捕捉人工智能作為一個復雜系統(tǒng)與外部環(huán)境相互作用的全貌。隨著人工智能滲透到經(jīng)濟、社會和國家安全領(lǐng)域,新的系統(tǒng)性評估范式應運而生,將人工智能視為一個嵌入在更宏大社會經(jīng)濟框架中的動態(tài)子系統(tǒng),致力于評估該子系統(tǒng)與外部各關(guān)鍵系統(tǒng)之間的接口、互動與反饋循環(huán)。如全球創(chuàng)新生態(tài)報告關(guān)注創(chuàng)業(yè)生態(tài)系統(tǒng)的資金、人才和市場連通性,體現(xiàn)了人工智能的經(jīng)濟系統(tǒng)和生態(tài)影響;STOXX全球人工智能指數(shù)和Nasdaq全球人工智能與大數(shù)據(jù)指數(shù)通過市場表現(xiàn)和財務數(shù)據(jù)評估人工智能相關(guān)企業(yè)的商業(yè)價值;政府人工智能準備度指數(shù)和人工智能準備度指數(shù)引入政策環(huán)境、基礎(chǔ)設(shè)施和數(shù)據(jù)治理等維度,反映人工智能實施的外部條件。這種從技術(shù)導向到系統(tǒng)性評估的演進,標志著人工智能評價不再滿足于簡單的數(shù)數(shù),而是轉(zhuǎn)向分析驅(qū)動發(fā)展的系統(tǒng)動態(tài),從而為政策制定者、投資者乃至整個社會提供了更真實、更全面的決策依據(jù)。
3.2評價話語權(quán)從英美主導向多極化主導演進
在全球地緣政治格局深刻演變與大國科技競爭日趨白熱化的宏觀態(tài)勢下,人工智能評價指數(shù)已然超越了其作為中立信息傳遞與客觀績效衡量的傳統(tǒng)角色定位。它們?nèi)找娉蔀榈鼐壵瘟α扛偧肌覒?zhàn)略意圖展示、全球人工智能領(lǐng)導權(quán)爭奪的重要工具。評價活動本身,在某種意義上,已內(nèi)化為一種關(guān)乎國家聲譽、議程設(shè)置與規(guī)范塑造的軟實力工具。早期人工智能評價指標體系主要是由美國和英國的機構(gòu)發(fā)起,如美國斯坦福大學大學發(fā)起的人工智能指數(shù),英國烏龜智庫發(fā)起的全球人工智能指數(shù)、英國牛津觀察智庫發(fā)布的政府人工智能就緒度指數(shù)等。伴隨著新興經(jīng)濟體在人工智能領(lǐng)域的崛起,這些國家和地區(qū)近年來開始通過構(gòu)建本土化的評價標準爭奪話語權(quán)。全球人工智能評價指標體系的話語權(quán)已突破傳統(tǒng)以英美為主導的格局,呈現(xiàn)出多中心化特征。典型代表包括中國推出的全球人工智能治理評估指數(shù)、韓國推出的人工智能研究指數(shù)、南非推出的全球負責任人工智能指數(shù)。其中,中國的全球人工智能安全指數(shù)直接對標西方的人工智能指數(shù),通過設(shè)置差異化的安全倫理指標,構(gòu)建具有東方價值觀的評價框架;歐盟則通過人工智能觀察指數(shù)強化歐盟的技術(shù)主權(quán),其最新版本將數(shù)據(jù)本地化合規(guī)度作為核心指標,反映數(shù)字主權(quán)競爭白熱化。
3.3評價目標從競爭排名向治理與可持續(xù)發(fā)展轉(zhuǎn)變
從評價目標的視角考察全球人工智能評價指數(shù)體系的演進,一個深刻且具有方向性的趨勢是評價的核心關(guān)切正在經(jīng)歷從早期更聚焦于量化國家間技術(shù)實力、產(chǎn)業(yè)規(guī)模和經(jīng)濟潛力的競爭優(yōu)勢排名,向著一個更加重視治理框架的健全性、倫理原則的遵循度、社會風險的可控性,并最終旨在引導人工智能發(fā)展路徑契合人類社會長期福祉與可持續(xù)發(fā)展目標的價值取向進行顯著的拓展與深化。不可否認,以國家為單位進行人工智能能力橫向比較,評估其在全球科技競技場中的相對位置,仍然是部分重要評價指數(shù)的核心功能。如英國烏龜智庫的全球人工智能指數(shù)報告中明確指出要展示當前領(lǐng)導全球人工智能競爭的國家以及原因;美國塔夫茨大學的頂級人工智能國家指數(shù)也致力于評估領(lǐng)先人工智能創(chuàng)新國家在競爭中所處的位置。這類指數(shù)回應了國家戰(zhàn)略決策中對了解自身相對實力與外部競爭態(tài)勢的現(xiàn)實需求,其存在具有持續(xù)的合理性。然而,更為顯著的趨勢是,近年來涌現(xiàn)出大量新興評價指數(shù),其設(shè)定目標明顯超越了單純的競爭邏輯,而將重心放在了人工智能治理與可持續(xù)發(fā)展上。專門針對人工智能治理能力、責任原則落實、安全保障水平的指數(shù)不斷推出,如全球負責任人工智能指數(shù)、全球人工智能安全指數(shù)、全球人工智能治理評估指數(shù)。這標志著人工智能評價機構(gòu)的評價目標正在改變,評價焦點從“跑得多快”向“跑得是否穩(wěn)、是否好\"轉(zhuǎn)變。這些指數(shù)的核心目標并非判定誰是冠軍,而是評估各國為確保人工智能技術(shù)健康、有序、負責任發(fā)展所構(gòu)建的制度框架、監(jiān)管能力與倫理自覺程度。這類指數(shù)對負責任人工智能、人工智能安全、人工智能倫理、人工智能向善的強調(diào),本質(zhì)上與聯(lián)合國可持續(xù)發(fā)展目標所倡導的包容性增長、社會公平、環(huán)境保護、和平正義等核心理念高度契合。確保人工智能技術(shù)的發(fā)展不加劇社會不平等、不損害基本人權(quán)、不威脅環(huán)境與安全,這正是實現(xiàn)可持續(xù)發(fā)展的內(nèi)在要求。
3.4評價時效性從靜態(tài)量化向動態(tài)持續(xù)性監(jiān)測演進
人工智能評價指標體系在其演進過程中,不僅在評價的廣度(維度擴展)與深度(方法革新)上發(fā)生著變化,其時間維度的運作模式也正經(jīng)歷一場深刻的革命性轉(zhuǎn)型。具體表現(xiàn)為,傳統(tǒng)的以固定周期(常為年度)發(fā)布、提供領(lǐng)域發(fā)展靜態(tài)快照的量化評估模式,正日益為一種強調(diào)動態(tài)性、連續(xù)性與近乎實時性的持續(xù)監(jiān)測與評估范式所補充。這標志著人工智能評價正從提供歷史總結(jié)向賦予即時洞察與前瞻預警的方向演進,以期在時效性上更好地匹配人工智能技術(shù)與產(chǎn)業(yè)自身的高速迭代特性。傳統(tǒng)周期性評價指數(shù),如許多發(fā)布年度國家排名的指數(shù),盡管為政策回顧、戰(zhàn)略制定和橫向比較提供了重要的基準信息,但其固有的信息滯后性在面對人工智能這一日新月異的領(lǐng)域時,其局限性愈發(fā)明顯。依賴靜態(tài)的、回顧性的評估結(jié)果進行決策,無異于看后視鏡開車,難以有效應對快速變化的環(huán)境,把握稍縱即逝的機遇窗口,或及時干預潛在的負面發(fā)展。動態(tài)持續(xù)性監(jiān)測這一趨勢在當前的評價實踐中已有多重體現(xiàn),若干重要的評價主體,特別是國際組織與政府關(guān)聯(lián)機構(gòu),開始建立觀測站或監(jiān)測平臺。如歐盟的人工智能觀察指數(shù)與OECD的人工智能政策觀測站即典型代表。它們的設(shè)立目標中明確包含了監(jiān)測與跟蹤的定位,力求提供持續(xù)更新的數(shù)據(jù)、政策動態(tài)與分析報告,而非僅僅依賴年度出版物。評價的重心不僅在于某一時間點的狀態(tài),更在于狀態(tài)的變化與方向趨勢。如保爾森基金會的全球人工智能人才追蹤器聚焦于人才的跨國流動。在特定領(lǐng)域,評價的動態(tài)性要求極高。金融服務機構(gòu)發(fā)布的人工智能相關(guān)市場指數(shù)如STOXX人工智能指數(shù)、Nasdaq全球大數(shù)據(jù)與人工智能指數(shù),本質(zhì)上提供了對人工智能概念板塊市場情緒與經(jīng)濟表現(xiàn)的實時的連續(xù)評估。
4結(jié)語
本研究為科技評價提供了新的研究思路,超越了學界對科技評價指標體系的常規(guī)認知,揭示了全球人工智能評價指數(shù)并非單純的開源信息集合,而應被視為由特定機構(gòu)發(fā)布、服務于其國家戰(zhàn)略的高水平情報產(chǎn)品。這些情報產(chǎn)品是各國在全球人工智能競爭中,進行議程設(shè)置、爭奪話語權(quán)、塑造國際規(guī)范,乃至在認知域施加影響的關(guān)鍵工具。本研究為科技情報研究者提供了一套針對人工智能戰(zhàn)略性情報產(chǎn)品的分析框架。該框架以國家創(chuàng)新體系理論為基石,通過五維分類框架,使情報分析人員能夠系統(tǒng)性地識別和剖析不同人工智能評價體系背后隱含的價值取向、戰(zhàn)略意圖與競爭邏輯。在方法論上,為科技情報的實踐和元情報分析(即對情報產(chǎn)品本身的研究)提供了新的工具與視角。在面向人工智能的科技競爭情報工作實踐中,不僅展示了如何“知彼”,即深度洞察并預判競爭對手的人工智能戰(zhàn)略焦點與布局;更重要的是,它為如何“知己\"并最終實現(xiàn)塑造對手認知與國際環(huán)境指明了方向。通過理解現(xiàn)有人工智能評價體系的構(gòu)建邏輯與局限,使我國能夠更有針對性地設(shè)計出既符合自身發(fā)展階段又能有效傳遞我方主張的全球性人工智能評價體系,從而在全球人工智能治理的激烈競爭中掌握主動權(quán)和話語權(quán)。
參考文獻:
[1]DwivediYK,HughsL,magilaE,etal.AtificialIntellgence(A):Multidisciplinaryperspectivesoemerginghaenges, opportunities,andagendaforresearch,practiceandpolicy[J].International journalof informationmanagement,202,57: 101994.
[2]EUROPEAN COMMISSION.AI Watch Index 2021[R/OL].[2025-07-30].https:/ai-watch.ec.europa.eu/data/ai-watch-index-2021_en.
[3]CENTER FOR SECURITY AND EMERGING TECHNOLOGY.CSET | Center for Security and Emerging Technology [EB/ OL].[2025-07-30].htps://cset.georgetown.edu.
[4]STANFORD UNIVERSITY HUMAN-CENTERED ALAI Index[EB/OL].[2025-07-30].htps://hai.stanford.edu/ai-index.
[5]FreemanC.TheNatioalSystemofInnovation’instoricalperspectiveJ].CambridgeJouralofeconomics,99,19(1):5-24.
[6]LundvallBA.NationalsystemsofinnovationtowardsathoryofinnovationandinteractivelarningM].PinterLondon,1992.
[7]ArcesatiR,Chang W,HmaidiA,etal.AIEntanglements:BalancingRisksandRewardsofEuropean-ChineseCollboration[J]. Berlin,Germany:Mercator Instititute for China Studies,2023.
[8]KazimE,AlmeidaD,KingsanN,etalIovationandopporunity:reviewof teUK’snationalAstrategyJ]Disortiicial Intelligence,2021,1(1):14.
[9]HsiehHF,anoSE.Treeapproaches toqualitativecontentanalysisJ]Qualitativehalthresearch,5(9): 1288.
[10]TORTOISE MEDIA.The Global AI Index[EB/OL].[2025-07-30].https://www.tortoisemedia.com/data/global-ai.
[1]DIGITALPLANET.The Emerging Geographyof AI[EB/OL].2025-07-30].htps:/digitalplanet.tufts.edu/the-emerginggeography-of-ai/.
[12] STANFORD HAI.The 2025 AI Index Report[R/OL].[2025-07-30].https://ai.stanford.edu/ai-index.
[13]TORTOISE.TheGlobalArtificial Intellgence Index MethodologyReport[R/OL].2025-07-30]htps://ww.tortosemedia. com/intelligence/global-ai-index/.
[14]EUJOINTRESEARCHCENTRE.AI Watch Index 2021[R/OL].[2025-07-30].htps:/ai-watch.ec.europa.eu/data/ai-watchindex-2021_en.
[15]OXFORD INSIGHTS.Government AIReadiness Index 2024[R/OL].[2025-07-30].htps://xfordinsights.com/ai-readiness/ ai-readiness-index/.
[16]INTERNATIONAL MONETARYFUND.AI Investment Potential Index[EB/OL].2025-07-30].https://ww.imf.org/external/ datamapper/AI_PI@AIPI/ADVEC/EME/LIC.
[17]ADDOPM,TAIEBA,LANDREINL,etal.AIInvestmentPotential Index 2025[R/OL].2025-07-30].htps:/wwfd.fr/en/ ressources/ai-investment-potential-index-2025.
[18]STIRLING R,PASQUARELLI W,SHEARER E.An Asessment Framework for Measuring Government AI Readiness [R/ OL].[2025-07-30].htps:/oxfordinsights.com/wp-content/uploads/2023/10/Shared_-Readiness-Framework-Online-Version.pdf.
[19]INTERNATIONAL MONETARYFUND.AI PreparednessIndex Note[R/OL].[2025-07-30].htps://ww.imf.org/external/ datamapper/AIPINote.pdf.
[20]THE GLOBAL AI TALENT TRACKER 2.0[EB/OL].[2025-07-30].htps:/archivemacropolo.org/interactive/digital-projects/the-global-ai-talent-tracker/.
[21]AI2000全球人工智能學者排名[EB/OL].[2025-07-30].htps://www.aminer.cn/ranks/home.
[22] AIRANKINGS.ORG[EB/OL].[2025-07-30].https:/airankings.org.
[23]LEES.AIResearch Index:WhatisthebestAIuniversityinthe world?R/OL].2025-07-30].htps:/www.spr.kr/posts/view/ 23215?code=issue_reports.
[24]JOURNAL RANKINGS ON ARTIFICIAL INTELLIGENCE[EB/OL].[2025-07-30].htps://ww.scimagojr.com/journalrank. php?category=1702.
[25]WIPO.WIPOTechnologyTrends2019-Artificial IntellgenceR/OL].[2025-07-30].htps://ww.wipo.int/publicatios/en/ details.jsp?id=4386.
[26]METHODOLOGY FOR GLOBAL AITALENT TRACKER 2.0[EB/OL].[2025-07-30].htps:/archivemacropolo.org/interactive/digital-projects/the-global-ai-talent-tracker/methodology-for-global-ai-talent-tracker-2/.
[27]AI2000 的介紹[EB/OL].[2025-07-30].htps://www.aminer.cn/ai2000/about/introduction.
[28]AIRankings FAQ[EB/OL].[2025-07-30].htps://airankings.org/faq/.
[29]DATA COLLECTION METHOD AND CLUSTERING SCHEME BACKGROUND PAPER[ R/OL].[2025-07-30].htps:/ www.wipo.int/export/sites/www/tech_trends/en/docs/techtrends_ai_methodology.pdf.
[30]GLOBAL CENTER ON AI GOVERNANCE.The Global Index on Responsible AI[R/OL].2025-07-30].htps:/www.globalindex.ai
[31]遠期人工智能研究中心,中國科學院自動化研究所人工智能倫理與治理研究中心,北京前瞻人工智能安全與治理研 究院,等.全球人工智能安全指數(shù)[R/OL].[2025-07-30].htps://ww.agile-index.ai/global-index-for-ai-safety.
[32]遠期人工智能研究中心,中國科學院自動化研究所人工智能倫理與治理研究中心,北京前瞻人工智能安全與治理研 究院,等.AGILE全球人工智能治理評估指數(shù)報告 2025[R/OL].[2025-07-30].htps://ww.agile-index.ai/publications/ 2025.
[33]OECD.AI:THE OECD ARTIFICIAL INTELLIGENCE POLICY OBSERVATORY[EB/OL].[2025-07-30].htps:/oecd.ai/en/.
[34]GLOBAL CENTER ON AI GOVERNANCE.Methodology and Conceptual Framework of the Global Index on Responsible AI[R/OL].[2025-07-30].https://www.global-index.ai/methodology.
[35]ABOUT OECD.AI[EB/OL].[2025-07-30].htps://oecd.ai/en/about/about-oecd-ai.
[36]STARTUPGENOME.Global Startup Ecosystem Report 2025[R/OL].2025-07-30].htps:/tartupgenome.com/report/gser2025/introduction.
[37] STOXX
AI GLOBAL ARTIFICIAL INTELLIGENCE INDEX[EB/OL].[2025-07-30].htps:/stoxx.com/index/stxaiv/.
[38]ISTOXX
AI GLOBAL ARTIFICIAL INTELLIGENCE LARGE 100[EB/OL].[2025-07-30].https://stoxx.com/index/ixagal1p/.
[39]NASDAQ GLOBAL AI AND BIG DATA INDEX[EB/OL].[2025-07-30].htps://ndexes.nasdaqomx.com/Index/Overview/ NYGBIG.
[40]GLOBAL STARTUP ECOSYSTEM REPORT METHODOLOGY[EB/OL].[2025-07-30].htps:/startupgenome.com/report/ gser2025/methodology.
[41] STOXX
INDEX METHODOLOGY GUIDE[R/OL].[2025-07-30].https://ww.stoxx.com/document/Indices/Common/Indexguide/stoxx_index_guide.pdf.
[42]ISTOXX
INDEX GUIDE[R/OL].[2025-07-30].htps://www.stoxx.com/document/Indices/Common/Indexguide/istoxx_index_guide.
作者簡介:羅立群,男,揚州大學商學院教授;李廣建,男,教授,博士生導師。