□文/ 蘇 竣 清華大學公共管理學院 黃 萃 浙江大學公共管理學院
伴隨人工智能社會實驗工作在全國的快速推進,學術界也圍繞人工智能社會實驗的基礎理論與方法創新進行了深入研究,梳理了社會實驗的基礎理論、方法體系、數理分析模型、經典案例,形成了學術專著《社會實驗理論與方法評介》。
本文針對杭州建設國家新一代人工智能創新發展試驗區,開展人工智能社會實驗工作的現實需求,通過提煉該專著中的精彩觀點與論述,對人工智能社會實驗的基礎理論與方法進行系統介紹。
人類社會智能化轉型的新態勢,各個領域涌現出的新問題、新挑戰,急劇增長的新知識,給國家治理體系和治理能力現代化建設提出了新的要求。如何更加科學、準確地把握人工智能等新技術的社會影響,加強人工智能等新技術發展的潛在風險研判和防范,建立健全保障人工智能健康發展的法律法規、制度體系、倫理道德,維護人民利益和國家安全,促進智能社會治理的現代化,是當前社會各界亟須解決的關鍵問題。
在這場人工智能掀起的人類社會巨變中,用科學的方法來研究和應對科學技術帶來的種種風險和問題尤為重要。解決人工智能應用與發展的問題,不但要關注技術本身,更需要關注技術的社會影響,需要做長期、長線的觀察研究,深度理解人類社會轉型的過程機理。
混合實驗設計是前述兩種實驗設計的結合,同時考慮了是否受到干預和干預前后的影響。混合設計關注的核心點是實驗組改變量和對照組改變量的大小關系。不難看出,混合設計結合了被試內和被試間設計的優勢,因而具有最高水平的信度和效度,是理想情況下研究者的首選。其主要缺陷是,嚴格的實驗分組設計將推動實驗成本的進一步提升,可能造成實驗難度的加大。
在國家的高度重視下,經過兩年多的努力,社會各界積極克服新冠肺炎疫情與國際形勢變化的影響,通過統籌規劃、頂層設計、重點發展、示范推動,人工智能社會實驗的學術研究、組織建設、隊伍建設、人才培養、基地建設等已經在全國有序展開、穩步起飛,實現了公共政策研究“理論研究—政策建議—政治決策—行政執行—組織實施—科學反饋”的全循環。
人工智能社會實驗是實驗研究方法在新時代的創新。實驗主要有兩方面的作用:一是發現以往未知或未加解釋的事實;二是判斷社會現象間或變量間的因果關系,檢驗為某一理論所提出的假設。
一項完整的人工智能社會實驗研究一般由三個階段組成:

圖1 被試內實驗設計
科學測量。研究者隨機選取特定人工智能技術應用場景下的組織和個人作為實驗組,同時選取未被該人工智能技術影響的組織和個人作為對照組,通過文獻梳理和理論對話,以及對相關研究場景的扎根研究,將人工智能可能引致的社會影響,如組織和個人運轉模式、行為軌跡、社會網絡、心理動態等泛意性概念,轉變為經濟收入、出行方式、機構調整、公眾滿意度、技術接受度等可測量的數據指標,依據科學、規范的社會科學測量手段,綜合利用觀察記錄、問卷調查、大數據捕捉與社會計算等方法,進行數據收集和處理,采用回歸、匹配等統計方法確立影響機制和模式,厘定各種影響因子,揭示背后的作用機制。
被試間實驗設計通過將全體研究分為實驗組和對照組,研究者主要測量實驗后實驗組和對照組的水平差異。本質上,被試內和被試間設計的關注點互為一枚硬幣的兩個方面,因此其優勢與劣勢也恰好完全互補。相比較而言,被試間設計可以避免外在環境因素以及多次干預間(如果有)的相互干擾,但整體上對于樣本數量和分組的要求更高。

圖2 被試間實驗設計
近年來從“扶貧”到“共享”的政策目標切換在生存照顧之外向社會救助權注入了平等促進、自立發展兩種新的價值,政策目標的變化也導致法律體系中對社會救助權塑造的憲法基點的變遷,即不同于西方社會救助權以生存權為基點的情形,具有本土色彩的社會救助權應當建立在《憲法》規定的物質幫助權、平等權和人格尊嚴三個基點之上。

圖3 混合實驗設計
社會實驗是最接近真實社會情境的實驗性研究方法。它是以現實情境下的人、組織、社會環境等方面作為研究對象,以某種社會經濟、政治或技術要素變化為干預條件,在理論層面構建出近似于實驗室實驗的場景,通過對研究對象的前后比較和實驗組與對照組的橫向對比,分析、推斷干預條件在真實世界產生的影響。從研究內容上,社會實驗旨在于對現實世界所發生的事件之間的聯系給出科學的檢驗;從研究方法上,社會實驗的主要特征是利用實驗的操作技巧(如隨機化被試、控制相關變量),來評估干預事件的處理效應或者說變量之間的因果效應。社會實驗的核心在于將“控制-對照-比較”的實驗效應的測量邏輯引入到現實世界,運用科學的實驗方法去檢驗真實世界中(或者說自然發生的環境下),而不是在實驗室里發生的擾動對人們行為決策的因果影響,發掘因果推論,獲取基于現實情境的經驗知識。它可以為理論研究提供有力的實證依據,并指導和解決實際問題,兼具“理論建構”與“實踐應用”的雙重屬性。
在人工智能技術廣泛應用推動社會轉型的背景下,利用社會實驗深入研究人工智能的社會影響,是有效防范人工智能等變革性新興技術社會風險、超前研判智能化時代社會發展新態勢的重要途徑。
人工智能社會實驗的核心價值是以人為本、人民利益至上。它關注和研究的不是技術應用本身,而是以大數據、云計算、人工智能等為代表的技術在應用過程中,對個人、組織和社會產生的影響。對受眾真實感受和體驗的忽視是很多創新實踐失敗的根源。將新技術廣泛應用在生產生活、政府治理的實踐當中,只是人工智能社會實驗得以開展的前提條件。還需要利用科學的實驗設計,對技術應用給公眾的心理與行為、組織的使命與結構、社會的制度與政策等要素帶來的變化和影響進行系統測量與評估,并將結論及時反饋給一線。只有完成了這一系列任務,才能實現人工智能社會實驗的研究閉環。
為了實現發現事實和解釋因果的功能,實驗法的核心是嚴格遵循“控制-對照-比較”的實驗效應測量邏輯。根據實驗組與對照組劃分以及實驗效應的測量邏輯,實驗研究可以分為被試內實驗設計(within-subject design)、被試間實驗設計(between-subjects design)和混合實驗設計(mixed design)等三類。圖1、2、3 分別展示了3種設計的基本邏輯。
組織應用。政府和市場聯動,構建人工智能應用示范區,推動人工智能技術在某些領域、區域、行業形成應用,如城市大腦、鄉村智治、智能教育、智能醫療、智慧環保等。這些應用場景不僅改變了社會的治理結構和運行機制,而且對參與者的行為軌跡、社會網絡、心理動態等產生了影響,進而影響社會個體的價值觀和世界觀。
人工智能技術應用正在從微觀層面技術與人的雙向互動和認知變化、中觀層面行業與組織的形態變革和流程再造、宏觀層面制度變遷和政策回應等多個層次產生豐富而深刻的影響。我們可以構建一個基于場景生態的人工智能社會影響整合分析框架,該框架涵蓋研究人工智能社會影響在微觀、中觀、宏觀三個層次需要關注的研究對象與應用場景,所形成影響的具體表征以及相應的觀測界面、數據來源和采集指標,如圖4所示。
三是基于數據仿真模擬的計算實驗。基于數據仿真模擬的計算實驗需要在利用已有智能應用開展的自然實驗和人為創設干預條件開展的實地實驗都已經具備完善的規模體系的背景下,通過對不同地區、不同領域開展相關實驗形成的標準化數據進行匯交整合,構建系統全面的人工智能社會實驗數據平臺,并在此數據平臺基礎上,借助薈萃分析、數據仿真、政策模擬等方法工具,綜合利用不同實驗形成的大樣本真實數據和多元化因果推論。這是人工智能社會實驗的高級形態,目的在于使人工智能社會實驗擺脫地域、領域等時間空間限制,形成系統、真實、科學的總體性研究結論,全面反饋和服務于治國理政,促進技術發展路徑優化,推動國家治理體系和治理能力現代化。
社會實驗方法具體可以分為自然實驗、實地實驗、計算實驗三大類型,不同方法類型對于實驗干預條件產生形式的要求各不相同。根據組織應用階段智能技術引入方式的差異,可以將人工智能社會實驗研究劃分為三種形態。

一是利用已有智能應用的自然實驗。在人工智能社會實驗開展的早期階段,可以首先利用當前已經部署使用的智能技術應用作為實驗干預條件。將受相關智能技術應用影響、已經發生一定社會變革的場景作為實驗組,同時選擇與該場景其他條件類似但未受智能技術應用影響、未發生社會變革的鄰近場景作為對照組。對實驗組的前后測數據以及對照組的前后測數據進行橫向和縱向雙重比較,判定相關智能技術應用的社會影響。這種形態的人工智能社會實驗特別適用于此類地區:智能技術應用基礎條件較好,但實施者對于社會實驗的知識相對缺乏,需要通過一定時期的實踐探索積累經驗,以尋找最適宜的實施路徑。
少數民族基礎數學教育對民族教育有著極為重要的影響。空間幾何、代數以及函數等都是數學學習中比較抽象的內容,少數民族學生在學習這些內容時,往往感到力不從心[4]。這就會導致少數民族學生對數學的學習逐漸失去興趣,最后直接放棄。而在基礎教育階段學生數學成績差,就會導致學生在初中、高中階段的理科學習變得困難,最終會導致少數民族學生發展不平衡,而這有違民族教育的教育目標。因此,發展民族教育首先需要提升少數民族基礎數學教育的質量。
綜合反饋。研究者綜合技術發展可能性、社會個體的接受程度、經濟文化環境等因素,形成技術標準、技術規范、政策建議等,反饋給技術研發者和政府實踐應用部門,保障相關治理措施的跟進,以降低人工智能技術發展過程中的不適應性,促進人工智能技術良性發展,提升治理體系和治理能力現代化。
被試內實驗設計不考慮全體受試樣本的分組問題,而直接比較實驗前后總體在核心變量上的水平差異。被試內數據的測量相對簡便,準確性較高,但更容易受到混淆變量的干預。例如,經過整個實驗期,天氣可能發生很大的變化,影響潛在的實驗結果。另一個典型案例是,對于某些經濟類指標,實驗前后的宏觀經濟環境也可能存在很大的差異,這些因素都會影響潛在實驗結果。此外,如果涉及到多次被試內設計,可能出現練習效應(隨著時間的推移,受試者越發了解了實驗環境)、疲勞效應(隨著時間的推移,受試者越發對實驗產生厭煩)等。

圖4 人工智能社會實驗整合分析框架
2.署名及排序由作者在投稿時確定,投稿后一般不得改動。通訊作者非第一作者時,須注明通訊作者;不注明者,默認第一作者為通訊作者。有多個作者而非同一單位的,單位表述必須清楚、準確,中英文表述均應使用官方名稱。
在具備了新技術應用的前提條件后,開展人工智能社會實驗的第一步,是選定明確的干擾變量。由于不同地區、不同領域、不同場景的現實條件存在差異,給受眾造成影響的關鍵干擾變量也可能不同。干擾變量的選擇可以是應用于實踐的新技術本身,也可以是建立在某種新技術上的新舉措、新模式、新政策等。只有干擾變量明確了,才能根據干擾變量的具體特點,設計出科學的實驗實施方案,開展人工智能社會實驗研究。
社會實驗研究的一個難點是保障樣本的隨機分組,使樣本被分配到實驗組和對照組的概率一致。在人工智能社會實驗中,這一問題仍舊突出。因此,在組織應用階段引入相關新技術、選定干擾變量時,就需要構建和維護一個高質量的抽樣框,盡可能保證抽樣框內所有樣本受到特定人工智能社會應用影響的概率是一致的,從而增強社會實驗的內外部效度與信度。
“控制-對照-比較”的實驗效應檢驗邏輯是人工智能社會實驗開展循證研究的前提和基礎,因此,在選定需要研究的人工智能社會實驗干擾變量和樣本框后,就要對受到該干擾變量影響的個人和組織,以及未受到該干擾變量影響的個人和組織進行區分,在滿足平行假設的基礎上,確立實驗組和對照組,使實驗組和對照組在其他變量上盡可能接近,而是否受到待檢驗干擾變量的影響成為實驗組和對照組之間的關鍵差異。
由于人工智能本身具有高度不確定性和較大倫理風險,新引入的干擾變量對社會公眾產生的影響可能長期持續并且無法有效調控。因此,開展人工智能社會實驗需要特別重視倫理問題。研究者要嚴格謹慎地遵循尊重、不傷害、有利、公正等基本科研原則,加強對實驗流程、實驗對象選擇、實驗數據采集等各個環節的倫理審查。充分尊重受試者的自主性,確保受試者的知情同意權、數據信息隱私權得到有效保護,盡可能降低受試者需要承擔的風險和傷害,維護研究的程序公正、回報公正、分配公正,強化對弱勢群體的保障機制,防止引發新的不平等現象。
人工智能社會實驗是對技術變革、治理創新與社會轉型的綜合性檢驗,具有長周期、跨領域、多學科的特征,涉及的研究對象涵蓋不同類型的個人和組織,需要采集的數據種類繁多,結構復雜。因此,在數據采集過程中,要特別注重數據的標準化和完備性,為實現不同區域、不同行業人工智能社會實驗數據的交流共享提供便利,使人工智能社會實驗成為一項系統性科學研究工程,也為后人開展研究留下可供參考和利用的資料。
本文系浙江省科技廳中央引導地方科技發展資金項目“百城百園-杭州市國家新一代人工智能創新發展試驗區建設”(編號2021ZY1004)課題成果。■
