薛 霄 于湘凝 周德雨 ,2 彭 超 王 曉 周長兵 王飛躍
隨著互聯網的普及、物聯網的滲透、大數據的涌現以及社會媒體的崛起,復雜系統越來越多地呈現出社會、物理、信息相融合的特征.這類社會復雜系統[1-2]因為涉及到了人和社會的因素,其設計、分析、管理、控制和綜合等問題正面臨前所未有的挑戰.為了應對上述挑戰,研究者們需要實現兩個目標: 規律描述與理論解釋.規律用以理解系統復雜性 “如何”產生;理論用以回答系統復雜性 “為何”會發生.但是,社會系統的復雜性,以及人類認知的有限性,都導致傳統的機理建模方法難以發揮作用.鑒于此,研究者們就考慮將實驗方法引入到社會復雜系統的研究中.
但是,人們很快發現,社會系統的實物實驗很難實施,其原因歸結如下: 1)在方法層面.社會復雜系統不能用還原法進行分解,因為分解后的系統在本質上已經不具有原系統的功能和作用了,必須采用整體論的方法進行研究[3].2)在經濟方面.如果直接在真實社會系統中進行實驗,其成本往往過于高昂,時間周期也非常漫長,從而導致實驗者難以承擔.3)在法律方面.許多社會復雜系統涉及國家安全、軍事戰備、應急事件等問題,受立法保護,以致無法對研究的系統進行實驗,也無法重建這些實驗系統.4)在道德方面.社會復雜系統往往有大量人員的參與,對這些系統進行實驗,有可能沖擊人的正常生活,甚至危害人的生命和財產,以至于在道德上無法接受這類實驗[4].
基于此,許多社會復雜系統的研究只能求助于計算機仿真環境中的 “反事實實驗”,即在假設條件下對社會復雜系統的發展趨勢進行推演分析[5].計算實驗方法的思路如圖1 所示,該方法以現實中的客觀世界為參照系統,從微觀尺度出發,構建出具有自治特性的個體模型與交互規則,在信息世界中培育出現實系統的 “計算實驗室[6]” (人工社會構建);接著,通過修改系統所遵循的規則、參數和外部所施加的干預,可以在這個實驗室中進行各種假設實驗(計算實驗執行);基于實驗結果,可以尋找干預策略與系統涌現之間的因果關系,為解釋、理解、引導和調控現實中的宏觀現象提供了一種新的工具和手段(解釋、預測和優化).

圖1 計算實驗的示意圖Fig.1 Schematic diagram of computational experiment
計算實驗的本質,就是將 “反事實”算法化,以數據驅動、涌現機制和多重世界的解釋與引導理論為基礎,為量化分析復雜系統提供一種數字化和計算化方法[7-8].與實物實驗相比,計算實驗具有以下特點: 1)精確可控.通過設置環境參數(如地理因素、人員分布等),以及觸發事件(如時間、位置、類型、規模等),可以準確再現各種場景作為系統的運行環境.2)操作簡單.在系統推演過程中,很容易通過各種極端實驗來評估系統的不同性能指標,如正確率、響應率等.3)可重復性.這一優勢使得研究者可以設計不同的實驗場景,分別評估不同因素(如地理環境、觸發事件特征等)對系統性能的影響[9].
經過十余年的發展,計算實驗方法已經成為分析復雜系統的主流方法之一,成功應用于一些風險較大、成本較高或者現實中無法直接進行實驗的系統研究,包括智能交通系統[10-11]、戰爭模擬系統[12]、社會網絡系統[13]、生態環境系統[14]、生理/病理系統[15-16]、政治生態系統[17]等.但是,其發展也面臨著一系列挑戰,包括計算模型的比較與驗證、計算實驗的設計方法、知識驅動與數據驅動的融合等.對這些問題的深入研究,將會為計算實驗更為廣泛的跨學科應用,奠定堅實的理論基礎.另外,隨著強化學習、數字孿生、元宇宙等新技術的涌現,計算實驗也需要不斷與新技術加強融合,進一步提升計算實驗分析解決問題的應用價值.
本文結構如下: 第1 節主要介紹計算實驗方法的概念起源與應用特點,以及本文的研究動機;第2 節詳細闡述了計算實驗的方法框架,包含人工社會建模、實驗系統構建、實驗設計、實驗分析與實驗驗證5 個環節;第3 節給出了三類計算實驗的典型案例,包括現象解釋、趨勢預測和策略優化;第4 節探討了計算實驗方法面臨的挑戰和未來的發展趨勢;第5 節對全文進行了總結.
計算實驗是一個標準的交叉學科研究領域,其發展歷史與復雜系統的研究,以及計算機仿真技術的發展密不可分.本節主要介紹計算實驗方法的概念起源、應用特征以及本文的研究動機.
隨著科學研究的深入,人們所關注的研究對象的規模越來越龐大,功能和結構日趨復雜,涵蓋了自然現象、工程、經濟、管理、軍事、政治和社會等諸多領域[18].從方法和路徑上看,計算實驗具有連接計算機領域、應用工程、人文學科、社會科學和經濟研究的可能性.研究者們從計算機學科的立場出發,把研究范圍擴展到了社會領域,并以 “問題導向”為出發點,與其他領域的專家合作研究了許多有趣而新穎的課題.如圖2 所示,復雜系統的研究(系統建模) 與計算機模擬技術的發展(仿真建模).兩條主線互相交織,最終形成了計算實驗方法的來源.

圖2 計算實驗的概念來源Fig.2 Conceptual sources of computational experiments
復雜性科學的研究可以用于指導社會復雜系統的建模,其最早起源于20 世紀初.奧地利生物學家Bertalanffy[19]首次提出了 “復雜性”的概念,其思想來源包括英國生物學家Darwin 的進化論和奧地利物理學家Boltzmann 的統計物理學.隨后,復雜系統的研究體系逐步成熟,先后經歷了三個較為明顯的階段: 1) 1950~ 1980 年.這個階段的核心在于系統科學,其代表性工作包括老三論(系統論[20]、控制論[21]、信息論[22])與新三論(散耗結構論[23]、災突變論[24]、協同學[25]).這一階段構建起了系統科學的概念和基礎方法論,并提出了復雜性科學的思想.2)1980~ 2000 年.這個階段的關注點在于系統的動態性與適應性,代表性工作包括自組織理論(混沌理論[3,26]、分形理論[27]、臨界理論[28])與復雜自適應系統理論[29].這一階段提出了復雜性研究的計算機模擬方法,并提出了人工社會理論.3) 2000 年至今.這個階段開始強調與數據科學理論的結合,代表性工作包括復雜網絡[30-31]與社會物理信息系統[1-2].由此,復雜性研究邁入了新時代.
伴隨著復雜系統研究的快速發展,用于仿真建模的計算機模擬技術也得到了長足的進步.計算機模擬技術的發展使得在信息空間中映射真實系統成為可能.傳統的計算機仿真認為實際系統是唯一存在,并將仿真結果與實際系統是否一致作為檢驗實驗結果的唯一標準.而計算實驗則在此基礎上更進一步,把計算機作為 “人工實驗室”來 “培育”實際系統中可能出現的宏觀現象,探究背后的規律,這為分析復雜系統行為和評估各種干預效果提供了一種可行方式.計算模擬技術的代表性成果如下:
1)元胞自動機.20 世紀50 年代,Neumann[32]提出了元胞自動機的概念,希望為復雜系統的模擬提供通用型的框架.元胞自動機模型強調對自主個體間的相互作用進行建模,更關心微觀個體的簡單行為在宏觀層次上的涌現屬性.該模型理論簡單,關注點主要局限于微觀個體.
2)人工生命.1970 年,Conway[33]編寫了 “生命游戲”程序,開啟了人工生命研究的序幕.隨后,Langton[34]提出了人工生命理論,旨在用計算機等人工媒介構造出具有自然生命系統行為特征的模型系統.朗頓在 “混沌邊緣”概念的基礎上,與其他學者一起建立了各種人工生命演化模型,如自繁殖元胞自動機[35]、鳥群模型[36]、蟻群模型[37]和 “阿米巴世界”[38]等.相較于元胞自動機,人工生命理論規則復雜,但依舊只關注個體行為.
3)多Agent 技術.多Agent 仿真技術興起于20 世紀90 年代中期,是研究復雜系統的重要手段.Agent 指具有一定的自治性、智能性和適應性的個體.應用比較廣泛的多Agent 仿真工具包括Swarm[39]、Repast[40]、Ascape[41]和Netlogo[42].這些工具各有優劣,需要根據需求來進行選擇.多Agent 技術關注個體之間的交互,研究如何從個體層面上升到群體層面.
4)人工社會.1991 年,Carl 等[43]第一次提出“人工社會”這一概念,即利用Agent 技術在計算機中構建社會實驗室,對不同的政策進行試驗評估,以確保政策的有效性.1995 年,Nigel[44]編輯出版了Rosaria Conte: Artificial Societies,The Computer Simulation of Social Life一書,人工社會被正式提出并成為一個相對獨立的社會科學領域.1998 年,英國薩里大學主辦的國際學術期刊The Journal of Artificial Societies and Social Simulation開始發行,標志著 “人工社會 -基于Agent的社會學仿真”這個領域的成熟.一批經典的人工社會模型相繼涌現出來,包括Epstein 等[45]的糖域模型、Arthur 等[46]的人工股市模型、Basu 等[47]的ASPEN 模型等.人工社會的研究從抽象群體擴展到了具體的社會系統.
5)數字孿生.1994 年,Wang[48]提出 “影子系統”,指由自然的現實系統和對應的一個或多個虛擬或理想的人工系統所組成的共同系統.2019 年,密歇根大學的Grieves[49]正式發表了有關數字孿生的論文,希望在計算機虛擬空間中構建出與物理實體完全等價的數字孿生體,強調建立虛實雙向動態反饋機制.在工業領域,數字孿生被用于物理系統和制造過程的監測、診斷、預測和優化.作為特定城市的虛擬副本,數字孿生技術允許城市運營商開發不同的策略,來優化城市的可持續發展[50].數字孿生強調虛擬世界與真實世界的完全映射,但較少涉及社會模擬.
隨著復雜性科學與計算機模擬技術的飛速發展,Wang[51]在2004 年正式提出了 “計算實驗”的概念,并形成了 “人工系統+計算實驗+平行執行”方法,強調人工系統與實際系統之間的循環反饋優化關系[52-53].近些年,隨著軟件定義[54]、數字孿生[6]、強化學習[55]和服務生態[56]等技術的興起,計算實驗方法的內涵也正在變得日益豐富[8].作為聯系虛擬世界與現實世界的橋梁,計算實驗正在為解決復雜系統的設計、分析、管理、控制和綜合等問題提供新的且更加有效的計算理論和手段.
計算實驗方法基于分布式思想,采用自底向上的方法,利用分散的微觀智能模型來模擬真實世界中各類實體的微觀行為,再通過設計這些個體間的相互作用形成復雜的現象,從而反映整個系統在宏觀層面的演化規律.通過精心設計的計算模型與模擬仿真環境,計算實驗可作為系統復雜性推理、實驗以及最終理解的強大工具.相比于傳統分析方法,計算實驗方法通過改變內外部因素的組合方式,可以建立各種各樣的實驗環境(包括現實場景和從未發生過的虛擬場景).對不同因素在系統演化中的作用進行全面、準確、及時、量化的分析評估,甚至可以對系統演化進行各種壓力實驗以及極限實驗.這使得研究者更容易探索復雜系統的運行規律并找到有效的干預措施.
計算實驗方法采用復雜系統研究的 “多重世界”觀點,即對復雜系統進行建模時,不再以逼近某一實際系統的程度作為唯一標準,而將模型認為是一種 “現實”,是實際系統的一種可能替代形式和另一種可能的實現方式.實際系統只是可能出現的現實中的一種,其行為與模型的行為 “不同”但卻 “等價”.表1 將實物實驗、田野實驗、計算機仿真和計算實驗的特征進行了對比.簡單來講,計算實驗不僅是實際系統的數字化 “仿真”,也是實際系統的可替代版本(或其他可能情形).可以為實際系統的設計、分析、管理、控制和綜合,提供高效、可靠、適用的科學決策和指導.

表1 計算實驗與相關概念的區別Table 1 Differences between computational experiments and similar concepts
計算實驗的應用領域廣泛,所體現出的價值也大相徑庭.例如,高度現實的模型可能有重大的決策支持價值,但需要針對特定領域定制,缺乏通用性,可能具有較少的理論價值;反之,高度抽象的模型可能提供深刻的科學見解,但就政策貢獻而言,卻無法提供可以直接應用的結果.根據計算模型的抽象程度,計算實驗的相關應用可以歸納為以下4 類:
1)高度抽象
模型僅與參照系統有少數定性相似之處,并沒有試圖復制任何量化特征.這些模型主要用于基礎科學的理論分析,而非運營策略分析.早期的一些社會仿真模型屬于這一類型,例如熱蟲模型[57]、鳥群模型[36]等.
2)適度抽象
模型能夠顯示令人信服的定性特征且符合某些定量標準.雖然這些模型仍主要是理論性的,但是可以提供某些適用性的見解,對政策產生有價值的影響.比如經典的謝林隔離模型[58],雖然相當抽象,卻揭示了關于社會隔離模式的重要見解,并為決策者提供了幫助.
3)適度現實
模型雖然屬于定性范疇,但是在重要特征方面均符合定量特征,以實驗為基礎的社會計算研究對這類模型最感興趣.例如,現實社會環境中,由于公共安全方面的考量,無法進行一些具有破壞性的社會實驗.通過計算實驗,改變實驗條件、設置不同的變量取值,可以無風險地模擬出許多壓力實驗,甚至進行極限實驗.
4)高度現實
實驗輸出和經驗數據之間的定量和定性特征最為符合.高度現實仿真可以從多個維度與參照系統進行比照,包括空間特征、時間特征或組織模式等.此類模型在商業和政府組織中應用極為豐富.公共政策涉及到社會網絡和人的行為這些高度不確定性的領域,導致其分析、制定和實施都伴隨著復雜性.把人工社會當作實際系統的替代版本,可以預先利用計算實驗方法分析政策(例如經濟刺激方案、法律法規頒布等)實施后的效果,從而提升公共政策制定的科學化水平.
隨著研究者對于計算實驗方法的日益關注,它與社會領域的眾多學科交叉融合,已經逐漸成為諸多領域的重要工具,例如計算經濟學[13]、計算金融學[59]、計算組織學[60]、計算流行病學[61]、計算社會學[62]等.2009 年2 月,哈佛大學、麻省理工學院等世界一流大學的15 位頂尖學者在Science上聯名發表了論文 “計算社會科學時代的到來”[63].2020 年,這些學者在Science上再次聯名發表論文,強調了計算社會科學在發展過程中所面臨的問題和挑戰[64].
但是,計算實驗作為多學科交叉的一個研究領域(集成了計算機科學、社會科學、系統科學、人工智能、計算機仿真等諸多學科).盡管科研人員付出了很多努力,目前還沒有形成一套完整而成熟的理論體系,其理論發展和實際應用之間還存在著巨大的差距.為了能夠對本領域的發展有所幫助,本文梳理了計算實驗方法的來龍去脈,希望幫助讀者構建起計算實驗方法的完整知識體系,從而為后續的方法應用奠定堅實的基礎.本文所關注的內容主要包括三個方面:
1) 計算實驗方法的技術框架是什么?
計算實驗方法作為一個多學科的交叉領域,涉及的領域知識非常多,并且還在不斷增長之中.初學者剛開始接觸計算實驗的時候,很容易淹沒在浩如煙海的文獻中,難以理清計算實驗方法與各類技術之間的關系,而層出不窮的新技術與新應用更加劇了這種困境.由此引發的問題就是,能否形成一個統一的、通用的方法框架,用于指導現有模型的應用或者新模型的開發,從而大幅降低使用者的上手難度.基于此,第2 節對紛繁蕪雜的文獻資料剝繭抽絲,形成了通用的計算實驗方法框架,并對方法的各個步驟進行了系統化闡述.
2) 計算實驗方法如何實現特定應用?
由于應用領域的多樣性和不確定性,加上人工社會的構建具有較大的主觀性,對于所構建的實驗系統是否能夠代表原系統,在學術界始終存在著不同意見.高置信度是計算實驗方法得以發揮作用的基礎,除了在實驗設計和模型驗證技術方面取得突破,還需要對于成功的應用案例進行分析,吸收有價值的經驗.只有這樣,計算實驗方法才會日趨完善,與其他方法取長補短,成為理解復雜系統運行規律的有力工具.基于此,第3 節對典型的計算實驗案例進行了梳理,按照現象解釋、趨勢預測和策略優化三個層面進行了分類,有助于掌握不同應用的特點.
3) 計算實驗方法的發展趨勢是什么?
計算模型是計算實驗方法的核心,也是不同領域知識發揮作用的容器.近些年,各類新技術層出不窮,例如數字孿生[6]、生成式對抗網絡[65]、強化學習[55]等,這些技術對于計算模型的構建都造成了相當大的影響.基于此,如何利用各類新涌現出來的人工智能技術來提升計算模型設計,就成為計算實驗方法持續發展所要面臨的關鍵挑戰.基于此,第4 節主要關注三個方面: a)如何利用大數據定義人工社會,即描述智能;b)如何利用計算實驗預測未來,即預測智能;c)如何實現對現實世界的反饋干預,即引導智能.
根據文獻[8],計算實驗方法的研究框架可以總結為圖3 所示,包含人工社會建模、實驗系統構建、計算實驗設計、計算實驗分析、計算實驗驗證5 個步驟,并形成了一個反饋閉環.因為多Agent 技術是計算實驗方法中所使用的主流技術,所以本節將以此為模板對每個步驟進行詳細闡述.

圖3 計算實驗方法的技術框架Fig.3 Technical framework for computational experiment methods
人工社會是一種在計算機中模擬人類社會的建模方法[66].相比于一般的仿真模型,人工社會模型所描述的系統更加復雜,不僅個體行為存在著不確定性,而且個體之間還具有復雜的交互行為.在明確人工社會應具有的結構、要素和屬性后,需要將所研究的復雜系統映射為信息空間中的多Agent系統,重點關注個體模型、環境模型、規則模型.個體模型是描述Agent 個體的自適應行為機制;環境模型是描述Agent 個體的社會屬性;規則模型是對系統演化機制的描述.具體細節如下:
1)個體模型
人工社會中的Agent 是具有一定自主能力的個體,與現實社會的生物個體或者生物群體相對應.Agent 個體模型是不同領域知識發揮作用的容器,可以根據特定應用進行定制化,包括Agent 的結構、是否具有學習能力、交互機制等.人工社會中的個體Agent 可以采用同質型的結構,也可以采用異質型結構.如圖4 所示,Agent 個體的典型結構由感知、決策、行為和優化4 個部分構成[67].

圖4 Agent 的結構模型Fig.4 Structural model of individual Agent
Agent 結構中的信息控制流將各個部分聯系成了一個整體.式(1)給出了Agent 結構的形式化表達式,由一組與時間t相關的屬性來描述.
式中,R表示Agent 不隨時間變化的特征,如標識.St表示Agent 隨時間變化的特征,例如Agent 的角色.Et是Agent 感知到的、對其狀態及行為可產生刺激作用的外在事件的集合.Yt是Agent 在感受外在事件刺激以及與其他Agent 進行交互過程中所采取的決策機制.Vt是Agent 的行為集合,包括Agent 自發采取的以及受外在事件刺激采取的所有行為.N是Agent 所受的約束條件,包括環境、其他Agent 以及任務目標對該Agent 的限制.
在人工社會中,Agent 個體并不是毫無意識和缺乏能動性,其學習過程是系統演化的重要動力機制.Agent 在運行過程中,會通過與環境交互不斷獲得解決問題的經驗,從而更新自身的規則庫,進而對自身的決策機制產生影響.按照個體意識(或者理性) 的強弱,可以將個體的學習模型歸納為三類: a)進化學習.強調Agent 的行為來自于父母遺傳.b)強化學習.指Agent 通過與環境的不斷交互學習.c)模仿學習.指Agent 模仿鄰居行為更新自身.三者的共性是出于個體的角度改變規則,從而提高對外部環境的適應程度.
2)環境模型
在人工社會中,環境模型就是實際物理環境在計算機中的映射,是Agent 賴以存在的活動場所.按照建模方式,環境模型可以分為實體型建模和網格型建模.實體型建模是指將真實社會中諸如建筑物、道路交通、氣候條件之類的各種環境要素都抽象成實體模型.目前,很多典型的人工社會系統都以這種方式實現,如EpiSimS[68]等.網格型建模則并不關注具體的環境對象,而是將聚焦點落在對環境空間的建模上,利用離散的網格來描述空間的存在和環境的屬性,例如糖域模型[45].
由于人工社會場景規模大小不同,環境場景要素的模型粒度不盡相同.對于大場景的人工社會,環境模型的粒度相對較粗,通常采用網格型模型,例如交通網絡;對于小場景的人工社會,環境模型的粒度相對較細,通常采用實體型模型,例如自然環境、建筑物和道路的細致模型.對于規模較大的人工社會場景,通常使用地理信息系統來建立地理空間模型.對于小規模的人工社會場景可采用二維或三維顯示技術建立可視化場景,同時采用網格技術建立地理空間的坐標體系,以確定地理空間的相對位置(如圖5 所示).

圖5 環境模型的抽象層次Fig.5 The abstraction level of environment model
由于實際條件的限制,環境模型的初始設置往往只能統計特征數據.因此,需要研究人工社會初始化數據的生成算法,包括Agent 統計特征(總數、性別比例、年齡分布等)、Agent 地理分布情況、人口社會關系屬性、環境實體的統計特征(總數、類型、可容納的人口數等)、環境實體的地理分布情況等.從群體數據的統計特征恢復重構出群體中每個個體的具體特征是環境建模的基本思路.通??梢愿鶕嫉暮暧^統計數據和樣本數據,運用迭代比例擬合方法生成個體級的微觀數據,或者根據具體情景,執行特殊的人工人口生成算法,并且需要將生成結果與真實數據進行對比統計分析和邏輯正確性分析.這個過程中,需要滿足兩方面的一致性: a)保證生成的Agent 數量與真實世界在統計特征上保持一致[69];b)保證生成的Agent 內部邏輯結構、關聯關系與真實世界一致.
3)規則模型
規則模型描述了人工社會的循環機制,包括Agent 之間、環境之間、Agent 與環境之間 “行事處世”的準則.這些規則既可以是真實社會規則的映射,也可以是人為假設的假想規則.如圖6 所示,人工社會采用自底向上的規則框架 -社會演化模型(Social learning evolution,SLE)從三個層次制定出人工社會的演化秩序: 底層是個體演化空間,用于模擬個體在社會系統中經歷遺傳進化的現象;中間層是組織演化空間,模擬個體通過模仿和觀察學習提高自身能力;頂層是社會演化空間,用于模擬文化推動的社會系統加速演進現象,從底層汲取優秀知識所建立的社會文化,可以指導底層個體的演化[56].

圖6 社會演化模型建??蚣蹻ig.6 SLE modeling framework
因為考慮到各層級間演化機制的相互嵌套和互為因果,這種分析框架也具有復雜系統理論的特征.SLE 的三個層次及其互動構成了人工社會演化過程較為完整且又抽象的環狀分析結構.每一層次分別關注社會經濟系統中的不同層面(例如個體、組織、集群和國家等).相關的建模技術可以根據特定的需求進行選擇.SLE 的具體實現邏輯如算法1 所示.
算法1.SLE 的實現邏輯
Agent: 用于代表人工社會系統中的個體.
1)個體演化: 變異是多樣性的生成機制,也是社會系統演化的源動力.如果沒有變異和創新,就無所謂演化.在模型框架中,Agent 個體的演化規則可以根據各類進化算法進行設定.有些是模仿生物系統的進化功能而被設計出來的,例如人工神經網絡[70]、遺傳算法[71]、進化策略[72]等.
2)組織演化: 選擇機制則是多樣性減弱的機制,通過某種標準來判斷個體的適應性,選擇適應性高的演化單元,淘汰適應性低的演化單元.在模型框架中,組織的演化規則可以根據生物群落的演化特征進行設定.例如螞蟻種群優化算法[37]、粒子群算法[73]、人工蜂群算法[74]等.
3)社會涌現: 組織演化側重選擇適應性高的演化單元,而社會涌現階段側重于其他個體對于精英的模仿學習.在激烈的競爭之后,一些精英會從個體中脫穎而出.其他個體通過模仿學習他們的行為,可以提高自己在生態系統中的生存能力,這個階段就是社會演化階段.存在三種典型的擴散模型: 傳染病模型[75]、社會閾值模型[76]和社會學習模型[77].
4)二階涌現: 二階涌現體現在社會空間對個體空間的反作用,這是宏觀現象對微觀個體產生作用的機制.為了模擬文化可以加速個體進化速度這一現象,本文在模型框架中設計了反饋規則,通過干預策略的選擇機制不僅影響某個具體個體的變異水平,還會影響整個系統的變異水平.
5)下一個循環: 隨著時間的推移,一些精英可能會落后,一些能力較強的新個體將成為新的精英.最后,整個社會系統的演化均衡被打破,進入下一輪循環.
計算實驗系統的架構大都是基于人工社會模型,采用自底向上的方法來模擬整個社會復雜系統.首先需要真實模擬出各類智能體實體的微觀行為,再通過這些個體間的相互作用來反映整個系統的宏觀規律,實現由簡單元素互相作用而形成的復雜現象.計算實驗系統構建的重心在于如何設計數據主線來集成各個模型,為建立人工社會集成數據,從而尋找最合適的干預策略.
1)系統模塊
計算實驗系統的開發主要采用兩種方法: a)自己編程,目的是獲得更大的建模自由度;b)采用特定平臺,目的是獲得更高的開發效率.目前,人工社會模型開發尚處于初級階段,開發效率的重要性高于建模自由度.研究者通常選擇一種開發平臺自動生成一些框架代碼,然后手工編寫特定功能的代碼,從而減小編程工作量.如果平臺是可信的,那么自動生成的代碼也是可信的.目前,利用平臺開發人工社會模型已成為主流趨勢,包括Swarm[39]、Repast[40,77]、Mason[17]和Netlogo[42]等.
如圖7 所示,人工社會的體系結構可以劃分為預處理、計劃執行和輸出3 個模塊.系統根據預處理階段收集的Agent 狀態值,虛擬環境提供的外部狀態值和外部指令數據,選擇知識庫中的知識規則和模型庫中的模型,計算并執行各類Agent 在仿真環境中的行為,并將計算結果輸出到行為選擇器,設置Agent 下一時刻的子目標.行為選擇完成后,在行為選擇結果和外部環境檢測數據的基礎上,利用知識庫中Agent 行為經驗學習規則進行Agent行為復合配置,并可以通過反饋對行為選擇參數進行修正.最后,更新Agent 的內部狀態值,并將行為狀態信息傳遞給仿真模塊中構建的虛擬環境,利用知識庫中環境更新規則實現虛擬環境的動態更新,并進入下一個時刻的循環計算.

圖7 計算實驗系統的運行流程圖Fig.7 The operation flow chart of the computational experimental system
2)數字主線
計算實驗系統的構建是一個復雜的多階段、多因素、多模型的過程.從時序角度出發,計算實驗系統運行過程包括概念模型、數學邏輯模型和仿真模型等階段,其間有相互的依賴和約束關系.在概念層,人工社會建模是將現實系統的知識進行組織和編碼,使計算實驗系統能接受并處理現實世界的數據輸入.邏輯層的模型與概念層密切相關,該層的模型主要建立了狀態變量之間的關系.在連續系統中,這種關系通常是偏微分方程或常微分方程.對于復雜系統這些方程難以得到解析,所以需要轉換成可數值計算的模型.在仿真層,通過完成上層模型(邏輯層) 到底層模型(數值計算模型) 的轉換工作,可以認為計算實驗系統具有了對概念模型、邏輯模型進行計算的能力.
基于此,本文將工業互聯網中 “數字總線”[78]的概念引入計算實驗方法,用以描述從模型設計到運行的全生命周期過程,提供關鍵要素的虛擬表示(數字孿生) 和相互之間的關聯關系.如圖8 所示,數字主線可以被看作連接不同模型的橋梁,其目標在于展示出實驗周期中系統的演變歷史和特別的狀態轉換.這可以在正確的時間以正確的方式對實驗現象進行向前或前后追溯,從而可以協助策略評估研究、變更影響分析、缺陷回溯分析等問題.

圖8 計算實驗的數字主線Fig.8 Digital thread for computational experiments
3)干預機制
計算實驗的運行過程其實就是個體之間以及個體與環境之間博弈演化的過程,是內部因素和外部因素共同作用的結果.外部環境因素是客觀的、不可控的,主要包括初始條件以及外部環境.內部因素是可控的、可調整的,主要包括個體之間的組織形式、協作策略和協調機制等.如果沒有外部因素的干預,實驗系統將會進行自然演化,可以用來分析初始設置與內部機制在系統演化中的作用.如果對實驗系統施加外部干預,則可以用來對干預措施進行推演和優化.為了促使實驗系統向預期方向演化,有必要對其實施有限度的、合理的干預.
如圖9 所示,通過將干預策略和人工社會(包括所有直接和間接承受干預影響的多類主體) 連接形成閉環,并變換外部輸入和人工社會模型的初始設定,來對干預策略的效果進行測試.

圖9 計算實驗的干預機制Fig.9 Intervention mechanism of computational experiments
根據干預尺度,干預策略可以分為3 類: a)將干預策略加載到人工社會的Agent 模型中,在仿真的過程中可能會對個體的特征、行為規則造成影響.在無人駕駛的測試實驗中,往往采用真實控制器和虛擬被控對象聯調,就屬于此類干預[79-80].b)將干預策略加載到人工社會的組織模型中,在仿真的過程中可能會對群體的交互方式、學習規則造成影響.c)將干預策略加載到人工社會的社會模型中,在仿真的過程中可能會對社會的傳播方式、均衡狀態造成影響.人工社會經過反應,輸出干預實施可能引致的結果,干預制定者將其目標和偏好與輸出結果進行比對,可以就干預的可行性做出判斷.這樣經過不斷地試錯、迭代和完善,最終就如何干預達成共識.
隨著研究對象的復雜度增加,影響因子的組合數量會呈指數級增長,并且變量之間還可能會產生交互作用.在含有大量因子的計算實驗中,如果對這些因子進行任意組合的測試和觀測,會導致實驗次數呈指數型增長,根本無法大規模應用.只有通過合理的實驗設計,才能夠以最迅速、最經濟的方法,得到理想的實驗結果.合理的計算實驗設計主要包括設計原理、設計選擇和數值生成三個方面.
1)設計原理
如圖10 所示,計算實驗過程通??梢砸暈椴僮?、模型、方法、人以及其他資源的一種組合.把多種輸入(通常是一種組合) 轉變為有一個或多個可觀測的響應變量的一種輸出.其中x1,x2,···,xm是人工系統的輸入,y1,y2,···,yn是人工系統的輸出,u1,u2,···,up是可控因素或者決策,v1,v2,···,vq是不可控因素或者事件.計算實驗的目的可包括以下內容: a)通過計算實驗確定最能影響系統輸出的因素集;b)通過計算實驗確定最有效的可控因素ui,使輸出結果集變得更小,且更接近理想的水平;c)通過計算實驗確定最有影響的可控因素ui集,使得不可控因素或事件vi對系統的影響作用最小.

圖10 計算實驗設計的示意圖Fig.10 Schematic diagram for computational experiment design
由于實物實驗與計算實驗之間的區別,許多實物實驗中的假設與邊界條件在計算實驗中并不滿足.實物實驗中通常假定誤差是獨立同分布的,有些實驗還認為實驗誤差滿足正態分布,然而計算實驗中通常不能滿足這些假定.雖然使用不同的偽隨機序列可以保證誤差的獨立性,然而同分布這一性質仍然難以保證.因此許多經典的實物實驗設計方法不能直接應用于計算實驗中.例如部分析因設計中需要假定因素間不存在交互效應或僅存在低階交互效應,然而對于復雜的計算模型而言,這一假設很難滿足.
為了更有效地進行實驗,就必須用科學的方法進行設計.所謂實驗的統計設計,就是設計實驗的過程,以便收集適合于統計方法分析的數據,從而得出有效且客觀的結論.如果想從數據中得出有意義的結論,那么用統計方法做實驗設計是必要的.當問題涉及受實驗誤差影響的數據時,只有統計方法才是客觀的分析方法.就計算實驗而言,其實驗設計同樣需要遵循本領域的隨機化、重復和區組化[81]這三個基本原理.
2)設計選擇
每個計算實驗都有多種可能的設計方案.為了選出最合適的方案,本文往往采用因果圖作為組織信息的可用工具.如圖11 所示,感興趣的效應或者響應變量畫在因果圖的脊骨上,潛在原因或者設計因子安排在一串肋骨上.以此為基礎,進行實驗設計的選擇,包括明確實驗目的、考慮樣本量(重復次數)、合適的實驗次序,是否劃分區組或者是否涉及其他隨機化限制等.

圖11 計算實驗的因果圖Fig.11 Cause and effect diagram for computational experiments
整個方法包括如下步驟: a)問題的識別與表述.為了在設計和分析實驗時使用統計方法,研究者需要預先對所研究的問題究竟是什么以及如何收集數據等有一個清晰的認識,至少要對如何分析這些數據有一個定性的了解;b)響應變量的選擇.在選擇響應變量時,研究者應該確信這個變量確實會對所研究的過程提供有用的信息;c) 因子的選擇.明確計算實驗所涉及的大量因子,包括設計因子、保持常量因子、討厭因子;d)水平和范圍的選擇.一旦研究者選擇了設計因子,他必須選擇這些因子變化的范圍及其特定水平,還必須考慮如何將這些因子控制在所希望的數值上以及如何測量這些數值.
如果交互作用存在,處理多個因子的正確方法是進行析因實驗[81].這種實驗策略是所有因子一起變化,而不是一次變一個.假定只考慮2 個因子,且每個因子有兩個水平,經過 22輪析因實驗,就可以幫助實驗者研究每個因子的個體效應并判定因子是否存在交互作用.一般地,如果有k個因子,每個因子有兩個水平,那么析因實驗就要進行 2k輪.析因設計的重要特點就是可以高效率利用實驗數據.一般而言,如果有 4~5 個甚至更多的因子,通常沒必要對所有可能的因子水平組合進行試驗.分式析因實驗是基本析因設計的變形,只需要對所有組合的一個子集進行實驗.
3)取值策略
在含有大量因子的計算實驗中,場景變量通過交叉組合可以得到成百上千種細分場景,所需的實驗次數呈指數型增長,有限的時間和成本顯然不可能完全覆蓋所有的場景.所以,本文需要采用一定的取值策略,一方面降低單次驗證的成本,另一方面提高試錯的效率.
對于已知各類影響因子取值范圍的情況,經常采用的取值策略是模型無關的實驗取值方法.這種取值策略并不針對某一種特定的元模型,而是關注由標準實驗輸入定義的k維單位立方體構成的設計空間.主要的模型無關設計包括拉丁超立方設計[82]與均勻設計[83].對于現實數據缺乏的情況,計算實驗通過模擬仿真來生成數據集.圖12 總結了這些方法的分支以及關聯關系[84],主要包括重采樣和蒙特卡洛兩類數據生成方法.

圖12 計算實驗的數據集產生方法[84]Fig.12 Dataset generation methods for computational experiments[84]
如果已經有了一定時間周期內的歷史數據,可以以此為基礎進行取值.但是,這些數據往往是有限的,而且很容易出現過擬合,為了應對這種情況,重采樣技術被廣泛應用.重采樣是指通過對觀察到的數據集重復采樣來生成新的(未觀察到的)數據集.重采樣可以是確定性的,也可以是隨機的.確定性重采樣的實例包括交叉驗證法(留一法)和混合驗證法(置換測試).隨機重采樣的實例包括無替換的隨機采樣(子采樣)和有替換的隨機采樣(自舉法).
針對那些有概率分布或概率密度函數的變量,可以用蒙特卡洛方法,構建一系列樣本集,使得滿足各種概率條件.蒙特卡洛實驗可以是參數化的,也可以是非參數化的.參數化方法可以將已觀察數據集的統計屬性,復制到未觀察到的數據集中.但是,參數化蒙特卡洛的一個缺陷是,數據生成過程可能比一組有限代數函數的復制過程更為復雜.在這種情況下,非參數蒙特卡洛實驗可能會有所幫助,例如變分自動編碼器、自組織圖或生成式對抗網絡[65].
在計算實驗中,可以同時設立多組對照試驗,有目的地對人工社會的參數做出改變,或者施加特定的干預措施,并在必要時進行多次大量的重復模擬,從而根據實驗數據挖掘出復雜現象背后的深層次原因.一般而言,計算實驗可以從宏觀分析、中觀分析與微觀分析三個層面進行實驗分析,三者互為補充,相輔相成.“宏觀分析”是從宏觀角度出發,以動態網絡為手段來分析系統的復雜性;“中觀分析”則采用事件鏈來追溯尋找事件發生的原因;“微觀分析”更強調微觀個體采取某種行為的內在機理,通過對微觀行為的分析來解釋或預測宏觀現象.
1)宏觀分析(自上而下)
如圖13 所示,為了挖掘出社會復雜系統的運行演化規律,宏觀層面以動態網絡分析為手段,遵循如下步驟: 驅動力→運行→狀態→溯源→響應[85].首先,本文需要了解系統的運行驅動力與演化機制,并通過數據分析及時發現系統運行的當前狀態.然后,通過機理分析,快速識別和處理關鍵環節,進而不斷優化系統的運行和治理.

圖13 計算實驗的宏觀分析Fig.13 Macro analysis of computational experiments
a)驅動力.社會復雜系統的宏觀分析,首先需要確定其演化的驅動力是什么.一般而言,系統持續演化取決于自上而下的設計與自下而上的涌現共同作用.一方面,新的主體涌現,或者現有主體的優化升級,并不是把原有系統進行簡單的改變,而是通過自生長、自組織演化出新的模式.外部干預則是對這個演化過程起到加速或者阻礙的作用.
b)運行.社會復雜系統本質上是一個社會-技術系統,可以用多層異質網絡進行描述,包括社會網絡、信息網絡以及價值網絡.社會網絡表示系統中主體間的交互關系,包括需求側、供應側、運營側及其群體間的交互關系.信息網絡是指所有可用信息服務構成的網絡,核心是具有豐富物理社會信息的服務以及服務間的交互關系.價值網絡則是聯系社會網絡與服務網絡的橋梁,表示主體之間通過服務的提供與消費所形成的價值流轉過程,類似于自然生態系統中的能量循環過程[86-88].
c)狀態.社會復雜系統結合了復雜系統的自組織特征和生態系統的協同進化特征,以及經濟系統的價值驅動特征.因此,社會復雜系統的度量與評估,需要從 “生態系統-經濟系統-復雜網絡”三個維度進行.生態特性主要研究系統中主體之間通過交互作用形成的生態位,采用指標包括多樣性、層次性等.網絡特性主要用于對比分析不同系統的基本結構與相互作用[89-91],采用的指標包括網絡規模、路徑長度、結構空洞、健壯性、可靠性等.經濟特性決定了社會系統是否可持續發展,包括競爭模式、公平性、有效性、外部性、風險/安全、信用、偏好等.
d)溯源.社會復雜系統演化過程的影響因素紛繁復雜且難以確認,而且還會受到人的自由意志和主觀能動性影響,有的時候還會因為偶發事件而改變演化路徑.為了揭示隱藏在這些現象背后的原因,本文需要從因果決定性、目的趨向性和隨機偶然性三個方面開展研究.因果決定性在很大程度上取決于隱含在社會系統演化背后的必然規律(例如網絡傳播).即使這些規律本文可能目前并未意識到.目的趨向性則體現了社會演化中人的自由意志與有限理性,這會造成系統不斷調整自身的演化方向、策略和結構.隨機偶然性是量變行為積累的結果,例如單個節點變化等帶來的網絡涌現.
e)干預.社會復雜系統的演化可能會出現不同的趨勢,既有可能發生由低級到高級,由簡單到復雜的進化;也有可能出現由高級到低級,由復雜到簡單的退化.為了促使系統實現健康發展,有必要對其演化實施有限度的、合理的干預[92].其目標遵循控制論的基本邏輯,即基于感知系統獲取的信息來揭示實際成效與標準之間的差,并采取糾正措施,通過循環反饋使系統穩定在預定的目標狀態.對關鍵節點施加引導,就成為一種可選的治理機制.針對增量節點,可以基于生態位識別實現誘導機制,鼓勵新的服務參與競爭,填補空白[93].針對存量節點,可以基于社會效用評價來實現節點更替機制,推動節點自主改進,實現優勝劣汰[94-95].
2)中觀分析(聯系宏觀和微觀)
中觀分析的基本觀點是承認事件未來的結果和實現這種未來結果的途徑都是不確定的,重點在于預測未來可能發生的情景,以便研究人員對可能情景進行有效應對[96].其實質是完成對事物所有可能未來發展態勢的描述,包括三部分內容: a)描述事件發生和發展過程,分析事件發展的動力學行為;b)在復雜的 “事件群”中,通過歸納與梳理,整理出若干要素和事件鏈;c)獲得這一過程中所體現出的時間情景之間所蘊含的動態性和關聯性,建立同類事件的邏輯結構.傳統情景分析的手段主要是靠人工想象和推理,而計算實驗方法可以構建出事件發生、發展、轉化和演變的 “可視化場景”.從情景的發展和演化規律出發,可以描述如下:
式中,Tr表示情景啟動的觸發條件;Des是對情景的簡要語言描述;Actor是情景中涉及的參與人員;In是從外界環境得到的數據或者條件,隨著外界環境變化而改變;Action是情景啟動后執行的行為或動作;Out是情景行為執行過程中產生的數據;ES是發生異常情況時的替代情景.根據式(2)所構建的備選場景能夠涵蓋不確定性對系統的影響,建立起人工社會演化過程與多個主體行動及相互作用的關聯關系.
在影響因子的作用下,情景之間的轉換概率會受到影響,情景之間可能產生選擇性關聯轉變.圖14模型提供了關于Simon 理論的一階表征,主要結果為Ω 空間內的各種情景均可通過條件組合產生.在某些初始時間點r0,在特定環境中發生了事件E.在后續時間點r1,為了應對當前環境的挑戰,個體可根據有限理性決定是否發生適應性改變,即事件D.如果它們并未做出改變的決定(即事件~D),則結果為E.如果它們決定適應,則可選擇是否實際執行決策和落實適應性措施(即事件A).如果它們未能成功執行事件(即事件~A),則會產生結果E.可論證E≈E*.如果個體已經采取了某些行為,則在r3時刻,行為反饋可能有效,也可能無效.若反饋有效(事件W),則結果為C且具有更高的復雜度.若反饋無效(事件~W),則結果為失敗后仍需忍受環境影響(結果E**).可論證S(E**)>S(E),其中S(X) 代表與事件X有關的影響或無效性.

圖14 情景出現的順序因果邏輯樹Fig.14 Sequential causal logic trees of system scenario emergence
在順序邏輯模式[97]下,系統情景C的出現被解釋為經過多項博弈的分支過程P,是樣本空間Ω 內的一種結果,即可能事件之一.由圖14 可以看出,情景C的出現最少需要4 種必要的順序狀況,具有顯著的低概率.其他結果(E、E*和E**) 發生概率相對較高.在條件邏輯模式下,可根據當前情景來研究背景狀況,提供必要或充分條件進行解釋.通常,情景C的出現可能有2 種情況: 或者基于必要事件的同時出現(事件X1,X2,X3,···,XN通過AND連接);或者基于任意一充分事件的發生(事件Z1,Z2,Z3,···,ZM,通過 O R 連接).
3)微觀分析(自下而上)
整個社會復雜系統的演化過程最終是多個主體行動及相互作用后涌現的結果.“主體分析技術”主要是從個體層面來分析現象背后的成因,包括模型擬合與機制分析[98].
“模型擬合分析”是通過構建能與最終結果擬合的微觀個體行為模型來解釋從干預前的情景1 到干預后的情景2 (圖15 箭頭1)).這類分析首先從海量Agent 行為數據中挖掘出Agent 行為模式(圖15 箭頭2));然后基于智能模型(神經網絡、遺傳算法、群體智能、強化學習等) 實現Agent 行為自學習(歸納-概率模型)和演化(演繹-規則模型);進而使用這種演進的Agent 行為規律解釋或預測情景2 (圖15 箭頭3)).這種行為分析方法假定源頭情景1 與預測情景2 之間由簡單的Agent 行為作為中介,即兩個現象間的行為鏈條是可以通過智能模型代替的.但是,這種分析是以統計學為基礎的,智能模型產生的行為規律本身在現實中可能并不存在;即使存在,也無法表述從情景1 到情景2的 “因果”關系.

圖15 基于模型擬合的分析模型[98]Fig.15 Analysis model based on model fitting[98]
在計算實驗中,“行為機制分析”是指分析主體行為的生成規則和主體間行為的互動規則,以及涌現出特定宏觀結果的內在機理.如圖16 所示,基于行為機制的分析是解析因果鏈條的過程,解析的重點是主體,從主體的行為取向入手: a)首先分析情景1 對主體行為取向的某些影響,包括信念、愿望和意圖等屬性[99],即分析情景1 與行為取向之間的因果鏈條(圖16 箭頭2));b)然后,解析主體的這些行為取向與其他主體和政策環境之間的作用機制,即主體行為的生成機制,形成主體行為規則(圖16 箭頭3));c)這些規則將表現為主體的行為,進而涌現出情景2 的推演結果(圖16 箭頭4)).

圖16 基于行為機制的分析模型[98]Fig.16 Analysis model based on behavior mechanism[98]
基于行為機制的分析是宏觀現象間的 “因果”關系分析,是對從宏觀現象到微觀行為再到宏觀現象的 “影響-作用-涌現”機制的解析.這類分析不同于通過模型擬合來追求宏觀現象間的重合率,而是真正切入了人工社會演化過程的每個環節,還原了干預作用的機制.因此,機制分析是計算實驗的核心.為進一步量化兩個節點之間的因果關系,可以用概率因果模型[100]來形式化定義相關操作.
實驗驗證是從計算實驗的應用目標出發,考查實驗系統在其應用域內是否準確地映射了原型系統.為了增強實驗的置信度,就必須提供一種可信的證明來確保模型假設代表了系統真實規律.高的置信度是計算實驗得以施展作用的基礎.只有在實驗驗證方面取得突破,計算實驗方法才會成為社會經濟領域的主流方法,與其他方法取長補短,成為理解復雜系統運行規律的有力工具.目前,研究者們已經提出了各種各樣可用于計算實驗的有效性驗證方法[101].如圖17 所示,按照計算實驗的運行流程,實驗驗證可以分為結構驗證、數據驗證和結果驗證3 個部分.

圖17 實驗驗證的分類Fig.17 Classification of experiment validation
1)結構驗證
系統模型是對真實系統的抽象,經過編程實現得到可實際執行的計算模型.結構驗證是對模型構建的過程進行驗證,使模型能夠反映真實系統的內部構造特征,保證假設產生模型行為的中間過程是正確的,即保證假設模型是產生行為結果的充分條件.計算實驗系統構建過程包括系統模型設計和計算模型實現兩個步驟,因此結構驗證也包含了系統模型驗證和計算模型驗證兩個方面.
a)系統模型驗證
這個階段主要檢查系統模型與研究目的、給定的假設、已有的理論和證據是否保持一致,確定模型的簡化處理不會嚴重影響模型的可信性和對真實系統重要特征的認識,同時系統模型要滿足內在完整性、一致性和正確性.模型合理性判斷主要采用專家判斷、理論比較、實證數據擬合3 種方法,往往是定性的而不是嚴格證明的.通過與現有其他模型的比較和借鑒,研究者可以極大提高系統模型的驗證程度,包括: i)說明模型的適用范圍和缺陷;ii)主流理論采用了相同假設,或者其他研究者做過的類似研究和采用的相同假設;iii)開發和分析一組具有相同核心假設,但具有不同附加假設的模型;iv)可以建立與原有Agent 模型行為具有類似特征的方程模型.
b)計算模型驗證
這個階段主要檢查算法、編碼、運行條件等是否與系統模型一致.系統模型通過編程轉變成特定計算機系統可以運行的計算模型,此過程涉及因素繁多,容易產生不易覺察的錯誤.由于Agent 模型是離散模型,同時各種編程語言和計算機系統存在顯著的差別,編程的細節對模型結果具有重要影響.目前計算模型驗證采用的方法主要有: i)代碼級檢查,判斷計算模型與概念模型的一致性;ii)在不同計算機上,采用不同的操作系統,不同的偽隨機數發生器運行相同代碼并進行比較;iii)利用不同的編程語言實現系統模型并進行比較;iv)測試計算模型在極值情況下的行為[101].無論哪種情況都涉及代碼檢查,從原理上說,代碼檢查可以發現所有的編程錯誤.
2) 數據驗證
在計算實驗中,通常把 “模型假設+模型參數=模型行為”作為研究的先驗條件.模型構建,實際上相當于提出了一種假設,并認為這種假設代表了真實系統的規律.通過執行計算實驗,觀察模型行為結果,來對真實系統做出因果解釋.輸入數據的質量好壞將直接影響計算實驗的最終結果,糟糕的數據輸入甚至導致與實際情況相去甚遠.想要構建一個有效的實驗系統,首先需要在源頭上保證數據的可用性.不少研究者[102-103]注意到了數據可用性的問題,包括一致性、精確性、完整性、時效性和實體同一性等性質.針對計算實驗而言,需要著重考慮如下因素:
a)可信度.數據收集過程其實是根據命題采集數據的人為過程,所以從開始就帶有傾向性,操作過程中也無法保證完全真實.既然沒有絕對的 “真實”,那么嚴格遵循科學原則、主觀性較少的數據是更接近 “真實”的,是可信的.一般而言,政府和權威機構的數據可信度較高.
b)數據量大小.在統計學中,樣本容量的大小與推斷估計的準確性有著直接的聯系.在總體既定的情況下,樣本容量越大其統計估計量的代表性誤差就越小;反之,樣本容量越小其估計誤差就越大.在估計模型參數時,對于同一個總體(如同一地區)而言,數據量更大可以減少隨機誤差出現的概率和代表性不足的問題.
c)時效性.復雜系統的運行是一個動態過程,數據趨勢可能會隨著情景設置和外部干預的變化而出現劇烈波動.因此,數據的時效性是影響實驗結果的重要因素,尤其是對于某些時效性較強的項目而言.然而,有一個不可避免的問題是收集數據需要一定的時間,數據的獲取具有滯后性.尤其是在某些突發的應急事件初期,數據延遲的問題非常突出.對于計算模型而言,選用越臨近當前、更新越及時的數據,實驗效果越好.
d)相關性.很多情況下,數據資源中沒有想要研究的數據,或者與研究問題相關的直接數據非常欠缺.于是研究者會尋找替代變量來進行研究,那么替代變量與直接變量的相關性大小,將對實驗結果產生影響.
3)結果驗證
結果驗證主要用于評價實驗結果是否與真實系統行為相一致.真實數據可以從現實世界采集而來,而模型輸出的數據是由設定的模型運行機制產生.將模型產生的數據與真實數據對比,以推斷是否可以 “恰當地”反映現實,從而達到結果驗證的目的.但是,計算實驗經過有限次運行得到的僅僅是總體中的有限樣本,并且模型行為是不穩定的、參數敏感的.因此,在與真實系統行為比較時,計算實驗的結果驗證會面臨以下問題:
問題1.如何應對參數組合爆炸與敏感性分析?眾多的模型參數會導致組合爆炸,即使結果與真實數據一致,也難以確定產生最終結果的決定性影響因素.同時模型結果往往不穩定,受到初始條件的影響很大.目前研究者基本上采取兩種方法縮小參數空間.第1 種方法是在建模開始,通過已有的數據、事實、相應的模型與理論,以及專家經驗和知識來縮小參數空間.這種方法可以充分利用已有知識,但容易引入未加驗證的先驗信息.第2 種方法是先給出一種先驗空間,在模型建立并運行后,通過靈敏度分析找出敏感參數,從而縮小參數空間.這種思路通常采用實驗設計、統計學方法和蒙特卡洛方法等,結果具有很強的說服力,但很多情況下實施非常困難.這兩種思路經常結合使用,分別從兩個方向進行空間縮減.
問題2.如何比較實驗輸出與實證數據是否一致? 實驗運行的結果是一個分布,而真實世界的數據只是一個樣本,難以用一個樣本來檢驗一個分布.實驗的輸出在何種程度上可以認為與真實數據是“一致的”,目前主要還是通過主觀確認,并輔助一些簡單的擬合度統計描述,其結果很大程度上受制于分析人員的主觀意識.這種判斷不僅要考慮模型輸出一致性,還必須考慮輸入輸出的一致性,即需要對模型先進行校準研究,然后才能考慮結果的一致性[101].目前歷史數據法提供了一個可行的解決方法,這是實驗驗證未來的一個研究熱點.
問題3.如何驗證現實中沒有發生過的結果?通常情況下,實驗驗證是利用已有的經驗數據進行推論.但有的時候,計算實驗的結果可能并未在現實世界中產生過.在這種情況下,需要充分利用領域知識,去探尋產生這種現象的原因是什么,是否是現實世界中一種可能的發展趨勢,以此來判斷該實驗是否有效.其結果很大程度上受到分析人員所熟悉的知識范圍與問題分析能力制約.
近年來,普遍采用的結果驗證方法包括間接標定方法[104]、Werker-Brenner 方法[105]和歷史數據法[106],但目前沒有一個公認的方法和流程能夠完全解決上述所有問題.因此現在主流的觀點認為計算實驗驗證最好同時與其他實證方法(如案例研究、格式化特征分析、角色扮演博弈和受控實驗等)同時使用,才能取得好的效果.
計算實驗作為一種新的科學研究方法,其應用范圍大致可以分為現象解釋、趨勢預測與策略優化三個方面.本節將分別給出這三個方面的一些經典案例,以幫助讀者加深對計算實驗方法的理解.
現象解釋,并不是針對特定的情景或者特定真實社會系統進行建模,而是追求描述一般社會系統的抽象邏輯關系,希望通過實驗來探索和量化分析某些假設對人類社會所造成的難以預料的結果.其優勢在于為驗證人們所提出的各種假想提供了手段,但這類研究規避了實際社會到人工社會的映射問題,所能給出的往往是隱喻、啟示和定性趨勢,而不是復雜問題的精確回答.
1)糖域模型
1996 年,Epstein 等[45]提出了 “人造社會”模型SugarScape,可以進行經濟學和其他社會科學的相關實驗.如圖18 所示,SugarScape 模型是一個由方格構成的封閉世界.圓點表示Agent,僅僅能在這個世界中游走;染色部分表示社會財富 -糖,且深淺表示糖的分布濃度.每個Agent 包含視力范圍r、資源的新陳代謝率v和擁有糖的數量s三個屬性.Agents 按照以下規則游走: a)對視力范圍r內的所有單元格進行觀察,并確定含糖量最大的單元格;b)如果擁有最大含糖量的單元格不止一個,則就近選擇;c)移動到這個方格;d)收集該單元格的糖并對相應狀態變量進行更新.

圖18 SugarScape 中糖和Agent 的分布Fig.18 Distribution of sugar and Agent in SugarScape
隨著實驗的進行,一些Agent 可能由于個人能力出眾、所處位置的資源分布優勢等,能夠獲得較多的糖;而缺少糖的Agent 會凋零死亡,導致大部分Agent 都逐漸聚集到糖含量比較高的兩個區域.最終,少數Agent 擁有大量的糖,而多數Agent 僅僅擁有少量的糖,這就驗證了社會學中著名的馬太效應.進一步,通過向SugarScape 人工社會中添加多種資源(例如香料).以此來研究真實社會中個體間如何通過資源交換形成市場.此外,本文還可以通過改變Agent 所遵循的不同規則,來研究環境變遷、遺傳繼承、貿易往來、市場機制等社會現象.
2)謝林模型
謝林模型也叫謝林隔離模型,由美國經濟學家Schelling[58]提出,該模型描述的是同質性對于空間隔離的影響與作用,揭示了種族和收入隔離背后的原理.該模型包含產生行為的Agent、Agent 遵循的行為規則以及Agent 行為所導致的宏觀結果三個元素.如圖19 所示,實驗中將整個城市看作一塊巨大的棋盤,棋盤上每一個小格子允許Agent 居住或空閑.其中存在2 種Agent,數量大致相等,大約10%的網格為空.每個Agent 都有一個最低的寬容度閾值,一旦發現同類鄰居數量低于閾值,則會遷移至未被占領的且滿足其居住要求的位置.Agent的行為規則為: a)計算周圍同類鄰居的數量;b)如果鄰居數量大于等于其偏好值,則Agent 認為滿意,停止運動;否則繼續運動;c) Agent 會查找滿足其偏好值且與其距離最近的閑置網格,移動至此處.

圖19 基于謝林模型的種族隔離實驗Fig.19 The segregation experiments based on the Schelling model
隨著時間的推移,不同種類Agent 之間的隔離程度最終會呈現出非常明顯的狀態.通過改變實驗設定,例如Agent 壽命值、閑置空間等,可以發現,改變寬容度閾值并不足以避免產生種族隔離,因為幾乎每個Agent 均追求所有鄰居與其種類相同.該現象引發本文關于社會問題的思考: 種族主義達到何種程度會將整個社會變為此類隔離模式?
如何能夠逆轉種族隔離的狀況? 研究者們對這類模型進行了擴展,并應用于不同地區的種族沖突研究中,獲得了較好的結果[107-108].
3) RebeLand 模型
喬治梅森大學的Cioffi 等[17]提出了MASON RebeLand 模型,用于分析內部(內生)或外部(外生)過程(例如經濟變化、人口、文化、自然環境等)如何影響政體的穩定性.RebeLand 表示一個位于自然環境中的政體或國家,由一個被水包圍的島嶼組成,以忽略與其他鄰近國家的互動.RebeLand 的環境由地形和簡單的天氣系統組成,可以模擬氣候動態變化(例如長期干旱、氣候多變等).
如圖20 所示,RebeLand 的地圖顯示其主要的自然和社會特征.國家用島嶼形狀表示,自然資源用三角形表示,叛軍和政府軍用橢圓形狀表示,道路和省的邊界用折線段分割,島嶼被海洋包圍.RebeLand 政治組成部分包括一個社會系統和一個通過公共政策處理事務的政府系統.最初,政府制定政策以解決影響社會的問題.在實驗的后期,在某些條件下,社會還可以產生與政府軍互動的叛亂分子以及其他涌現現象.

圖20 MASON RebeLand 模型Fig.20 MASON RebeLand model
這項研究演示了穩定、不穩定和失敗3 種政治狀態.為了測試一個政體的總體彈性,通常不僅需要執行一個或幾個壓力測試,還需要進行大量的測試條件組合(例如通貨膨脹、叛亂與環境壓力同時爆發).這些結果可能不會立即得到針對特定議題的可行政策建議,但至少可以為研究人員和政策分析師提供新的、有價值的見解.這類研究還常被用于選舉預測和應用政治學[109].
計算實驗的趨勢預測是面向真實社會系統建模,強調人工社會系統和真實社會系統之間的高度匹配,期望解決現有社會中確實存在或者可能存在的問題.這類應用往往會遇到真實社會映射到人工社會的有效性驗證問題.當前研究者主要希望通過先進的數據獲取和處理技術來解決,從而使實驗結果能夠預測真實的趨勢.其優勢在于可以利用較為抽象的模型對現實策略進行評估,但是預測結果是否準確非常依賴于現實數據是否充分以及模型抽象程度是否合適,并且也無法實現對策略的優化.
1)人工股市
股票市場顯然是一個復雜系統,多種組成要素和層次結構使股市整體表現出復雜性與難預測性.為了證明和理解投資者怎樣做出資產組合選擇,Arthur 等[46]提出了 “人工股市”模型,用一種全新的觀點來理解經濟系統中的復雜性.這個模型摒棄了完全理性、全知全能的 “經濟人”假設,取而代之的是能夠學習和適應環境的有限理性人,把經濟系統看成是由若干相互作用的個體進行交互的復雜系統.在這個虛擬市場中,若干交易Agent 通過觀察數字世界中股價和股息的不斷變換而做出預測,并且根據這些預測做出是否購買股票以及購買數量的決策,以使自己效用最大化.所有Agent 都獨立形成自身的期望,并具有學習能力,可以根據以前預測的成敗進行決策調整.反過來,所有交易者的決策又決定了需求與供給相互競爭的狀態,進而決定股票的價格.
如圖21 所示,整個股票交易市場就構成了一個自我封閉的計算系統.模型運行時間是離散的,實驗可無限進行下去.人工股票市場提供了一個很好的現實股市的隱喻,可以用于檢驗不同預期最終是否會演化為相同的理性預期以支持有效市場理論.在主體層次和組織層次上會出現更加復雜的行為,可以支持實際投資者的觀點并解釋金融市場的實際現象.隨后,不少研究者對人工股票市場模型進行了改進,以期進行更深層次的分析,例如將微觀投資行為與宏觀股市動態聯系起來、價格限制的有效性等[59,110-111].

圖21 Agent 與股市相互作用結構Fig.21 The interaction structure of Agent and stock market
2) O2O 服務
移動互聯網商業模式近些年獲得了飛速發展,其速度已經遠遠超出了人們的想象.O2O 模式已經成為許多傳統行業升級改造的典型商業模式,涉足餐飲、旅游、醫療、交通、生活服務等諸多領域.互聯網已經對人們的生活習慣產生了極大的影響,也給傳統產業的運營模式帶來了挑戰.對于互聯網是否能顛覆傳統產業的運營模式,或者說互聯網在多大程度上能改變傳統模式,人們所持觀點截然對立.針對該問題,文獻[112]以供需匹配理論為基礎,提出了 “服務橋”方法,以評估互聯網的跨界影響力,包括供給側能力模型、需求側特征模型和服務橋模型這三個主要部分.
如圖22 所示,模型中的河流象征著供給側和需求側之間的障礙;左邊表示需求方主體,右邊表示供給方主體;服務橋表示將供給方和需求方聯系起來的渠道,用于描述不同運營模式的能力.在計算實驗系統中,供應側Agent 的屬性主要包括市場能力(如客戶推廣、用戶畫像、服務推薦、基礎設施等)和供應鏈能力(如物流能力、制造技術、支付手段等)兩類.需求側Agent 的屬性則包括多種因素:消費能力、消費者偏好、區域特征、價格因素、時間因素(接收時間、交貨時間等)、品質因素和信用因素等.通過對供給側和需求側的要素組合,可以定制出所需要的各類競爭場景,從而分析互聯網模式與傳統模式之間的優劣.文獻[112]采用該模型對零售業、金融業、制造業和醫療行業進行了行之有效的分析,并給出了相應的趨勢預測.

圖22 服務橋模型Fig.22 Service bridge model
3)流行病預測
隨著SARS、H1N1、新冠疫情等突發傳染病的流行,傳染病的傳播模型成為了研究熱點.但是,傳染病傳播是一個動態的不確定過程,不僅影響因素眾多,而且存在很多未知領域與突發事件,使得預測研究極為困難.計算實驗采用人工社會模型實現基礎數據、模型方法及分析結果的綜合集成,主要涉及三個方面: 疫情態勢的生成(例如初始感染人數、接觸率、傳播速率、病毒潛伏期、死亡率、康復概率等)、空間地理特征的表示(例如城市類型、交通網絡、人口密度、氣溫、天氣、不同年齡段人口比例、城市基礎設施等)、資源和管治能力的建模(例如醫療資源、病床數量、社會組織、防控措施、信息透明度等).表2 對幾種傳染病相關的模擬系統進行了特征比較,不同的系統在實現方式、表示方法和準確性程度方面各有特點.

表2 典型的大規模流行病傳播模擬系統特征對比Table 2 Comparison of characteristics of typical large-scale epidemic spread simulation systems
目前,計算實驗已經成為研究流行病大規模傳播的一種重要手段,主要應用在3 個方面: a)傳播趨勢預判.發達的交通系統使得重大流行病更容易形成大規模的傳播,在疫情尚未到達某一區域時,對其傳播趨勢的分析與判斷是應急準備的重要前提;b)影響預評估.疫情在區域內的爆發和傳播,會對人口健康產生直接危害,還會對社會經濟環境產生次生影響,定量評估其影響是應急儲備、干預決策的重要依據;c)干預策略優化.重大流行病應急防控的干預措施多種多樣,每種干預措施都有不同的干預對象和干預強度.在實踐過程中,如何選擇合理的干預措施及其強度,形成組合干預策略,既能控制住疫情,又能減少干預的代價,是應急決策的重要難題.
科學研究的目的在于提供一種能將已有事實聯系在一起的因果關系假設.如果所構建的人工社會模型代表了這種規律,那么該模型的輸出行為就能對現實世界產生有效作用.其優勢在于建立與現實社會具有同態關系的人工社會模型,通過二者的并行執行與循環反饋,可以支持對現實復雜系統的管理與控制.其缺陷是需要從現實環境實時獲取數據以實現對人工社會模型的校準,現實中這點往往難以實現,即使能獲得數據,也會存在資金和工作量過大的問題.
1)虛擬淘寶
淘寶網作為國內最大的零售平臺之一,商品搜索是其核心業務.淘寶的業務目標是通過策略來優化向客戶所展示的頁面從而增加銷售量.由于客戶的反饋信號取決于頁面序列,商品搜索引擎和客戶互為彼此的環境.強化學習解決方案擅長學習順序決策并最大化長期回報.但是,直接應用強化學習的一個主要障礙是,當前的強化學習算法通常需要與環境進行大量交互,需要很高的成本,例如資金、時間、糟糕的用戶體驗等.
為了降低成本,研究人員使用模擬器(即虛擬淘寶) 進行強化學習訓練,然后在模擬器中對頁面策略實現離線訓練[117].虛擬淘寶中的客戶和客戶間的交互都是生成的,如圖23 所示,模擬分布的生成對抗網絡用于模擬各種客戶,以及他們的需求;多智能體對抗性模仿學習被用于生成交互.實驗結果表明,虛擬淘寶展現出的屬性非常接近于真實環境性.虛擬淘寶可用于訓練平臺策略以最大程度地提高收入.與傳統的監督學習方法相比,在虛擬淘寶中訓練的策略在實際環境中實現了2%以上的收入提升.

圖23 使用強化學習的虛擬淘寶架構Fig.23 The architecture of virtual Taobao using reinforcement learning
2)小島經濟
經濟不平等正在全球范圍內愈演愈烈,并且因其對經濟機會、健康和社會福利的負面影響而備受矚目.對于政府來說,可以使用稅收政策來改善社會福利.但是,由于稅收和勞動力之間存在耦合關系,高稅收可能會降低生產率.因此,如何在降低經濟不平等的同時保持生產率仍是一個亟待解決的問題.由于缺乏適當的經濟數據和進行實驗的機會,在實踐中很難對這類經濟問題進行研究.為此,Zheng 等[118]提出了一項名為 “The AI Economist”的新研究,通過人工智能體進行經濟模擬,用以發掘能夠在經濟平等和生產率之間高效尋找平衡點的稅收策略.其中的市民和稅收策略都具有學習和適應功能,形成了一個兩級強化學習框架.如圖24 所示,“The AI Economist”的核心實現框架是市民和稅收策略的博弈演化機制,即如何使用強化學習實現智能體行為和稅收策略的共同優化.

圖24 小島經濟Fig.24 Small island economy
研究者將 “The AI Economist”的運行結果與自由市場(不征稅或再分配)、模擬的美國聯邦稅收計劃以及由Saez 框架產生的稅收策略[119]進行了比較.實驗表明,與Peter 等[119]提出的稅收框架相比,“The AI Economist”可以將經濟平等與生產率之間的權衡提高16%.該框架不使用先驗知識或建模假設,能夠直接針對任何社會經濟目標進行優化,并且僅從可觀察的數據中學習.開發者希望 “The AI Economist”能夠解決傳統經濟研究無法輕易處理的復雜性問題,可以客觀評估政策對現實經濟的影響.
3)無人駕駛
無人駕駛需要測試和驗證無人車對復雜交通場景的理解和行駛決策的能力,是人工智能領域面臨的重大挑戰之一.但是,現實測試場景(例如暴雪、暴雨、臺風等極端場景) 的搭建極具挑戰性,并且其創建、復制和迭代的成本很高,這幾乎是不可能完成的.因此,在虛擬世界中對無人駕駛策略的訓練與測試就成為一種可行的技術選擇,不僅可控、可重復,而且安全有效.為了在虛擬世界中看到與現實世界無限接近的自動駕駛測試,需要實現三種層次的還原: a)幾何還原.需要做到三維場景仿真和傳感器仿真,讓環境和測試車輛條件都與現實世界相同;b)邏輯還原.要在虛擬世界中模擬出測試車輛的決策規劃過程;c)物理還原.需要模擬出車輛的操控和車身動力學作用結果.同時,仿真平臺還要滿足高并發的特點,實現所有場景下各種車輛反應的排列組合.目前,平行學習方法越來越多地應用于虛擬場景生成和無人駕駛車輛的智能測試中[10-11,79-80].
如圖25 所示,騰訊在模擬仿真平臺、高精地圖平臺和數據云平臺的基礎之上,構建了一個運行在云端,與現實物理世界平行的虛擬城市.城市仿真不僅包含靜態的環境信息,也包含交通、人流等動態信息,既可支撐自動駕駛的開發和安全驗證,還可為智慧城市、智能交通的建設助力.為了提升路采數據的利用率及測試場景的豐富性,可以利用大量路采數據訓練交通流Agent AI,生成真實度高、交互性強的交通場景,進行閉環仿真,提高測試效率、降低采集成本.例如被測試的自動駕駛主車想要超車,可以借由Agent AI 來控制仿真系統中的車輛做出與真實世界一致的避讓或其他博弈行為.

圖25 騰訊TAD Sim 仿真系統場景演示Fig.25 The scene demonstration of Tencent TAD Sim simulation system
計算實驗已成為人們認識和研究社會復雜系統的重要途徑.但相對于其日益廣泛的應用,計算實驗作為一種方法論和技術還沒有完全成熟.因此,為了進入研究者的主流工具箱,計算實驗方法必須解決以下3 個問題: 1) 如何利用大數據定義人工社會,即描述智能;2)如何利用計算實驗預測未來,即預測智能;3)如何實現對現實世界的反饋干預,即引導智能.
通過對真實社會系統中的復雜行為和復雜現象進行抽象和簡化,使之成為能夠在計算機平臺上運行的、滿足邏輯合理性的、正確性的人工社會模型,是進行計算實驗的基礎.目前的人工社會建模主要有2 種手段: 1)基于數據的模型構建方法.將復雜系統視為黑箱,關注輸入和輸出之間的關系,并不對系統內部復雜的過程進行建模和模擬.在實際應用中,復雜系統往往會被替代為基于數據和智能算法的統計模型,包括圖神經網絡、支持向量機和模糊方法等.2)基于機理的模型構建方法.從整體角度對實際中的復雜系統進行認識、理解和剖析,遵循 “簡單一致”原則,設計并還原系統各個部分的結構和功能.在按照自下而上原則構建計算模型的過程中,底層微觀模型的準確度和復雜度對整個復雜系統的演化發揮著至關重要的作用.
但是,復雜系統要素多樣、變化頻繁、關系耦合、多層次運行,信息傳遞和交互作用復雜.傳統的機理建模受制于當時的認知能力,往往難以精確描述復雜系統的運行和演化機制;數據驅動的建模由于缺乏過程單元內部結構和機理信息,嚴重依賴于數據樣本的數量和質量,難以對系統機理進行深層次的分析和解釋.因此,如何針對社會復雜系統構建人工社會模型,就成為這個領域里非常有前景的研究問題之一.機理分析有利于抓住系統的本質特征和主要矛盾,獲得有效的模型結構;數據驅動的方法則可以自動獲取潛藏在數據中的信息和知識.綜合二者的優點,將描述個體行為的規則模型與統計模型相耦合,建立融合系統機理分析和大數據的混合模型,不僅降低了對數據的依賴性,而且彌補了傳統模型難以模擬個體行為規則的不足.未來這類模型將有很大的發展空間,可用于更具真實感行為的虛擬人工社會模型構建.
最后需要注意的是,由于Agent 模型自由度大,缺乏標準化的核心模型,容易過度推廣夸大自己的成果,這很容易招致批評.因此,在對復雜系統進行漸進式建模的過程中,有幾點需要注意: 1)有必要確定一個簡單的初始模型,足以理清模型的全部細節,同時包含了參照系統最終模型的核心要素.2)設計模型的序列并不是隨意的,必須為完成最終模型提供遞進式的幫助.3)在整個開發過程中,模型驗證是有必要的,但需要適度.因為中間階段的模型尚不成熟,可能由于缺乏足夠的實證支持而被否決.4)確定參照系統的最終模型是必要的,否則模型的改進會無限期延續下去.
在復雜系統中,從主體的自主性,到主體所處的環境,再到對主體行為進行干預的過程,各個環節都充滿了由個體行為所引發的高度不確定性,進而導致在智能預測中伴隨著由不確定性引發的復雜性.大數據技術主要是基于對歷史數據的分析,更像是對事實的一個總結歸納,對于從未發生過的不確定事件,就顯得無能為力.因此,如何針對復雜系統做出準確的路徑預測是計算實驗所要解決的基本問題.
人工社會可以在虛擬世界中對現實世界的問題進行精確描述、并使之可控,進而產生海量的復雜系統模擬運行數據.計算實驗通過推演現實中各種從未發生過的場景,可以發現系統運行中的問題和薄弱環節,并找出原因,提出符合實際的問題解決方案或建議.對應于Pearl 等[5]的三層因果關系(關聯、干預和反事實推理),實驗分析方法包括動態網絡分析、事件鏈分析以及行為機制分析等.動態網絡分析主要關注個體在時間和空間上的相互作用,尤其是異質網絡間的循環反饋.事件鏈分析可以用于梳理影響因素與最終場景之間的關系,確定某種可能情景的發生概率.行為機制分析則可以設計各種反事實實驗,用于對現象背后的因果關系進行追根溯源.
以 “決策劇場”為代表的公共政策仿真很好地體現了這種思路[120],通過 “如果這樣,后果會如何”的設問式場景呈現,可以對不同政策產生的后果進行反事實推理.其具體工作流程如下: 1)對于需要解決的問題,收集其相關的大量歷史數據,并按照不同的維度進行整理;2)由政府決策人員和專家共同合作,建立問題模型,再運用計算實驗將抽象的專家知識轉化為大眾群體可接受的場景語言;3)將模擬現實的仿真決策場景三維可視化,為政策制定者提供多個政策場景及其結果預演;4)在協商一致的群體決策環境下,各個利益群體為政策問題選擇一個共同滿意的解決方案.美國亞利桑那州立大學有關鳳凰城水資源利用是一個典型的應用案例[121].
在復雜系統中,個體活動日趨復雜、多樣、差異化,而干預方式往往是簡單、統一、平均的集中式控制.考慮外部環境的動態性和不確定性,干預策略的介入勢必會導致某些個體會根據周圍環境發生自適應改變,進而導致初始干預策略的失效.因此,干預策略的設計并非是一個畢其功于一役的任務,而是需要不斷根據外部環境的變化而進行調整和優化.計算實驗可以打通虛擬世界與現實世界的藩籬,通過反事實推理來剔除不可行的策略,將優化過的策略遷移到真實空間中指導真實系統的運行.
在計算實驗中,引導智能主要通過平行優化來實現,其核心就在于從現實中實時動態獲取數據,實現人工社會與現實社會的同步校準.在實驗系統中,可以創造出在當前真實世界中難以重現的極端場景.然后,結合運籌學關于不確定、多目標條件下的優化理論,對干預策略進行不斷地訓練修正,以期獲得預期的優化效果.這是以未來視角干預當前的發展軌跡和運行狀態,發現策略可能產生的不良影響、矛盾沖突和潛在危險等,為應對可能情況提供 “借鑒”、“預估”和 “引導”.基于這個層面的理解,各類機器學習的主流技術(包括但不限于強化學習、深度學習等)均可用于實現干預策略的調整優化,從而實現引導智能.
最終,計算實驗和實際系統之間可以構成一個相互協作的共生的動態反饋控制系統.首先,通過分析數據與行為的依賴關系,將真實世界中的問題抽象到認知空間;然后,在認知空間中建立模型、進行計算實驗,得到的結果可以動態地指導或控制真實世界中的策略執行;接著,通過干預策略與現實世界之間的博弈過程,來探索平行系統間差異最大的動作空間,達到降低人工系統建模誤差和干預策略執行誤差的目的;最后,真實世界執行結果反過來以動態數據輸入的形式,不斷更新認知空間的模型,形成了一個循環反饋的學習過程.系統以這種虛實互動、平行執行的方式不斷迭代,直至收斂.在不斷融入越來越多數據的過程中,人工社會的訓練和模擬會變得更加真實準確,并通過與現實世界的交互反饋而具有自生長、自優化的能力.
在科學研究中,歸納是在實證數據中發現模式,廣泛用于觀點調查和宏觀規律分析;而演繹則是定義一套公理,并證明由這些公理所能推導出的結論.與歸納、演繹這兩種標準方法對比,計算實驗可以看作是進行科學研究的第3 種方法.如同演繹一樣,它起始于定義一套清晰的假設;但與演繹不同的是,它并不證明定理.計算實驗產生模擬數據,這些數據可以用歸納的方法進行分析;但是又和典型的歸納法不同,模擬數據來自于規則運行產生的涌現,而不是對真實世界的直接測量.歸納旨在從數據中發現模式,演繹希望發現假設的結果,而計算實驗則是通過虛擬世界中的系統推演、試錯和預估,來驗證本文的直覺.
本文對計算實驗方法的現狀與挑戰進行了總結,包括計算實驗的概念起源、方法框架、應用案例以及技術挑戰.計算實驗的方法框架主要介紹了人工社會建模、實驗系統構建、實驗設計、實驗分析和實驗驗證.計算實驗的應用案例主要從現象解釋、趨勢預測與策略優化3 個方面進行了介紹,涉及到政治、經濟、商業、流行病傳播、無人駕駛訓練等諸多領域.計算實驗的技術挑戰主要關注本領域需要持續研究的核心問題,包括描述智能、預測智能與引導智能.
計算實驗的提出為復雜系統的分析與研究提供了新的思路,盡管相關研究已經取得了很大進步,但是在實驗設計、實驗分析與實驗驗證等方面還存在很多問題與挑戰.例如計算實驗結果是否與已知系統規律相匹配(正確性);計算模型的表示形式是否優雅,包括規則式、句法結構以及相似特征等方面(簡潔性);計算實驗分析是否能夠對改造現實世界發揮作用(有效性)等.
本質上,計算實驗旨在解決基于現實參照系統所定義的一個或多個研究問題.一般來說,計算實驗的表現形式比較簡單,而實際系統的運行比較復雜.如果計算系統抽象程度過高,就難以反映現實世界的運行規律.如果計算系統的抽象程度過低,建立模型的復雜度就會很高,會遇到數據缺乏、資源和時間不足、知識體系尚未建立等一系列問題.因此,計算實驗方法的發展需要不斷在建模靈活性與結論可信性之間尋求平衡,設計更加通用的實驗設計與分析方法,為復雜系統的分析、設計、管理、控制和綜合等問題提供新的且有效的計算理論和方法.