朱 炤 瑗,秦 昆*,關 慶 鋒,羅 萍,姚 博 睿,漆 林,周 揚
(1.武漢大學遙感信息工程學院,湖北 武漢 430079;2.中國地質大學(武漢)地理與信息工程學院,湖北 武漢 430074)
目前,已有的國際關系網絡時空演變研究多基于數年或數十年時間尺度分析國際關系網絡的演化特征,較少針對某個突發性事件或某段事件發展時期分析短時間內國際關系網絡演變;且在利用復雜網絡方法分析國家關系交互網絡時,主要利用現有的網絡統計指標與方法,較少結合網絡節點的空間屬性分析網絡演化特征?;诖耍疚奶岢鲆环N基于時間序列聚類與空間統計的國家關系交互網絡演化模式探測方法。通過構建COVID-19疫情防控期間的國家對抗關系交互網絡模型和國家依賴關系交互網絡模型,結合時間序列聚類以及空間統計的相關方法分析疫情防控期間國家關系交互網絡的統計特征、時序演化模式及其空間分布特征,以期為公共衛生危機事件中的國際關系研究提供參考。
GDELT是一個實時監測全球新聞媒體中的新聞并進行分析、編碼、儲存和發布的新聞數據庫[15],事件庫中數據共有58個字段,包含對所搜集新聞事件的文本分析結果,如暴亂、抗議、和平呼吁等。為深入研究COVID-19疫情危機對于國際關系的沖擊,同時考慮到疫情相關新聞報道的滯后性,本文獲取2020年1月-2021年3月的GDELT新聞數據作為實驗數據集。利用關鍵詞檢索(如pneumonia、NCP、virus等)從GDELT中篩選出研究時段內與疫情相關的190萬余條新聞事件數據,選取QuadClass(事件主要類型,包括:1口頭合作,2實質合作,3口頭沖突,4實質沖突)、GoldsteinScale(事件對國家產生的潛在影響,數值介于-10~10之間)、Actor1_CountryCode(參與者1的國家編碼)、Actor2_CountryCode(參與者2的國家編碼)共4個字段。
1.2.1 國家關系交互網絡構建方法 本文根據QuadClass字段對標識事件的分類方式,構建國家對抗關系交互網絡與國家依賴關系交互網絡,分別表示國家間沖突與合作事件的交互關系。若QuadClass字段的數值為3或4,則將其歸為對抗交互事件,用于構建國家對抗關系交互網絡,表示為GM=(VM,EM,lM,wM);若QuadClass字段的數值為1或2,則將其歸為依賴交互事件,用于構建國家依賴關系交互網絡,表示為GP=(VP,EP,lP,wP)。其中,點集VM和VP分別表示事件庫中與其他國家有對抗和依賴交互關系的國家集合(如果某國家在該階段不存在沖突或合作交互事件,則網絡不包含該國家節點);邊集EM和EP分別表示事件庫中國家間對抗和依賴交互關系的集合;lM和lP表示節點(本文用FIPS國家代碼表示)的標識代碼集合,其中每個標識代碼元素對應點集VM和VP中唯一的國家節點;wM和wP表示邊的權重集合,其中每個元素代表邊集EM和EP中對應邊的權重值。基于此,本文對國家事件交互網絡的權重wM與wP定義如下:對于任意兩個節點國家i和j,國家對抗或依賴關系交互網絡中連接邊的權重wij可表示為某階段內兩個國家間沖突型事件或合作型事件GoldsteinScale字段值(GSk,k為事件編號)的累加,設QM、QP分別為某階段內國家i與j沖突和合作型事件的數量,則有:
(1)
1.2.2 復雜網絡測度指標 復雜網絡可理解為由大量節點和節點之間復雜關系組成的、具有高度復雜性的網絡[16]。由于國際關系具有不確定性和時序變化隨機性,本文基于復雜網絡模型和方法構建國家關系交互網絡并進行時空特征挖掘與分析。1)平均加權度,為加權度總和與節點數的比值,可反映平均每個節點與其他節點間連接邊的強度大??;在國家關系交互網絡中,平均加權度可衡量每個國家與其他國家的平均沖突或合作交互程度。2)點度中心性(式(2)),為無向網絡中節點度與網絡中節點總數的比值,可衡量節點的社會影響力,其值越高,表明該節點的社會影響力越大。
di=deg(i)/N
(2)
式中:di為節點i的點度中心性;deg(i)為與節點i相連接的邊數;N為網絡中的節點總數。
時間序列聚類是指將任意實值型的有序數據作為一條時間序列,并將其所組成時間序列數據集分割成不同類或簇的過程[17],已被應用于心電圖分類[18]、天氣狀況預測[19]、出行模式識別[20]等諸多領域。本文利用動態時間規整的K-means時間序列聚類算法,提取疫情防控期間具有相似時序演化特征的國家節點進行分析。


圖1 DTW算法示意[23]Fig.1 Schematic diagram of DTW algorithm
1.3.2K-means時間序列聚類算法 本文在應用DTW算法度量節點時間序列之間距離的基礎上,采用K-means算法對節點時間序列進行聚類,即通過多次靜態聚類將時間序列數據劃分為不同的聚類簇[24],通過節點間的距離公式將歐氏空間中的n個節點分為K個類別(執行算法前需人為確定K值)。該算法隨機選取K個對象作為初始的K個簇的質心,將剩余對象根據距離各質心的距離分配給距離最近的簇,然后不斷循環,直至準則函數達到收斂。為確定聚類簇的數目,本文應用“手肘法”,根據誤差平方和(SSE)與K值的關系圖確定最優K值[25]。
隨著人口老齡化的不斷加劇,養老問題成為一大難題。我國人口老齡化易呈現家庭小型化、空巢化,養老模式由單一的家庭養老逐步向多樣化的社會化養老演變。
利用空間分析模型開展地緣環境空間分析,可挖掘地緣現象及其背后隱藏的空間分布規律、模式與特征[26]。為探索國家節點時序聚類結果的空間分布特征,本文應用連接統計分析方法分別對國家對抗關系交互網絡與依賴關系交互網絡的6種聚類簇分布進行局部空間自相關計算,觀察每種聚類結果是否存在集聚中心以及集聚中心的分布。局部連接統計分析方法支持基于二元變量的聚類簇空間分布模式識別,對于本文的每種聚類結果,每個國家節點的類型分為“屬于聚類簇K(簡稱B(Black))和“不屬于聚類簇K(簡稱W(White)),則相鄰兩個國家間的連接類型可分為BB、WW和BW 3種。局部BB模式連接統計可以判別屬于聚類簇K的國家節點空間分布屬于核心聚集或離散效應,識別聚類簇K中各國家節點的聚類中心。對于聚類簇K模式下的國家節點i,其局部BB模式連接統計可定義為[27]:
(3)
式中:wij為二進制空間權值矩陣(用于指定國家i與國家j是否相鄰)的元素;xi和xj分別為國家i和j的變量值(當國家屬于聚類簇K時,xi取值為1,否則取值為0)。
本文構建2020年1月-2021年3月國家對抗關系交互網絡與國家依賴關系交互網絡,然后對網絡的規模特征、統計指標進行分析,探索疫情防控期間各類演化模式中國家節點的時空分布模式,進而揭示地緣政治關系的演化和空間分布特征。
本文以月為時間尺度,統計2020年1月-2021年3月國家對抗與依賴關系交互網絡的節點數、連接邊數和平均加權度的變化,結果如圖2所示。

圖2 2020年1月-2021年3月國家對抗關系與依賴關系交互網絡指標Fig.2 Indexes of international conflict and cooperation interaction networks for each month from Jan 2020 to Mar 2021
2.1.1 網絡結構屬性度量及演化分析 對于國家關系交互網絡,節點數和連接邊數分別表示一定階段內所有國家對抗或依賴交互事件的參與國家數和國家對數量。由圖2a和圖2b可知,每月與疫情相關的依賴交互事件節點數與連接邊數均高于對抗交互事件,說明在疫情防控期間參與實質或口頭合作事件的國家一直多于參與實質或口頭沖突事件的國家,可見合作仍是各國面對公共衛生危機事件的戰略主題。從時間序列上看,2020年1-3月依賴與對抗關系交互網絡的國家節點數迅速增加,并在3月達到整個疫情防控期間節點數的最大值,期間疫情形勢的轉變導致參與疫情相關合作與沖突事件的國家增多;而在3月后,依賴與對抗關系交互網絡的節點數逐步下降,且對抗交互網絡中節點數的降幅遠大于依賴交互網絡,說明自2020年3月全球暴發疫情開始,參與沖突事件的國家逐漸減少,而參與合作事件的國家數量保持穩定,可見大部分國家基于控制國內疫情形勢的目的傾向于參與國家間的合作事件。對于連接邊數的時間序列,依賴與對抗交互網絡的連接邊數在2020年3月達到最大值后大幅下降,這表明在疫情全球蔓延后發生合作與沖突交互事件的國家對明顯減少,疫情的緊張形勢沒有引發大規模的疫情相關國家合作與沖突事件的發生。
2.1.2 網絡統計指標及演化分析 從2020年1月-2021年3月依賴與對抗關系交互網絡的平均加權度的整體變化情況(圖2c)看,每月依賴關系交互網絡節點的平均加權度均大于對抗關系交互網絡,這表明在疫情防控期間,國家參與合作事件的影響程度大于參與沖突事件的影響程度。從指標時序變化角度看,依賴與對抗關系交互網絡的平均加權度均從2020年1月開始急劇上升,在3月達到最大值,表明在疫情出現全球蔓延趨勢時,國家參與合作與沖突事件的影響力迅速提升,公共衛生危機事件的暴發導致國家間行為的影響被放大。而在2020年3月后,隨著疫情的進一步蔓延,依賴與對抗關系交互網絡的平均加權度出現下降,這表明疫情覆蓋范圍的擴張并未加劇國家間合作與沖突交互的強度,大部分國家的工作重心轉移至控制國內疫情蔓延。
2.2.1 網絡節點特征時間序列聚類數確定 本文整理2020年1月-2021年3月每月國家關系交互網絡中國家節點的點度中心性數據,建立月尺度時間序列數據集,數據結構如表1所示。然后利用DTW相似性量化方法進行K-means聚類,得到誤差平方和SSE隨聚類數K的變化結果(圖3,為直觀顯示,只選取聚類數在50以內的SSE進行可視化)。根據“手肘法”的核心思想,隨著聚類數K值的增加,時間序列樣本的劃分會更精細,每個類別內的聚合程度更高,SSE的值會減??;當K值逐漸逼近真實聚類數時(圖3拐點附近),每個類別內聚合程度的優化效果逐漸減弱,SSE的降幅隨之下降。在由對抗關系交互網絡和依賴關系交互網絡生成的時間序列樣本中,聚類數可分別確定為6~8和6~9,為便于后期對比,本文將兩種交互網絡時序數據集的K-means時序聚類數K統一確定為6。

表1 節點的點度中心性時間序列數據結構Table 1 Data structure of the time series of degree centrality for nodes

圖3 誤差平方和變化Fig.3 Changes of SSE
2.2.2 網絡節點特征時間序列演化模式聚類結果分析 為分析依賴與對抗關系交互網絡中每個聚類所包含的國家節點的普遍特征,本文根據K-means時間序列聚類算法的計算結果,提取依賴與對抗關系交互網絡各聚類中心的點度中心性時間演化序列以分析不同聚類簇的特征,結果如圖4所示。

圖4 節點的點度中心性時間序列聚類中心Fig.4 Time series clustering centers of degree centrality of nodes
(1)在依賴關系交互網絡中,總體聚類效果較明顯,不同類別間國家節點的特征差異較大,總體點度中心性由低到高依次為:聚類簇1(C1)、聚類簇6(C6)、聚類簇3(C3)、聚類簇5(C5)、聚類簇2(C2)、聚類簇4(C4)。C1中主要包括蘇丹、利比亞、哈薩克斯坦等,疫情防控期間國家節點的點度中心性普遍較低(小于0.1)且基本穩定,表明該聚類簇的國家在疫情防控期間的依賴關系交互網絡中處于邊緣地位,對合作事件參與度很低;C2中主要包括俄羅斯、英國等,在2020年2月疫情暴發后點度中心性普遍處于0.2~0.6之間,表明該聚類簇內國家在疫情防控期間的依賴關系交互網絡中處于較高地位,與較多國家共同參與合作事件;C4中僅有中國和美國,國家節點的點度中心性水平遠高于另外5個聚類簇,在2020年2-4月疫情蔓延初期,節點的點度中心性值高于0.8,后期雖呈下降趨勢,但仍明顯高于其余聚類簇,表明中國和美國在疫情防控期間的依賴關系交互網絡中處于核心地位。
(2)在對抗關系交互網絡中,C1-C5中國家節點的點度中心性強度分布具有顯著的層次特征,由低至高依次為:C1、C4、C5、C2、C3,與C6節點的點度中心性演化趨勢存在顯著差異。C1中主要包括牙買加、克羅地亞等,疫情防控期間國家的點度中心性水平普遍較低(小于0.1)且未出現大幅變化,這表明上述國家在疫情防控期間的對抗關系交互網絡中處于邊緣地位,對于沖突事件的參與度很低;C3中僅包括美國、英國,與C1、C2、C4、C5相比,在疫情各階段C3國家節點的點度中心性水平明顯較高,這表明疫情暴發后美國和英國在對抗關系交互網絡中的地位迅速提升,在2020年3月疫情全球蔓延后處于核心地位,與絕大部分國家共同參與了沖突事件;C6中僅包括中國,與其余5個聚類簇相比,C6國家節點的點度中心性水平在疫情防控期間的對抗關系交互網絡中呈明顯下降趨勢,尤其是在2020年1-2月疫情初期,C6國家節點在網絡中明顯處于核心地位,而在3月后開始被C3中的國家節點代替,點度中心性值保持在0.2~0.4,對沖突事件的參與度明顯降低。
基于上述依賴與對抗關系交互網絡的國家節點聚類結果,本文對疫情防控期間國家關系交互網絡中各國家節點演化模式的空間分布特征進行分析。
2.3.1 國家關系交互網絡節點時序聚類的可視化分析 首先對依賴與對抗關系交互網絡聚類結果進行可視化展示(圖5),可見部分聚類簇的空間分布呈現一定的聚集性。依賴與對抗關系交互網絡C1中的國家集中分布于非洲地區,表明疫情防控期間非洲地區由于檢測手段落后、檢測不及時等原因,其確診病例數和死亡人數相對較低,新聞曝光度低于其他地區。此外,在網絡中也存在較分散的聚類簇,如在依賴關系交互網絡中的C4和C5以及對抗關系交互網絡中的C3-C6,這表明在疫情防控期間,合作事件與沖突事件參與度較高的國家空間分布較分散,而參與度較低的國家往往具有空間聚集特征。

注:基于自然資源部標準地圖服務網站下載的審圖號為GS(2016)1663號的標準地圖制作,底圖無修改,下同。
2.3.2 國家關系交互網絡節點時序聚類的空間依賴性分析 空間依賴性表現為對象或要素的地理次序或地理位置導致的屬性值的相關性。為識別不同演化模式中國家節點的空間分布模式及聚集效應,判斷聚類結果在空間分布上是否存在空間依賴性,本文通過對各聚類簇中國家節點局部BB模式連接統計進行計算,識別各聚類簇中國家節點的聚集中心,觀察各聚類簇中國家節點的集中分布地區,最終得到疫情防控期間依賴與對抗關系交互網絡中各聚類簇下局部BB模式連接統計結果如圖6、圖7所示(P值表示置信水平),其中,依賴交互網絡中的C4、C5不存在局部BB模式下的顯著性聚集中心,對抗交互網絡中的C3、C4、C5、C6不存在局部BB模式下的顯著性聚集中心。結果顯示,地理位置對不同演化模式下國家節點的影響程度存在較大差異。其中,依賴關系交互網絡C1、C2、C3、C6演化模式與對抗關系交互網絡C1、C2演化模式的國家節點在空間分布上均存在顯著聚集中心。結合各聚類簇演化模式的特點可以發現,疫情防控期間國家關系交互網絡中始終處于邊緣地位的國家(即依賴關系交互網絡C1與對抗關系交互網絡C1)在空間分布上呈現聚集特征,相同演化模式下各國家節點的地理位置分布具有空間依賴性,地理位置因素與此類國家疫情相關外交事件的發生存在顯著關聯;對于網絡中處于核心地位的國家(即依賴關系交互網絡C4與對抗關系交互網絡C3、C6),其地理位置分布不具備空間依賴性,地理位置因素與該國家發生疫情相關外交事件的關聯程度相對較小。

圖6 依賴關系交互網絡國家節點聚類局部BB模式連接統計計算結果Fig.6 Local connection results of BB pattern of national node clusters in cooperation interaction networks

圖7 對抗關系交互網絡國家節點聚類局部BB模式連接統計計算結果Fig.7 Local connection results of BB pattern of national node clusters in conflict interaction networks
公共衛生與健康是人類發展的核心問題,是社會經濟發展的基礎。本文利用GDELT數據,對COVID-19疫情防控期間國家關系交互網絡進行復雜網絡挖掘與節點演化模式的時空分布特征分析,提出一種結合時間序列聚類與空間統計的國家關系交互網絡演化模式探測方法,探索疫情防控期間網絡中各國家節點的時空分布特征,為國際關系與地緣政治研究提供新的視角。主要研究結論如下:1)COVID-19疫情形勢深刻影響著國家關系交互網絡的網絡規模與結構特征,各國在疫情暴發后更傾向于參與合作類型的國家交互事件。2)基于復雜網絡模型對國家節點進行時間序列聚類,可對疫情防控期間節點的點度中心性的時序演化特征進行類別劃分,不同時序演化模式總體按照節點的點度中心性強度由高到低分布,驗證了時間序列聚類方法在探索網絡節點演化模式方面的有效性。3)不同演化模式下的國家節點在空間分布上呈現不同特征,國家關系交互網絡中處于邊緣位置的國家在地理分布上具有空間依賴性,而處于核心地位的國家分布相對較分散。4)國家關系交互網絡結構的時序演化特征可反映危機事件的發生與發展,基于新聞大數據觀察網絡變化可在一定程度上探測危機事件的發生與發展態勢,為國家應對危機事件的策略提供參考;另一方面,在疫情傳播的背景下各國之間雖然存在外交摩擦,但直接形式的劇烈沖突較少,而中國作為國家關系交互網絡中的核心國家節點,其在危機事件中與其他國家的互動是決定全球政治格局與秩序的關鍵因素。
本研究以2020年1月-2021年3月疫情傳播為例,對公共衛生危機事件中的地緣政治關系進行分析探究,可為制定國際關系政策和策略提供輔助支持。后期研究將考慮結合貿易數據及人口遷徙數據,構建公共衛生危機事件期間的地理多元流網絡,探索多層網絡中國際關系與全球地緣政治格局的演化模式及空間分布特征,為國際關系與地緣政治研究提供參考。