張桁嘉 尤建新
(同濟大學經濟與管理學院,上海 200092)
隨著全球范圍內大數據、云計算和云服務、移動互聯網、人工智能、區塊鏈等新興技術的快速發展和實踐落地,數字孿生被廣泛應用于信息通信、工業制造等重點領域,推動制造、交通、醫療、工業等產業數字化、智能化發展。
數字孿生概念起源于Michael Grieves教授和美國國家航空航天局(NASA)技術專家John Vickers的合作。2003年,Grieves教授在密西根大學的產品全生命周期管理高管課程中提出了與物理產品或數字孿生等同的虛擬數字概念。2015年,Grieves教授構建了數字孿生概念模型,包含三個主要部分:真實空間中的物理產品、虛擬空間中的虛擬產品和將虛擬與真實產品聯系在一起的數據和信息連接。
近五年來,數字孿生日益受到國內外學術界和產業界的關注,正越來越多地被用作一種通過虛擬實體實現的、利用計算技術提高物理實體性能的手段。全球IT 研究與顧問咨詢公司Gartner連續三年將數字孿生列為關鍵戰略技術發展趨勢?!笆奈濉币巹澝鞔_提出要“探索建設數字孿生城市”,信息技術、工業生產、建筑工程、水利應急、綜合交通、標準構建、能源安全、城市發展等領域的“十四五”規劃中均涉及數字孿生相關政策,對各國民經濟領域應用數字孿生技術促進經濟社會高質量發展做出了戰略部署。
本文從科學知識圖譜的視角出發,采用CiteSpace軟件對Web of Science核心合集數據庫中數字孿生可靠性相關英文文獻進行可視化科學計量分析,梳理2017年至2022年數字孿生可靠性領域相關學者的研究成果。首先,通過發表時間、國家/地區合作網絡、機構合作網絡、發表期刊和期刊/作者共被引情況,梳理數字孿生可靠性的研究現狀。然后,基于關鍵詞共現分析、聚類分析和突現分析,從熱點演進、前沿動向等方面分析數字孿生可靠性研究的發展脈絡,以期系統地梳理數字孿生可靠性相關研究的內在關聯和演進路線,探索未來研究的發展趨勢。
科學知識圖譜法將學科研究的發展進程、演變機理以及內在邏輯關系可視化,從而發現學科發展的結構、脈絡以及規律。本文采用CiteSpace軟件對數字孿生可靠性領域的研究進行科學計量分析,具體內容包括:(1)發表時間分布。通過統計年度發文情況,了解數字孿生可靠性研究熱度的趨勢。(2)國家/地區和機構合作網絡分析??偨Y當前數字孿生可靠性研究的發展趨勢和具有突出貢獻的國家/地區和機構。(3)發表期刊分布和期刊/作者共被引分析。通過統計發文量和被引較多的期刊和學科類別,得到當前數字孿生可靠性研究的主要領域和具有突出貢獻的期刊和作者。(4)關鍵詞共現分析、聚類分析和突現分析。通過對研究樣本進行高頻關鍵詞梳理和突現詞探測,并結合關鍵詞時線圖分析該領域的熱點演進過程和研究前沿動向。
本文研究的數據來源為Web of Science核心合集數據庫,檢索語句為“‘Topic=digital twin’and‘Topic=reliability’”,語種為“English”,文獻類型為“Article”或“Proceeding Paper”或“Review Article”,檢索時間為2003—2022年,共得到初始樣本文獻283篇,剔除與研究方向不相關的文獻并進行去重處理,最終得到272篇文獻作為研究對象。
對樣本文獻的發表時間分布情況進行統計分析,發現數字孿生可靠性相關研究均發表于2017年及之后,經整理得到年發文量,如圖1 所示。2017年,數字孿生可靠性研究的年發文量僅1篇,體現了該領域研究尚處于萌芽期。2018年至2021年,年發文量逐年增加,由2018年的11篇增長到2021年的100篇。截至2022年9月,當年發文量已達到73篇。這表明數字孿生可靠性研究正日益受到重視和關注。數字孿生技術的高速發展,推動著社會經濟轉型發展,將在越來越多的產業領域擁有廣闊的應用場景,預計未來數字孿生可靠性研究的熱度會持續加速上升。

圖1 數字孿生可靠性研究年發文量
對文獻所屬國家/地區進行統計分析(表1),利用CiteSpace軟件得到國家/地區合作網絡圖譜(圖2),以了解不同國家/地區數字孿生可靠性研究的差異。根據統計結果,相關文獻共來自57個國家/地區。表1列出了相關研究發文量前16位的國家/地區,根據發文數量和中介中心性,可將其分為三個梯隊。第一梯隊為中國、美國和德國,總發文量占比分別達到20.96%、14.34%和11.03%,且中介中心性較高,表明與其他國家/地區的合作關系較強。第二梯隊為俄羅斯、意大利、英國、西班牙、韓國和荷蘭,總發文量均超過10篇,從中介中心性來看,歐洲國家與其他國家合作關系較好。第三梯隊的國家有7個,發文量在7~10篇,且從中介中心性來看,在本領域與其他國家的國際合作較少。

表1 數字孿生可靠性研究國家/地區分布(前16位)

圖2 數字孿生可靠性研究國家/地區合作網絡圖譜
通過CiteSpace軟件對樣本文獻進行機構合作網絡分析,得到數字孿生可靠性研究機構合作圖譜,如圖3所示。結果顯示,該領域主要研究機構以各國高校為主。從發文量來看,德國亞琛工業大學、芬蘭阿爾托大學、俄羅斯南烏拉爾國立大學、新加坡國立大學、美國馬里蘭大學、丹麥奧爾堡大學排名靠前。從機構合作關系來看,德國亞琛工業大學、新加坡國立大學、荷蘭代爾夫特理工大學與其他國家/地區有一定合作,其他研究機構之間沒有明顯的合作連線。這表明數字孿生可靠性領域的當前研究大多以同一國家內多家研究機構甚至單一研究機構的形式開展,各國家/地區在該研究領域的合作交流亟待加強。

圖3 數字孿生可靠性研究機構合作網絡圖譜
對樣本中“論文”或“綜述論文”類文獻發表的期刊進行描述性統計,前11 位如表2 所示。表2 顯示,國外發文量排名前三的期刊分別是Sensors、IEEEAccess和Applied Sciences-Basel。期刊類別上,相關文章發表的期刊類型也比較廣泛,包括電子電氣工程類、計算機科學與技術類、信息與通信工程類和工程制造類等。其中,電子電氣工程類期刊較多,約占總文獻的26.56%。

表2 數字孿生可靠性研究發表英文期刊情況(前11位)
通過CiteSpace得到作者共被引網絡圖譜,如圖4所示。北京航空航天大學陶飛教授、密歇根大學Michael Grieves教授和香港理工大學戚慶林博士后是被引次數排名前3的專家學者,被引次數分別為76次、43次和23次。其中陶飛教授的“Digital Twin-Driven Product Design,Manufacturing and Service with Big Data”和“Digital Twin in Industry:State-of-the-Art”以及Michael Grieves教授的“Digital Twin:Mitigating Unpredictable,Undesirable Emergent Behavior in Complex Systems”均被引用超過20次,是該領域中具有一定影響力的研究文獻。

圖4 數字孿生可靠性研究作者共被引網絡圖譜
通過CiteSpace得到期刊共被引情況如表3和圖5所示。IEEEAccess是數字孿生可靠性研究中被引次數最多的期刊,共被引次數達到77次,中介中心性達到0.12,在期刊共被引網絡中起到較為明顯的橋梁作用。 其次,International Journal ofAdvanced Manufacturing Technology、IEEE TransactionsonIndustrialInformatics和JournalofManufacturingSystems的被引次數均達到40次以上,后兩者的影響因子分別達到11.648 和9.498,是國際頂級期刊。根據中科院JCR 大類分區,共被引次數排名前10的期刊中,有9種期刊屬于工程技術類,體現了數字孿生可靠性研究在工程技術領域中具有重要地位。其余1種期刊屬于管理科學類,反映了該領域研究涉及管理科學學科知識,屬于多理論融合的綜合型研究。

表3 數字孿生可靠性研究關鍵詞出現頻次(前20位)

表3 數字孿生可靠性研究共被引期刊(前10位)

圖5 數字孿生可靠性研究期刊共被引網絡圖譜
基于CiteSpace軟件對樣本文獻進行關鍵詞共現和聚類分析,統計數字孿生可靠性領域出現頻次前20的關鍵詞,結果如表4和圖6所示。

圖6 數字孿生可靠性研究關鍵詞共現圖譜
相關文獻中,關鍵詞“digital twin”“system”“design”“reliability”“model”出現頻次均達到20及以上,屬于數字孿生可靠性研究領域的熱點。高頻詞的類別主要集中在數字孿生技術應用、系統與模型、設計與優化、可靠性分析等方面。從中介中心性的角度分析,“digital twin”“system”“design”“reliability”“model”“optimization”“framework”“reliability analysis”和“identification”的中介中心性均大于等于0.1,在整個網絡中起到較為明顯的橋梁作用。“machine learning”“fault diagnosis”“neural network”“artificial intelligence”“algorithm”“management”等高頻詞的中介中心性值較低,在一定程度上反映了數字孿生領域研究整體起步時間較晚,還未能與相關學科充分融合,但作為高頻關鍵詞,它們是數字孿生可靠性領域研究的潛在熱點。
總體來看,關鍵詞共現圖譜中共有233個節點、858個連接,網絡密度為0.0317,密度值較小,說明目前數字孿生可靠性領域的研究還未形成緊密的合作網絡。共現圖譜網絡的模塊值Q=0.5208>0.3,平均輪廓值S=0.8161>0.7,表明劃分的社團結構是顯著的且聚類是高效率令人信服的。從圖6中可以看到,類“dynamic system model”“structural health monitoring”“internet of thing”和“block chain”與高頻關鍵詞有較強的重合性,表明這些方面的研究較為廣泛且深入;類“lab-on-a-disc”“vision system”“bearing capacity”和“reliability analysis”包含的關鍵詞少且缺乏高頻關鍵詞,表明這些方向的研究還較少。
結合樣本文獻關鍵詞共現和聚類分析結果,將數字孿生可靠性研究熱點主題分為時代背景與要求、理論基礎與支持、前沿技術與應用三方面。
(1)數字孿生可靠性研究的時代背景與要求。從“industry 4”“challenge”等高頻關鍵詞可以發現,數字孿生技術是在工業4.0的時代背景下應運而生的。一方面,數字孿生有效助力工業4.0成為引領未來新生產方式的重要技術。Raza等提出數字孿生為工業4.0發展中不斷增長的需求提供了框架支持,增強了工業過程的可靠性。Kosse等探討了如何在工業4.0下運用數字孿生技術,在建筑施工領域實現高度自組織和分散生產。另一方面,由于數字孿生研究起步較晚,存在不可預見的風險和挑戰。Liu等提出數字孿生模型受限于當前技術水平還無法高保真地全面反映物理實體,往往導致預測和決策缺乏足夠的可靠性。
(2)數字孿生可靠性研究的理論基礎與支持。從“system”“design”“model”“optimization”“framework”“algorithm”“management”等高頻關鍵詞以及“dynamic system model”等類可以發現,數字孿生可靠性研究需要充足的理論基礎與支持。相關學者從系統、模型、框架、算法等方面開展了研究。Groshev等提出了機器人數字孿生系統解決方案,用于演示系統在通過不可靠和延遲鏈接遠程操作時可能面臨的問題。Yang等提出了一種基于剩余使用壽命預測的鋰離子電池可靠性數字孿生模型,并通過實驗驗證了模型在全生命周期內具有良好的準確性。Zhang等梳理了數字孿生定義的內涵和典型特征,提出了數字孿生實現的典型架構。Starozhuk等提出了可用于提升電子兼容性數字孿生測試結果可靠性的不確定性估計算法。
(3)數字孿生可靠性研究的前沿技術與應用。從“machine learning”“fault diagnosis”“internet of thing”“big data”“simulation”“reliability analysis”“identification”“neural network”和“artificial intelligence”等高頻關鍵詞,以及圖6的聚類分析可以發現,數字孿生可靠性研究具有廣泛的技術與應用發展。大數據、物聯網、人工智能等新興技術的涌現,賦予了數字孿生可靠性研究強大動能。突破數字孿生在技術與應用方面的瓶頸,提升可靠性是許多學者研究的熱點。Ibrahim 等介紹了LED 可靠性分析的機器學習實施前景、潛在挑戰和機遇,以及未來可用于LED 壽命分析的數字孿生技術。Liu等提出了數字孿生驅動的交互協作框架,以提高數控機床故障診斷的準確性。Jain等提出了用于對光伏系統進行故障診斷的數字孿生方法的設計、數學分析、仿真研究和實驗驗證。
關鍵詞時線圖可以勾勒出聚類之間的關系和聚類中文獻的歷史跨度。通過關鍵詞時線圖分析數字孿生可靠性研究熱點的動態演化特征,結果如圖7所示。

圖7 數字孿生可靠性研究關鍵詞時線圖
從圖7可以發現,從數字孿生作為關鍵詞最早出現到當前最新研究,起初以系統、框架、模型、算法等理論與相關方法的研究為主體。隨著數字孿生概念的普及和理論的發展,研究主體逐步轉為建模仿真、數據技術、診斷預測等關鍵技術,并與機器學習、大數據、物聯網、神經網絡、人工智能等新興技術相融合。近兩年來,研究落地到航空航天、工業生產、建筑工程、綜合交通、能源安全、城市發展等領域的應用實踐中,研究內容和視角也趨于多元化,但仍面臨供應鏈安全性不足、數據支撐不足、標準指引不足、應用成熟度不足、政企校聯動不足等問題和挑戰。
通過CiteSpace探測關鍵詞頻次變化率最高的突現詞,分析國內外數字孿生可靠性研究的前沿動向,結果如圖8所示。

圖8 數字孿生可靠性研究關鍵詞突現圖
2017—2018年,突現詞僅有“identification”,可以發現,說明中學者聚焦于如參數估計等數字孿生可靠性的相關算法。2019—2020年,突現詞數量劇增,從年發文量來看,這也是相關研究的快速增長期。這段時期的突現詞多為數字孿生領域的相關技術及應用,其中,“internet of thing”“cyber-physical system”“industry 4”“remaining useful life”“predictive maintenance”“virtual reality”“big data”的突現強度較高,突現持續時間都僅為1~2年,說明物聯網、信息物理系統、虛擬現實、大數據等新一代信息技術與數字孿生快速發展息息相關,并且更新迭代速度快,發展形式多樣。2021—2022年(9月),作為相關研究的持續增長期,突現詞包括“machine learning”、“multiobjective optimization”“bayesian network”“lifecycle”“future”等,說明相關學者開始運用相關技術開展多目標優化,并著手關注數字孿生在全生命周期管理的應用。整體而言,突現關鍵詞的演進趨勢和共現圖譜與時線圖基本保持一致,并且偏向于技術及應用方面的關鍵詞較多。
近年來,國家“十四五”規劃等為數字孿生發展提供了戰略引導,學術界和產業界對于數字孿生理論、技術和應用的研究不斷增加,也使得數字孿生技術在推動技術創新和產業革新,以及我國建設制造強國和數字中國中發揮著更加重要的作用。
本文通過CiteSpace軟件,對數字孿生可靠性相關研究文獻進行可視化分析,從研究現狀、熱點和前沿對當前研究進行梳理。研究發現:
(1)當前數字孿生可靠性研究的熱度不斷增加;中國、美國、德國、俄羅斯及部分歐洲發達國家在該領域的研究貢獻較多,且中國、美國、德國在該領域與他國合作關系較好,在合作網絡中發揮著關鍵作用;研究領域的重要英文期刊以工程技術方向的國際期刊為主,主要涉及電氣電子工程、計算機科學與技術、工程制造等方面。
(2)數字孿生可靠性研究的熱點聚焦于時代背景與要求、理論基礎與支持、前沿技術與應用三方面。近年來,隨著理論基礎和支撐技術的不斷成熟,研究逐步落地到航空航天、工業生產、能源安全、城市發展等諸多領域的應用實踐中,研究內容和視角日趨多元化,但仍在供應鏈安全性、數據支撐、標準指引、應用成熟度、政企校聯動等方面存在問題和不足,這是未來研究可以重點關注的問題。
(3)新一代信息技術加速更新迭代,未來的數字孿生可靠性研究要與新興技術同頻共振、緊密融合,主動探索機器學習、大數據、物聯網、信息物理系統、全生命周期管理等前沿領域與數字孿生技術的深度結合和創新發展,以應對瞬息萬變的社會和市場需求。