孫明霞,桓明姣,劉 超,梁春華,潘若癡,蔚奪魁
(中國航發(fā)沈陽發(fā)動機研究所,沈陽 110015)
數(shù)字孿生(Digital Twin)也被稱為數(shù)字雙胞胎,是一種新興事物。通過對國內(nèi)外有關(guān)數(shù)字孿生文獻[1-3]的研究發(fā)現(xiàn),數(shù)字孿生[4-5]具有能夠在產(chǎn)品研制的全生命周期提供工程分析和支撐決策的能力,實現(xiàn)對過去知識和經(jīng)驗的傳承與重用、對當(dāng)前狀態(tài)的評估與診斷、對未來發(fā)展的特性預(yù)估與趨勢預(yù)測,進而達到縮短周期與降低成本的目的,并將成為越來越重要的航空發(fā)動機輔助研制技術(shù)[6-7]。
2002年,美國密歇根大學(xué)Michael Grieves等[8]在Product Lifecycle Management課程上最早提出“與物理產(chǎn)品等價的虛擬數(shù)字化表達”的概念,這是數(shù)字孿生定義的萌芽;2010年,NASA在其技術(shù)路線圖中采用了這一概念[9];2012年,數(shù)字孿生概念被提議用于NASA飛行器[10]和下一代戰(zhàn)斗機[11];美國國家標準與技術(shù)研究院提出了MBD(基于模型的定義)和MBE(基于模型的企業(yè))的概念;2015年之后,世界各國分別提出國家層面的制造業(yè)轉(zhuǎn)型戰(zhàn)略。隨著對數(shù)字孿生的研究與認識的不斷深化,美國的NASA、空軍等政府機構(gòu)、工業(yè)部門、大學(xué)以及咨詢機構(gòu)[12-14],先后提出了數(shù)字孿生的定義[15-17],但是該定義目前來看數(shù)量龐大但還未統(tǒng)一[18-20]。
通過對搜集到的64個典型數(shù)字孿生定義的文獻發(fā)表規(guī)律的統(tǒng)計分析發(fā)現(xiàn),文獻發(fā)表數(shù)量隨時間的推移呈現(xiàn)逐步收斂的態(tài)勢;;通過對64個典型數(shù)字孿生定義內(nèi)容要素的統(tǒng)計分析發(fā)現(xiàn),定義內(nèi)容要素基本一致。說明通過統(tǒng)計分析獲得數(shù)字孿生定義的條件已經(jīng)基本具備。本文通過對數(shù)字孿生定義要素進行統(tǒng)計分析和內(nèi)容研究,確定其定義的共性要素和核心要素,并建立基于共性要素的通用數(shù)字孿生定義模型,針對模型的核心要素進行詞匯和詞頻的統(tǒng)計分析與詞匯聚類,得到較為全面和相對準確的數(shù)字孿生定義。
在EI數(shù)據(jù)庫中,輸入檢索式“TI=‘digital twin’OR‘digital twins’AND LA=English NOT CO=China”(題名包括“digital twin”或“digital twins”,語言為英語,國家排除中國),共檢索到包括期刊論文和會議論文等文獻載體的有關(guān)數(shù)字孿生的文獻2360篇。在互聯(lián)網(wǎng)搜索引擎以及中國知網(wǎng)、萬方、重慶維普等數(shù)據(jù)庫中,輸入檢索式“‘?dāng)?shù)字孿生’或‘?dāng)?shù)字孿生體’”,共檢索到包括科技報告、企業(yè)白皮書、標準等文獻載體的有關(guān)數(shù)字孿生的文獻99篇。從這些文獻中,提取出典型的數(shù)字孿生定義64個,其定義的具體內(nèi)容和來源機構(gòu)見表1。在64個定義中,雖然有一些定義是來自同一個機構(gòu),但是卻代表了這一機構(gòu)不同時期不同提出人對數(shù)字孿生的理解和認識。

表1 數(shù)字孿生定義采樣匯總(續(xù)表)

表1 數(shù)字孿生定義采樣匯總(續(xù)表)

表1 數(shù)字孿生定義采樣匯總(續(xù)表)

表1 數(shù)字孿生定義采樣匯總(續(xù)表)

表1 數(shù)字孿生定義采樣匯總(續(xù)表)
有關(guān)數(shù)字孿生文獻按發(fā)表時間的分布如圖1所示。從圖中可見,數(shù)字孿生的概念和內(nèi)涵研究目前可能已達到峰值,甚至有所回落。64個典型數(shù)字孿生定義采樣按發(fā)表時間的分布如圖2所示。從圖中可見,關(guān)于數(shù)字孿生定義的公開發(fā)表時間主要集中于2017~2019年,2020年之后的文獻數(shù)量明顯減少。對64個典型數(shù)字孿生定義內(nèi)容要素的統(tǒng)計分析發(fā)現(xiàn),定義內(nèi)容要素基本一致。從文獻基本內(nèi)容來看,數(shù)字孿生已經(jīng)在航空航天、機械電子、城市運行等行業(yè)從概念討論發(fā)展到應(yīng)用探索階段,大量文獻的研究重心已經(jīng)從概念闡釋向應(yīng)用實踐方向轉(zhuǎn)移。此外,隨著數(shù)字孿生如火如荼的發(fā)展,在2020年之后美國和俄羅斯相繼發(fā)布了國家標準和行業(yè)標準。因此,綜合對數(shù)字孿生相關(guān)文獻發(fā)表規(guī)律、數(shù)字孿生定義文獻發(fā)表規(guī)律、數(shù)字孿生定義內(nèi)容要素的統(tǒng)計分析與內(nèi)容研究判斷,有關(guān)數(shù)字孿生定義的爭論和探索呈現(xiàn)收斂趨勢。說明通過統(tǒng)計分析獲得數(shù)字孿生定義的條件已經(jīng)基本具備。

圖1 數(shù)字孿生文獻按發(fā)表時間的分布

圖2 數(shù)字孿生定義按采樣發(fā)表時間的分布
數(shù)字孿生64個定義來自于不同文獻類型和不同來源單位,其分布如圖3所示。

圖3 數(shù)字孿生定義文獻類型和來源單位的分布
在數(shù)字孿生定義的文獻載體中,論文占比46.9%,主要來自于政府實施數(shù)字孿生規(guī)劃、軍方引領(lǐng)行業(yè)發(fā)展和高校理論研究過程中關(guān)于數(shù)字孿生的總結(jié);產(chǎn)品手冊、白皮書占比20.3%,主要來自于企業(yè)或咨詢機構(gòu)對數(shù)字孿生實踐過程中得到的實施數(shù)字孿生的經(jīng)驗以及對數(shù)字孿生定義的總結(jié);科技報告、PPT和講座占比12.5%,主要來自于學(xué)會和咨詢機構(gòu)基于不同目的對數(shù)字孿生定義進行梳理和統(tǒng)計。在數(shù)字孿生定義的發(fā)布單位中,高校占比43.8,包括美國國防采辦大學(xué)、賓夕法尼亞大學(xué)、密歇根大學(xué)等;企業(yè)占比35.9%,包括西門子、GE和ANSYS等大型公司;學(xué)會和機構(gòu)占比14.1%,包括AIAA、德勤和IEEE等知名學(xué)會和咨詢機構(gòu);政府和軍方占比6.3%,包括NASA、美國空軍和美國國家標準與技術(shù)研究院等代表國家意愿的權(quán)威機構(gòu)。
從以上統(tǒng)計和分析可見,定義采樣樣本具有全面性和典型性。
通過內(nèi)容分析對64個數(shù)字孿生定義中的實詞進行拆分、歸類和詞頻統(tǒng)計,發(fā)現(xiàn)在64個定義中有些內(nèi)容要素相對統(tǒng)一。這些內(nèi)容要素可以被視作為共性要素,主要集中在實體、虛體、動作、數(shù)據(jù)、方法、技術(shù)和手段、模型特征、關(guān)鍵結(jié)果(KR)和目標(O)共8種。數(shù)字孿生定義共性要素的詞頻統(tǒng)計結(jié)果見表2。

表2 數(shù)字孿生定義共性要素的詞頻統(tǒng)計結(jié)果
從表中可見,定義中涉及實體、虛體、動作和數(shù)據(jù)的4種共性要素占比較高,可以被看作共性要素中的核心要素。嘗試建立基于共性要素的通用數(shù)字孿生定義結(jié)構(gòu)模型,如圖4所示。

圖4 數(shù)字孿生定義結(jié)構(gòu)模型
由于自然語言沒有統(tǒng)一標準,在詞義相同或類似的情況下可以相互替換使用,為便于統(tǒng)計分析,依據(jù)基于共性要素建立的通用定義模型,采用詞匯聚類與文獻計量相結(jié)合的方法,對64個采樣定義中的8種要素——實體、虛體、動作、數(shù)據(jù)、方法、技術(shù)和手段、模型特征、關(guān)鍵結(jié)果和目標進行詞頻和詞匯統(tǒng)計與分析。
經(jīng)過對采樣數(shù)據(jù)統(tǒng)計,涉及實體的數(shù)字孿生定義共47條,通過對原始數(shù)據(jù)進行提煉,得到論述內(nèi)容“物理實體、物理對象、物理系統(tǒng)、物理實例、產(chǎn)品實例、實體、實例、物體”等(共8項),數(shù)字孿生定義實體部分的統(tǒng)計結(jié)果見表3,表中序號為定義文獻的編號。

表3 數(shù)字孿生定義實體部分的統(tǒng)計結(jié)果
對整理結(jié)果進行歸納,把“物理實體”、“物理實例”、“物理對象”歸納為“物理實體”;把“實體產(chǎn)品”、“實體”、“實例”、“物體”歸納為“實體”。數(shù)字孿生定義實體部分聚類統(tǒng)計結(jié)果如圖5所示。根據(jù)各項內(nèi)容的詞頻及來源文獻的重要程度,把表達實體部分的詞匯最終統(tǒng)稱為“物理實體”。

圖5 數(shù)字孿生定義實體部分聚類統(tǒng)計結(jié)果
經(jīng)過對采樣數(shù)據(jù)的統(tǒng)計,涉及虛體的數(shù)字孿生定義共33條,得到論述內(nèi)容“虛擬產(chǎn)品、數(shù)字飛行器、虛擬表達、數(shù)字模型、數(shù)字化描述、飛機的數(shù)字孿生模型”。對原始數(shù)據(jù)進行提煉,得到論述內(nèi)容“虛擬實體、虛擬模型、虛擬產(chǎn)品、虛擬表達、虛擬實例、虛擬系統(tǒng)、虛擬結(jié)構(gòu)、虛擬事物、數(shù)字實體、數(shù)字模型、數(shù)字表達、數(shù)字副本、數(shù)字系統(tǒng)、數(shù)字實例”等(共15項),數(shù)字孿生虛體部分統(tǒng)計結(jié)果見表4。其中,把“虛擬實體”、“虛擬實例”、“虛擬事物”、“虛擬結(jié)構(gòu)”、“虛擬產(chǎn)品”、“數(shù)字實體”、“數(shù)字實例”、“數(shù)字副本”歸納為“虛擬實體”;把“數(shù)字表達”、“數(shù)字表征”、“虛擬表達”、歸納為“數(shù)字表達”;把“虛擬模型”、“數(shù)字模型”、“虛擬系統(tǒng)”、“數(shù)字系統(tǒng)”歸納為“虛擬模型”。數(shù)字孿生虛體部分聚類結(jié)果如圖6所示。根據(jù)各項內(nèi)容的詞頻及來源文獻的重要程度,把表達虛體部分的詞匯最終統(tǒng)稱為“虛擬實體”。

圖6 數(shù)字孿生數(shù)據(jù)部分統(tǒng)計結(jié)果

表4 數(shù)字孿生虛體部分統(tǒng)計結(jié)果
經(jīng)過對采樣數(shù)據(jù)的統(tǒng)計,涉及動作的數(shù)字孿生定義共28條,得到論述內(nèi)容“映射、連接、數(shù)字化映射、雙向映射、交互映射、交互與共融、超寫實映射、數(shù)據(jù)交互、鏡像”等(共8項)。經(jīng)整理歸納,將論述內(nèi)容提煉為“連接、映射、交互、鏡像”,數(shù)字孿生動作部分統(tǒng)計結(jié)果見表5。根據(jù)各項內(nèi)容的詞頻及來源文獻的重要程度,把表達動作部分的詞匯最終統(tǒng)稱為“映射和鏡像”。

表5 數(shù)字孿生動作部分統(tǒng)計結(jié)果
經(jīng)過對采樣數(shù)據(jù)的統(tǒng)計,涉及數(shù)據(jù)的數(shù)字孿生定義共25條,得到論述內(nèi)容“數(shù)據(jù)、實時數(shù)據(jù)、機隊歷史數(shù)據(jù)、數(shù)據(jù)源、數(shù)據(jù)和信息、機隊歷史、動態(tài)數(shù)據(jù)、實時監(jiān)測數(shù)據(jù)、數(shù)據(jù)/視圖、模擬數(shù)據(jù)、維護和健康狀態(tài)數(shù)據(jù)、飛行器狀態(tài)、環(huán)境和特定歷史數(shù)據(jù)、知識、歷史和當(dāng)前行為、歷史和當(dāng)前行為的數(shù)字概要文件”等(共15項)。經(jīng)過對原始數(shù)據(jù)進行提煉,把“數(shù)據(jù)”、“實時數(shù)據(jù)”、“機隊歷史”、“機隊歷史數(shù)據(jù)”、“數(shù)據(jù)和信息”、“歷史和當(dāng)前行為”、“歷史和當(dāng)前行為的數(shù)字概要文件”、“動態(tài)數(shù)據(jù)”、“實時監(jiān)測數(shù)據(jù)”、“數(shù)據(jù)/視圖”、“模擬數(shù)據(jù)”、“數(shù)據(jù)、信息”、“數(shù)據(jù)源”、“維護和健康狀態(tài)數(shù)據(jù)”、“飛行器狀態(tài)、環(huán)境和特定歷史數(shù)據(jù)”提煉為“數(shù)據(jù)”,此外“知識”僅出現(xiàn)1次,數(shù)字孿生數(shù)據(jù)部分統(tǒng)計結(jié)果見表6。由于大多數(shù)的表述都可以提煉為“數(shù)據(jù)”,因此把表達數(shù)據(jù)部分的詞匯最終統(tǒng)稱為“數(shù)據(jù)”。

表6 數(shù)字孿生數(shù)據(jù)部分統(tǒng)計結(jié)果
經(jīng)過對采樣數(shù)據(jù)的統(tǒng)計,涉及方法、技術(shù)和手段的數(shù)字孿生定義共17條,經(jīng)過對原始數(shù)據(jù)進行提煉,得到論述內(nèi)容“數(shù)據(jù)分析、數(shù)據(jù)挖掘、數(shù)字技術(shù)、大數(shù)據(jù)、云計算、信息技術(shù)、可視化、移動互聯(lián)網(wǎng)網(wǎng)、人工智能、仿真、建模”等(共12項),數(shù)字孿生方法、技術(shù)和手段統(tǒng)計結(jié)果見表7。經(jīng)過對各種手段的概念的理解,將“數(shù)據(jù)分析、數(shù)據(jù)挖掘、數(shù)字技術(shù)、大數(shù)據(jù)”歸納為“數(shù)據(jù)技術(shù)”;將“云計算、信息技術(shù)、可視化、移動互聯(lián)、人工智能”歸納為“信息技術(shù)”;將“仿真、建模”歸納為建模與仿真技術(shù)。數(shù)字孿生定義方法、技術(shù)和手段部分的聚類結(jié)果如圖7所示。根據(jù)各項內(nèi)容的詞頻及來源文獻的重要程度,方法、技術(shù)和手段部分歸納為“數(shù)據(jù)技術(shù)、信息技術(shù)和建模與仿真技術(shù)”。

圖7 數(shù)字孿生定義方法、技術(shù)和手段部分的聚類結(jié)果

表7 數(shù)字孿生方法、技術(shù)和手段統(tǒng)計結(jié)果
經(jīng)過對采樣數(shù)據(jù)的統(tǒng)計,涉及模型特征包括2方面內(nèi)容,即模型復(fù)雜度和模型精度。涉及模型復(fù)雜度的數(shù)字孿生定義共14條,得到論述內(nèi)容“多物理場、多尺度、多概率仿真”、“多物理場、多尺度、多學(xué)科”、“多維度、多尺度、多學(xué)科、多物理場”等(共3項),數(shù)字孿生模型復(fù)雜度部分統(tǒng)計結(jié)果見表8。根據(jù)模型復(fù)雜度部分歸納為“多學(xué)科、多尺度、多物理場”。

表8 數(shù)字孿生模型復(fù)雜度部分統(tǒng)計結(jié)果
對于模型精度部分,經(jīng)過對采樣數(shù)據(jù)的統(tǒng)計,涉及模型精度的數(shù)字孿生定義共6條,論述內(nèi)容有“高保真、高保真度、完全和精確的”,經(jīng)過對原始數(shù)據(jù)進行提煉,得到論述內(nèi)容“高保真”和“精確”,數(shù)字孿生模型精度部分統(tǒng)計結(jié)果見表9。由于“精確”強調(diào)的也是保真度高,模型精度部分最終歸納為“高保真度”。

表9 數(shù)字孿生模型精度部分統(tǒng)計結(jié)果
經(jīng)過對采樣數(shù)據(jù)的統(tǒng)計,涉及關(guān)鍵結(jié)果的數(shù)字孿生定義共10條。經(jīng)過對原始數(shù)據(jù)進行提煉,得到論述內(nèi)容“反映狀況、模擬行為、預(yù)測狀態(tài)、控制過程、指導(dǎo)實踐、支撐決策”等(共6項),數(shù)字孿生關(guān)鍵結(jié)果部分統(tǒng)計結(jié)果見表10。根據(jù)各項內(nèi)容的詞頻及來源文獻的重要程度,關(guān)鍵結(jié)果部分歸納為“預(yù)測狀態(tài)和支撐決策”。數(shù)字孿生關(guān)鍵結(jié)果部分聚類統(tǒng)計結(jié)果如圖8所示。

圖8 數(shù)字孿生關(guān)鍵結(jié)果部分聚類統(tǒng)計結(jié)果

表10 數(shù)字孿生關(guān)鍵結(jié)果部分統(tǒng)計結(jié)果
經(jīng)過對采樣數(shù)據(jù)的統(tǒng)計,涉及目標的數(shù)字孿生定義共12條。經(jīng)過對原始數(shù)據(jù)進行提煉,得到論述內(nèi)容“加快進度、提升指標、降低成本、提高效益”等(共4項),數(shù)字孿生目標部分統(tǒng)計結(jié)果見表11。根據(jù)各項內(nèi)容的詞頻及來源文獻的重要程度,目標結(jié)果部分歸納為“加快進度、提升指標、降低成本”。

表11 數(shù)字孿生目標部分統(tǒng)計結(jié)果
通過前文對64種定義的分析提煉,可以得出以下數(shù)字孿生定義。
由核心要素可以得到數(shù)字孿生宏觀定義:數(shù)字孿生是通過對物理實體建模與仿真,建立物理實體與虛擬實體的數(shù)據(jù)交互映射,從而以虛擬實體反映物理實體的狀態(tài)。
由所有要素可以得到數(shù)字孿生的微觀定義:數(shù)字孿生是采用先進建模與信息技術(shù)對物理實體進行多學(xué)科、多物理場、多尺度、多概率、高保真度的仿真,采用先進數(shù)據(jù)技術(shù)和信息技術(shù)實現(xiàn)物理實體與虛擬實體全生命周期的數(shù)據(jù)交互映射,以預(yù)測物理實體狀態(tài)并支撐優(yōu)化決策,從而加快進度、提高指標、降低費用。