洪海波 鐘珂珂 劉驍佳 劉普林 王寧



摘 要:機器可讀標準是當前國內(nèi)外標準數(shù)字化轉(zhuǎn)型的發(fā)展方向和研究重點。本文從機器可讀標準的基本概念出發(fā),闡述機器可讀標準的基本定義和發(fā)展階段,提出機器可讀標準在航天智能制造中的應用方法,最后以運載火箭焊縫質(zhì)量智能判讀為對象打通機器可讀標準的建模、轉(zhuǎn)化以及應用全鏈路,初步實現(xiàn)了焊縫缺陷判讀標準由單純的文本閱覽向知識驅(qū)動工業(yè)場景的模式轉(zhuǎn)變,為機器可讀標準在航天領(lǐng)域的應用提供指導。
關(guān)鍵詞:標準數(shù)字化,機器可讀標準,智能制造,知識圖譜,無損檢測
DOI編碼:10.3969/j.issn.1002-5944.2023.16.006
0 引言
近年來,航天產(chǎn)品裝備制造業(yè)持續(xù)推進數(shù)字化轉(zhuǎn)型,企業(yè)的制造成本、效率大幅改善,效益空前提升。標準是指導產(chǎn)品研制生產(chǎn)和企業(yè)運營管理等行為的依據(jù)和原則,在企業(yè)數(shù)字化轉(zhuǎn)型的背景下如何滿足航天事業(yè)發(fā)展對標準制定效率、使用方式等方面的需求,成為國內(nèi)外標準化領(lǐng)域普遍關(guān)注的問題。標準數(shù)字化轉(zhuǎn)型是實現(xiàn)智能制造的必經(jīng)之路,機器可讀標準是標準數(shù)字化的核心技術(shù)也是關(guān)鍵點,已經(jīng)成為國內(nèi)外研究數(shù)字化標準的重點戰(zhàn)略方向。
近年來,國內(nèi)外很多機構(gòu)積極部署研究機器可讀標準,發(fā)展標準數(shù)字化,取得了一定的研究成果和實踐經(jīng)驗。國際標準化組織(ISO)成立了ISO機器可讀標準戰(zhàn)略顧問組(SAG-MRS),以機器可讀標準為方向推動標準數(shù)字化工作。2021年,中共中央、國務院印發(fā)了《國家標準化發(fā)展綱要》,明確提出發(fā)展機器可讀標準、開源標準,推動標準化工作向數(shù)字化、網(wǎng)絡化、智能化轉(zhuǎn)型[1]。2022年4月,市場監(jiān)管總局(標準委)批準籌建全國標準數(shù)字化標準化工作組,圍繞標準數(shù)字化過程中的相關(guān)概念、原理、組織形式、制定程序、本體構(gòu)建、應用和服務等方面的標準化需求開展工作,推動支撐標準數(shù)字化轉(zhuǎn)型的標準體系建設與應用。汪爍對57個數(shù)字領(lǐng)域相關(guān)全國標準化技術(shù)委員會調(diào)研,分析各技術(shù)領(lǐng)域?qū)τ谛滦蛿?shù)字化標準的應用需求,53.75%存在使用形式更加數(shù)字化的標準的需求[2]。唐爽等提出了通用標準知識庫的概念,通過綜合利用信息資源整合、元數(shù)據(jù)和知識圖譜等技術(shù),構(gòu)建標準知識庫[3]。張程等分析了標準數(shù)字化標識形態(tài)和內(nèi)容對象的語義明晰化水平,提出了機器可讀標準的技術(shù)路徑和標準建模方法[4]。盡管如此,目前主要的工作仍集中于理論研究,對于如何將機器可讀標準落地,特別是與航天等高端裝備制造業(yè)結(jié)合應用,仍鮮有報道。
因此,本文從機器可讀標準的基本概念出發(fā),闡述機器可讀標準的基本定義和發(fā)展階段,在此基礎上,提出機器可讀標準的應用方法,最后以運載火箭焊縫質(zhì)量智能判讀對象介紹機器可讀標準在航天智能制造領(lǐng)域的應用實踐。期望通過本文介紹,為機器可讀標準在航天領(lǐng)域的應用提供指導,為航天標準的數(shù)字化轉(zhuǎn)型發(fā)展提供有力支撐。
1 機器可讀標準基本概念
1.1 機器可讀標準定義
相對于傳統(tǒng)的供人閱讀的紙質(zhì)或電子文檔形式標準,ISO于 2019 年提出了SMART(StandardsMachine Applicable, Readable and Transferable)標準即機器可讀標準的概念,機器可讀標準是一種技術(shù)內(nèi)容可直接由機器、軟件或其他自動化系統(tǒng)解析和使用,并以數(shù)字形式提供給應用程序或用戶自定義的方式,即在系統(tǒng)中無需人工操作即可實現(xiàn)機器可用、可讀、可解析的標準。機器可讀標準提供了一種標準新型表達方式和交付形式,具有標準文本模塊化、內(nèi)容語義化、訪問交互智能化等特征,能夠有效支撐機器執(zhí)行或解析標準內(nèi)容,甚至自主應答詢問,實現(xiàn)“標準即數(shù)據(jù)”“標準即軟件”“標準即服務”等新型標準應用模式,使標準開發(fā)者(如技術(shù)委員會專家)、標準提供者(如ISO、IEC等)、標準使用者(如市場需求方)都能受益。
機器可讀標準的提出和發(fā)展將對標準研制流程、管理模式和應用方式帶來重大改變,一方面,通過建立數(shù)字化平臺,實現(xiàn)標準的協(xié)作研發(fā)、在線審查、數(shù)字發(fā)布、快速迭代和動態(tài)更新[5]。標準制定者們可以更加專注于標準的內(nèi)容,而不必過多地關(guān)注標準的樣式、格式等。同時,標準制定者通過相關(guān)標準的自動關(guān)聯(lián)和比對,可以有效解決標準之間屬于定義、圖形和符號等技術(shù)內(nèi)容協(xié)調(diào)一致的問題。另一方面,對于標準使用者來說,通過標準機器可讀、智能關(guān)聯(lián)和精準推送,實現(xiàn)標準段落、圖形和公式等的快速檢索和獲取,提升技術(shù)人員使用標準的效率。如果將標準與機器設備、軟件工具進行集成,可以實現(xiàn)“人-機”“機-機”的互操作,例如,將標準集成到智能化產(chǎn)線系統(tǒng)中,可以使得生產(chǎn)現(xiàn)場的裝備按照標準自動執(zhí)行流程,自動應用標準中的指標、工時、模型等,提高產(chǎn)品的生產(chǎn)效率。
1.2 機器可讀標準發(fā)展階段
根據(jù)ISO提出的SMART標準概念,同時依據(jù)標準內(nèi)容與機器的交互程度,ISO與IEC合作繪制了機器可讀標準的成熟度分類模型,如圖1所示[6]。該模型將機器可讀標準的發(fā)展階段劃分為“紙質(zhì)文本”“開放數(shù)據(jù)格式”“機器可讀文檔”“機器可讀內(nèi)容”和“機器可解析內(nèi)容”5個階段。其中,第0到2級主要側(cè)重標準制定和呈現(xiàn)形式的結(jié)構(gòu)化、數(shù)字化和初級語義化檢索,第3到4級側(cè)重語義解析、互相關(guān)聯(lián)的數(shù)據(jù)流。第2級至第4級通常被認為是具有高階數(shù)字化能力的SMART標準對應模型。機器可讀標準可以廣泛應用于產(chǎn)品的設計、制造和檢驗過程中,根據(jù)不同的場景,有兩種典型的應用方式。一是信息輔助,這個主要用在設計階段,即將產(chǎn)品或工藝設計需要參照的標準以一種快速、精準的方式推送給設計人員;二是自主決策,即根據(jù)場景已有信息,自動搜索定位到相應的標準條目,并自動“判定”其是否符合標準要求,這個主要用在制造過程的監(jiān)控和產(chǎn)品質(zhì)量檢驗環(huán)節(jié)。
2 機器可讀標準實現(xiàn)方法與路徑
2.1 總體框架
機器可讀標準的實現(xiàn)方法與路徑總體上遵循“結(jié)構(gòu)化—知識化—集成化”的思路,如圖2所示。首先,將以PDF為代表的目標文本進行結(jié)構(gòu)化建模,利用結(jié)構(gòu)化工具將標準中的圖表或文字進行結(jié)構(gòu)化,生成XML文件;其次,利用知識圖譜建模工具,將XML文件轉(zhuǎn)化為知識圖譜,將標準的結(jié)構(gòu)化信息利用知識圖譜的數(shù)據(jù)庫進行管理;最后,將知識圖譜與具體的智能制造信息化系統(tǒng)結(jié)合,知識圖譜提供數(shù)據(jù)訪問接口,采用查詢方式獲得知識形式的標準內(nèi)容,通過“人-機”“機-機”交互,實現(xiàn)典型制造場景中標準數(shù)據(jù)的傳遞、判定或決策,真正實現(xiàn)標準在數(shù)字世界中的解析、認知與流轉(zhuǎn)。
2.2 機器可讀標準建模
航天產(chǎn)品制造涉及標準眾多,包括結(jié)構(gòu)焊接、鑄造等典型工藝標準,但標準間的結(jié)構(gòu)層次和技術(shù)要素具有一定的相似性。從形式上看,通常一份典型的工藝標準包括前言、主體和附錄等結(jié)構(gòu),以及標準章節(jié)條、段落、列項、圖、表、公式、注等技術(shù)要素的標簽和屬性定義。通過梳理航天產(chǎn)品制造標準,提煉其中相似性,構(gòu)建航天產(chǎn)品通用的標準標簽集,包括編碼、名稱、定義以及從屬關(guān)系等,形成描述不同技術(shù)內(nèi)容的屬性集合,建立包含標準基本信息、內(nèi)容信息和表述信息的結(jié)構(gòu)化標準模型。在此基礎上,通過建立統(tǒng)一的描述模型對每個標準條目進行表征,為標準的統(tǒng)一結(jié)構(gòu)化描述提供基礎。標準指標模型定義含6個基本元素,包括指標名、指標值、指標單位、指標級別、指標判定、指標細分類等,具體的指標模型定義如表1所示。
通過定義標準指標模型,每一個標準條目都可以描述為:[x x]的[x x]的[x x]的[x x]的[x x]指標,[x x] 單位,[x x] 級別下,[x x]的判定,[x x] 值。將以上每一個[x x]映射到表1的編號,即可得:⑥⑥⑥⑥①③④⑤②。以某運載火箭焊縫標準為例,標準指標模型描述為:在母材厚度δ≤3mm(指標細分類)的條件下,I級焊縫(級別)單個缺陷尺寸(指標細分類)≤(判定)0.5δ(值),II級焊縫(級別)單個缺陷尺寸(指標細分類)≤(判定)0.75δ(值)。
2.3 標準XML描述及生成
基于結(jié)構(gòu)化標準模型和標準指標模型,對現(xiàn)有標準的結(jié)構(gòu)層次和技術(shù)內(nèi)容要素賦予相應的標簽,通過可擴展標記語言(Extensible MarkupLanguage,XML)結(jié)構(gòu)化描述形成結(jié)構(gòu)化標準。XML建模主要分為三個步驟:(1)基于預定義模版,確定待結(jié)構(gòu)化文本的目標實體關(guān)鍵詞,預定義模版根據(jù)文本版面信息和實體信息確定,實體信息包括實體關(guān)鍵詞及實體關(guān)鍵詞對應實體值的格式信息;(2)根據(jù)實體依存關(guān)系模型與預定義模版,從候選實體值中確定目標實體關(guān)鍵詞的目標實體值;(3)基于預定義模版,對目標實體關(guān)鍵詞與目標實體值進行結(jié)構(gòu)化,生成目標結(jié)構(gòu)。
將PDF、WOR D、圖片等非結(jié)構(gòu)化的標準文件轉(zhuǎn)化為可編輯的文檔形式,基于航天產(chǎn)品結(jié)構(gòu)化標準模型,對標準文本進行識別、提取和交互式標引,分別對標準的結(jié)構(gòu)層次和技術(shù)內(nèi)容要素賦予相應的標簽,如標準名稱“< st a nd NA M E>鎂合金鑄件規(guī)范< /s t a n d NA M E >”、判斷指標“單個缺陷尺寸”、判斷符號“ ≤”等,通過結(jié)構(gòu)化工具將非結(jié)構(gòu)化標準文檔轉(zhuǎn)換成XML形式的結(jié)構(gòu)化標準,如圖3所示。
2.4 知識圖譜創(chuàng)建
知識圖譜是一種用圖模型來描述知識和建模世界萬物之間關(guān)聯(lián)關(guān)系的技術(shù)方法。相對于傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù),知識圖譜可以構(gòu)建事物關(guān)系的可計算模型,通過數(shù)據(jù)識別、發(fā)現(xiàn)和推斷事物與概念之間的復雜關(guān)系[7]。在知識圖譜的支撐下,搜索系統(tǒng)越來越智能化,搜索直達目標日益成為現(xiàn)實,集中體現(xiàn)在對搜索意圖準確理解及對搜索結(jié)果精準匹配上。
知識圖譜由節(jié)點和邊組成,節(jié)點是實體或抽象的概念,邊可以是實體的屬性或是實體之間的關(guān)系。XML形式的結(jié)構(gòu)化數(shù)據(jù)不能直接作為知識圖譜使用,需要將結(jié)構(gòu)化數(shù)據(jù)定義到本體模型之間的語義映射,再通過語義翻譯實現(xiàn)結(jié)構(gòu)化數(shù)據(jù)到知識圖譜的轉(zhuǎn)化。具體的流程為:首先確定知識表示模型,并根據(jù)數(shù)據(jù)來源選擇知識獲取手段導入知識,接著利用知識推理、知識融合、知識挖掘等技術(shù)提升已構(gòu)建知識圖譜的質(zhì)量,最后根據(jù)場景需求設計不同的知識訪問與呈現(xiàn)方法,如語義搜索、問答交互、圖譜可視化分析等,如圖4所示。
2.5 系統(tǒng)集成應用
構(gòu)建的知識圖譜通過與應用系統(tǒng)進行接口集成實現(xiàn)標準知識的搜索和利用,具體流程如圖5所示。將構(gòu)建的知識圖譜集成到REST服務中,當待處理的信息、數(shù)據(jù)輸入到現(xiàn)場應用系統(tǒng)時,現(xiàn)場應用系統(tǒng)調(diào)用REST API,REST API將參數(shù)關(guān)鍵詞輸入給知識圖譜。知識圖譜通過搜索意圖理解、目標查找、結(jié)果沉陷和實體搜索,將相關(guān)的結(jié)果信息再通過REST API結(jié)構(gòu)響應給現(xiàn)場應用系統(tǒng),最后現(xiàn)場應用系統(tǒng)根據(jù)標準反饋信息,完成信息推送或者自主判定輸出最終的評定結(jié)果。
3 應用案例
運載火箭貯箱是由箱體、瓜瓣等焊接而成,焊縫質(zhì)量是決定航天發(fā)射任務成敗的關(guān)鍵,標準在焊縫檢測質(zhì)量判定中起到關(guān)鍵作用,因此,以運載火箭焊縫質(zhì)量智能判讀為應用驗證。單位在數(shù)字射線檢測技術(shù)應用、裝備研發(fā)、缺陷圖像AI識別、云檢測等方面已開展深入研究,基于數(shù)十萬幅焊縫數(shù)字射線圖像積累,成功突破基于深度學習的缺陷圖像AI識別技術(shù),研發(fā)了智能識別軟件系統(tǒng),實現(xiàn)了運載火箭焊縫缺陷的準確識別、定位和分類。下一步,根據(jù)相應標準,判定缺陷是否在可控范圍內(nèi)。
首先采用指標結(jié)構(gòu)化模型,將依據(jù)的QJ2 698A-2 011《鋁及鋁合金熔焊技術(shù)要求》pd f格式標準中的缺陷判定關(guān)鍵信息和邏輯的轉(zhuǎn)化為XML格式,選取QJ 2698A-2011《鋁及鋁合金熔焊技術(shù)要求》中表9內(nèi)部分散狀單個氣孔、夾雜物質(zhì)量判定標準,該標準條目為表格形式,如圖6所示。將表格形式轉(zhuǎn)化為XML文件對標準進行描述,如圖7所示。在此基礎上,研發(fā)基于Python的知識提取工具,構(gòu)建標準內(nèi)容的知識圖譜,如圖8所示。
在無損檢測系統(tǒng)中我們將獲取到的缺陷的相關(guān)信息輸入到無損檢測系統(tǒng)缺陷評定界面,該系統(tǒng)調(diào)用REST API接口,然后REST API接口將缺陷參數(shù)輸入給知識圖譜,通過知識判讀、知識搜索、知識推理等找到輸入的缺陷參數(shù)所對應的知識庫的位置,并判斷出該參數(shù)是否符合該缺陷標準的要求,并將結(jié)果輸入給REST API接口。REST API接口得到知識圖譜傳遞的結(jié)果后響應給無損檢測缺陷評定系統(tǒng),最終無損檢測缺陷評定系統(tǒng)數(shù)據(jù)超標/未超標的缺陷評定結(jié)果,如圖9所示。
4 總結(jié)和展望
本文從機器可讀標準的基本概念出發(fā),闡述機器可讀標準的基本定義和發(fā)展階段,提出機器可讀標準的應用方法,同時以QJ 2698A標準為對象,打通了機器可讀標準的建模、轉(zhuǎn)化以及應用全鏈路,初步實現(xiàn)了焊縫缺陷判讀標準由單純的文本閱覽向知識驅(qū)動工業(yè)場景的模式轉(zhuǎn)變,實現(xiàn)了焊縫數(shù)字射線缺陷的自動精準評定,消除人工因素,大大提高評定效率和準確性。機器可讀標準作為標準數(shù)字化的發(fā)展方向,勢必成為航天數(shù)字化發(fā)展的重要基石,我們要從標準的設計、管理和應用上全面推進機器可讀標準,從需求出發(fā),聚焦具體的應用場景,從亟需的、成熟度高的開始做。此外,要同時解決存量和增量的問題,特別是要解決現(xiàn)存的大量的pdf文本標準轉(zhuǎn)化問題,因此需要與自然語言理解、知識圖譜等人工智能手段相結(jié)合。機器可讀標準的應用,將進一步發(fā)揮標準在航天產(chǎn)品研制生產(chǎn)中的技術(shù)支撐作用,助推航天制造數(shù)字化轉(zhuǎn)型升級。
參考文獻
[1]劉曦澤,王益誼,杜曉燕,等.標準數(shù)字化發(fā)展現(xiàn)狀及趨勢研究[J].中國工程科學, 2021, 23(6):147-154.
[2]汪爍,段菲凡,林娟.標準化工作適應全球數(shù)字化發(fā)展的必然趨勢——標準數(shù)字化轉(zhuǎn)型[J].儀器儀表標準化與計量,2021(3):1-3+14.
[3]唐爽,韓義萍,張玉,等.標準知識庫構(gòu)建研究[J].中國標準化,2020(S1):46-50.
[4]張程,龔慶,姚波,等.機器可讀標準實現(xiàn)方法研究[J].中國標準化,2022(21):56-61.
[5]于欣麗.對我國標準數(shù)字化工作的幾點思考[J].中國標準化,2022(5):7-13.
[6]汪爍,盧鐵林,尚羽佳.機器可讀標準——標準數(shù)字化轉(zhuǎn)型的核心[J].標準科學,2021(S1):6-16.
[7]郝文建,魏梅,張浩,等.標準知識圖譜的構(gòu)建與應用[J].信息技術(shù)與標準化,2021(8):44-47.
作者簡介
洪海波,博士,主要從事智能制造、物聯(lián)網(wǎng)、數(shù)字孿生、智能傳感與檢測等方面的研究。
(責任編輯:張佩玉)