Research on Standard Development for Smart Home Product Quality and Safety Leveraging Event Logical Knowledge Graph
YANG Yuexiang1 ZHENG Huaicheng1 LIU Xuewen1 LIN Ruiting1* XU Yingcheng2
(1.agement,ChinaUnversityMiningandTechnology(Beijing);2.ChinaNationalInstituteStandardization) Abstract:[Objective]Toaddresstheneedfordevelopingqualityandsafetystandards forsmarthomeproducts,this study constructs an event logical knowledge graph for smart homequalitysafety.This framework provides knowledge support including product hazardsandaccidentcausationchains to enhance theapplicabilityandscientific robustnessrelevant standards.[Methods]Leveraging asmart home qualitysafety incident ontology,thestudy implemented atop-downknowledge extractionmethodologythroughsequentialpases:eventtypeidentification,inter-eventrelationshipextractionndeent element retrieval. Applying event generalization techniques,an abstract event logical knowledge graph was constructed, enablingstorageandvisualanalyticscausationchainsand incidentknowledge.[Results]Thedeveloped knowledge graphcan ffectivelycapturecomplexsafetyincidentevolutionlogicandfacitatesin-depthanalysisandreasoningonqualitysafetyisues. [Conclusion]Thiseventlogical knowledge graphdeliverstheoreticalfoundationsandtechnical frameworksfordevelopingsmart home productqualityandsafetystandards,advancingtheirscientifcbasiswhiledemonstratingsignificantpracticalaplicability. Keywords: smart home; quality and safety; event logical knowledge graph; standard development
0 引言
近年來,智能產品發展迅速,以智能家居、智能家電為代表的智能化產品是消費品的重要組成部分,并占據了智能產品領域較大市場份額。然而,智能家居產品在使用過程中可能由于自身功能安全問題或自身缺陷引發質量安全問題事件發生,從而對消費者生命健康、財產安全造成不同程度的損害。目前,智能產品相關的質量安全風險控制技術還不成熟,難以對潛在風險進行全面識別、準確研判和有效控制。此外,現有標準體系不健全,重要技術標準缺失,難以形成統一規范。因此,圍繞智能家居質量安全問題開展標準研制,已成為我國亟待解決的現實問題。
2012年,谷歌首次提出了知識圖譜(KnowledgeGraph,KG)概念,之后國內外多個研究機構建立了大規模的通用知識圖譜,如DBpedia、YAGO [2-3] 1Freebase4、百度知心、搜狗智立方等。知識圖譜可以滿足現階段產品制造領域對知識獲取高效率和輔助生產制造決策的需求[5-6]。事理圖譜(EventEvolutionalGraph,EEG)由Li等提出,是以事件作為基本知識單元、事件及事件之間事理關系和模式為知識組織形式而構成的事理邏輯知識庫[8]。與知識圖譜相比,事理圖譜以事件為核心,更加注重事件之間的演化邏輯和發展規律,不僅可以幫助人們快速掌握事件的變化方向,還有助于挖掘事件的發展規律[9-10]
近年來,事理圖譜和知識圖譜研究主要集中在金融、輿情[-12]安全[13-14及工業[5]等領域。郭恒等面向非結構化高速列車多域維修數據,構建了多域數據融合的高速列車維修性設計知識圖譜;肖發龍等面向變電站設備故障數據構建多模態信息融合的語義知識圖譜,實現變電站設備的自主預警診斷;周彬等從設備點檢故障文檔中提取事件知識,構建故障運維因果知識圖譜,為故障運維中根因分析提供了更堅實的因果關聯知識。高龍等選擇某單位航空產品開展質量問題原因分類、質量事理圖譜構建、事理知識推送等應用及原型系統建設。熊奧等2提出基于知識圖譜的核電設備健康管理知識建模與分析方法,基于故障的可視化分析為維修人員和管理人員提供決策和知識支持。簡掙峰等構建產品結構幾何知識與非幾何知識語義關聯的STEP知識圖譜。
綜上所述,在產品制造領域通常利用事理圖譜對設備故障進行診斷分析,以及對質量問題原因進行事理分析,但對產品制造領域先驗知識和因果關聯信息的挖掘較少。智能家居質量安全事件中存在大量先驗知識和因果知識,能對質量安全問題進行原因追溯和風險分析。因此,本文面向智能家居產品質量安全標準研制中對風險因素查詢和分析等方面的需求,構建以知識驅動的質量安全問題事件關聯與演化為切人點的事理知識圖譜,可為智能家居產品質量安全標準研制,以及產品設計、生產制造等領域任務提供可解釋知識支撐。
智能家居質量安全事理知識圖譜構建流程
1.1整體流程
本文整體流程和框架如圖1所示,共分為數據層、圖譜構建層、展示應用層3個部分。
1.2事件本體構建
事件本體是一種以事件為核心的知識表示模型,能夠清晰描述事件、事件要素及事件之間的各類關系,是事理圖譜構建的邏輯架構[8。對本領域數據特征進行分析,從概念和關系2個部分構建質量安全問題事件領域本體,如圖2所示,圍繞人-產品-環境3個維度細化事件概念,關系部分主要為節點事件之間的語義關系和概念關系。
1.3事件類型識別
(1)事件觸發詞識別篩選
事件觸發詞通常為事件句子中的核心動詞,可以通過對事件觸發詞的識別進而識別出事件所表示的事件類型。本文首先通過依存句法分析,對事件語料中的主謂關系(SBV)、動賓關系(VOB)、前置賓語(FOB)及核心關系(HED)進行抽取篩選,對表示事件類型的核心動詞進行抽取,將核心動詞及依存于核心動詞的依存詞共同作為事件句的觸發詞。
圖1整體流程

圖2質量安全問題領域事件本體

(2)事件類型識別模型
選用TextCNN作為事件類型識別模型,因為其擁有豐富的數據表征學習能力,在捕獲局部短語特征時具有較大優勢,比較適合文本類型的分類任務。本文在進行事件類型識別時,將事件觸發詞位置進行嵌人表示,和文本語義向量進行拼接,進行事件類型識別。觸發詞位置嵌入流程如圖3所示。
1.4事件關系抽取
事件關系是指事件之間的邏輯演化關系,而事件關系抽取則是指對這種邏輯演化關系進行識別抽取。本文基于模板匹配的方式進行顯式事件關系抽取,將事件關系抽象為某些特定的模式,然后通過匹配來找到其他符合同一語義關聯對的模式和實例。事件關系提示詞歸納主要來源于語義詞典、知網相關文獻,同時結合領域數據特點,篩選用于模板抽取的事件關系抽取提示詞。在事件隱式關系抽取中,利用TextCNN模型對事件句子對的語義特征進行提取,從而完成關系判別任務。
1.5事件要素抽取
事件要素抽取任務選擇Bert-BiLSTM-CRF作為基礎模型,在此基礎上引入Attention層和Span層,多頭注意力機制層用于加強模型對輸入序列中不同位置的關注。Bert是一種預訓練語言模型(Pre-trainedLanguageModel,PLM),通過多層雙向Transformer編碼器來學習輸人文本的表示,對大規模的無標注文本數據進行預訓練,可以有效捕捉句子的上下文信息和語義關系[22]。雙向長短期記憶網絡(BiLSTM),通過特有門閥單元控制信息傳遞,有選擇地保留上下文信息,實現對上下文信息利用和對有效文本的記憶功能[23]。雙向長短期記憶網絡輸出結果會選出得分張量矩陣最大的標記作為預測結果,但不一定能組成完整實體,需要引入CRF層來解決這個問題,其能夠對雙向長短期記憶網絡輸出結果進行全局規范化,從而獲得全局最優解。
2智能家居質量安全事理知識圖譜構建
2.1數據采集及預處理
本文數據來源如表1所示,以產品、相關組件,及類似產品的質量安全問題事件為目標,2008—2023年,共爬取事件案例數據10767條,并篩選得到2030條強相關數據。
圖3觸發詞位置嵌入表示

表1數據來源類型

在對事件句子進行事件類型識別、事件關系抽取及事件要素抽取之前,需對句子語料完成數據預處理工作,包括分句、分詞和詞性標注等流程。本文采用兼具依存句法分析和語義角色標注的LTP工具對事件句進行了數據預處理。
2.2圖譜構建
2.2.1事件類型識別
利用前文所述事件類型識別方法,共標注了3755條數據,各參數設置值如表2所示。整體結果如表3所示,各分類結果如表4所示。由表3結果可知,僅將核心動詞作為事件觸發詞,并將其位置特征嵌人TextCNN模型中進行訓練, R 值和F1值較僅使用TextCNN模型有小幅度提升,但是同時將核心動詞和依存詞共同作為事件觸發詞,并將其位置特征嵌入TextCNN模型中進行訓練,三值都較其他2個方法有了大幅度提升;由表4各分類結果可以看出,同時將核心動詞和依存詞的位置特征嵌入TextCNN模型的方法,對各類型的分類效果都較均勻,而其余2種方法在對人因層事件類別的分類中,效果表現顯著低于其余分類。因此,選取將核心動詞和依存詞的位置特征嵌人TextCNN模型的方法作為事件類型識別的方法,完成事件類型識別任務。
表2參數設置

表3模型整體結果

表4模型各分類結果

2.2.2事件關系抽取
在上一步驟中,已經將質量安全問題事件劃分為以事件本體為依據的節點事件,2個節點事件構成候選節點事件對,對候選節點事件之間的關系進行抽取。根據數據特點可見,智能家居質量安全問題事件之間的關系主要包括因果關系、條件關系、順承關系及并列關系,對這4類關系的說明如表5所示,其中以因果關系和條件關系為主,具有明確關系提示詞的句子在4類關系中占多數。因此,對因果關系和條件關系的抽取分為顯式關系和隱式關系,對順承關系和并列關系統一采取隱式關系抽取方法進行抽取。
表5事件關系類型說明

在得到模板匹配后的事件關系對后,對模板匹配事件對關系判別的準確率進行統計分析,統計結果如表6所示,在本文候選的680對事件對中,通過事件關系匹配模板匹配得到事件對為365對,沒有通過事件關系匹配模板的事件對為315對。
表6顯式事件關系抽取結果

隱式關系標注數據共1712條,各參數設置如表7所示。最終算法整體結果如表8所示,各分類的結果如表9所示。模型在因果關系和并列關系的抽取效果較好,但是在條件關系和順承關系中部分抽取效果較差。原因是條件關系和順承關系的數據量較少,而因果關系和并列關系的數據量較大,造成不同類別之間效果差異較大。
表7Bert-textcnn模型參數設置

2.2.3事件要素抽取
智能家居質量安全問題事件要素主要指質量安全問題事件發生過程中關鍵節點事件的描述,具有動態變化的特點,主要包括事件的實體及其屬性和事件變化具體形式。本文在前述章節定義了質量安全問題事件本體,此處基于事件本體,對本體中所涉及的事件要素進行更詳細解釋,如表10所示。
表10事件要素定義

在對應節點事件中,對相關事件要素完成抽取并組合,即可對事件進行完整描述。以上大部分的事件要素直接組合就完成了對語義的表征,但是“產品安全項目”與“安全標準”這2個事件要素之間往往用“不符合”這個詞作為語義連接詞進行事件表示。故本文在得到這2個事件要素之后,自動加上“不符合”一詞進行事件表示。
事件抽取即信息提取,可將其認為是一個序列標注任務。本文采用BMOES標注體系,引入大語言模型標注初始樣本,通過基于提示的微調方法輔助完成事件要素的標注過程。首先構建對大語言模型的相關提示問答模板,引導大語言模型理解事件要素的語義含義;其次構建適當的標注范例,輔助大語言模型進行學習;最后得到大語言模型的標注結果,結合領域知識進行人工審核校對。共得到實體標注2195條,各模型參數設置如表11所示,最終實驗結果如表12所示。由算法整體結果可知,加人Span層和Multi-Head-Attention層的模型都較基礎模型有了一定幅度的提升,其中加入Multi-Head-Attention層的模型抽取效果最好。因此選用Bert-Bilstm-Att-CRF模型來完成事件要素抽取。
2.2.4事件泛化
為了進一步得到質量安全問題事件領域的特點及演化關系,將對各節點事件進行泛化,從而總結得到質量安全問題事件領域演化特征。本文采用事件綜合相似度計算對節點事件進行泛化,綜合相似度計算同時考慮事件描述句相似度和事件要素相似度。
通過Bert編碼對事件描述句進行向量化表示,采用余弦距離來計算事件描述句相似度。事件要素相似度采用2個事件句所有事件要素之間的Jaccard系數對事件要素相似度進行衡量。在得到事件描述相似度結果和事件要素相似度結果之后,進行事件綜合相似度計算。將事件綜合相似度結果高于閾值0.5的事件對進行節點事件的泛化。
在對事件進行相似度融合之后,需要對泛化后的抽象事件節點進行命名,主要基于原事件節點描述的公共部分,同時結合領域知識,進行抽象事件節點命名,最終得到各節點事件類型對應的抽象節點。
3 輔助產品標準研制應用分析
3.1質量安全要素及風險演化路徑分析
精準識別圖譜中影響全局安全的關鍵要素及其作用機制,可為標準的針對性、優先級制定提供量化依據。本文聚焦于圖譜的節點人度和出度分析。入度突顯了哪些質量安全要素是眾多潛在風險事件的“匯聚點”,指向標準需重點防范的“脆弱環節”或“共性誘因”;而出度則識別了哪些具備強“輻射效應”的要素,其一旦發生問題可能觸發廣泛的、連鎖式的安全后果,這直接關系到標準在風險傳導路徑控制上的關鍵要求。下文將分別對節點的入度分布和出度分布進行詳細分析。
表11模型參數設置

(1)節點入度分析
以節點人度大小為標準排序進行節點大小展示,可視化結果如圖4所示。由圖4可看出,在結果事件中,觸電和起火是較易發生的關鍵事件,將光標落在任意節點,即可將該節點關聯的節點進行突出展示分析。
從關鍵事件節點觸電入度展示(見圖5)來看,系統級危險事件是最直接導致事故發生的節點事件。在系統級危險事件中,主要和觸電相關聯的事件包括觸電保護失效、接地保護失效、絕緣失效、部件腐蝕損壞、外殼帶電、部件帶電、易觸及部件成為帶電件、擊穿、帶電部件缺少可靠防護等。其中接地保護失效、部件腐蝕損壞、帶電部件缺少可靠防護、部件帶電是幾項最大概率導致觸電事件發生的直接事件。在產品層事件和人因層事件中,兩者相互作用影響,導致觸電事故的發生。最常發生的因果事件鏈有“產品缺乏必要的標識或提示內容 $$ 錯誤使用 $$ 觸及帶電部件 $$ 觸電”“基本安全項目不符合安全要求 $$ 設計制造有缺陷 $$ 觸電”“基本安全項自不符合安全要求 $$ 設計制造有缺陷 $$ 錯誤使用 $$ 觸電”。除此之外,產品層事件中導致觸電事件發生的事件主要有絕緣措施不夠、機械強度不足、部件截面積不夠、使用單個電容作為保護阻抗。

圖5關鍵事件節點觸電入度展示

圖6關鍵事件節點起火入度展示

從關鍵事件節點起火人度展示(見圖6)來看,最直接導致起火發生的系統級危險事件主要有部件損壞、部件變形、短路、溫升過高、部件過熱、絕緣老化、絕緣損壞、絕緣性能下降等。其中,部件過熱、絕緣老化、絕緣損壞、絕緣性能下降4個事件直接導致起火事件發生的概率最大。產品層事件和人因層事件中,最常發生的因果事件鏈主要有“基本安全項目不符合安全要求 $$ 設計制造有缺陷 $$ 錯誤使用 $$ 起火”“基本安全項目不符合安全要求 $$ 部件裝配不到位 $$ 起火”。除此之外,導致起火發生的產品層事件主要有產品未安裝熔斷體。人因層事件主要有長時間使用、錯誤選用部件及錯誤使用等。
(2)節點出度分析
以節點出度大小為標準排序進行節點大小展示,可視化結果如圖7所示。由圖7可看出,在原因事件中,基本安全項目不符合安全要求是較易發生的關鍵事件,其所導致的后續事件最復雜,由該節點所引發的事件所占比重最大,將光標落在任意節點,即可將該節點關聯的節點進行突出展示分析。
圖7事件出度排序展示

圖8關鍵事件節點出度展

從關鍵事件節點基本安全項目不符合安全要求(見圖8)來看,其主要可能導致的產品層事件為部件裝配不到位、未加阻燃材料、原材料不過關、部件截面積不夠、材料韌性不足、壁厚過薄、設計制造有缺陷、產品缺失必要標識或提示內容、無有效接地措施等。該層事件可能進一步導致系統級危險事件包括觸電保護失效、部件之間發生放電或短路、部件變形、溫升過高、擊穿、部件過熱、防爆性能失效、絕緣性能下降、接觸電流過大、電源內部起火、部件軟化變形等,進一步導致的事故也較為多樣,覆蓋了絕大部分事故。整體來看,節點事件中因基本安全項自不符合安全要求所導致的因果事件覆蓋面廣、種類多樣,未形成突出的因果事件鏈。
3.2產品標準研制信息查詢
標準研制的精細化要求不僅在于識別關鍵點,更在于深入理解風險事件演化的具體路徑、多因素耦合的復雜邏輯及控制措施生效的精確作用域。為了將圖譜蘊含的豐富因果鏈、關聯規則和場景邏輯直接應用于標準條文的精準化、場景化制定,需進一步借助事理知識圖譜的查詢能力。通過構造針對性的查詢,能夠直觀地映射出事理關系網絡中的具體傳導機制與約束條件,從而為制定具有針對性、可驗證性且邏輯自洽的標準條款提供直接的、可視化的決策支持,為智能家居產品質量安全標準研制提供關鍵信息,提升標準研制水平。
以下示例(見圖9)展示了基于圖譜的查詢如何服務于標準研制中的具體問題求解。通過產品名稱或產品部件進行查詢,可以得到相關致因鏈,快速掌握產品常見的質量安全問題或功能缺陷,以及消費者行為相關信息。在圖譜中檢索產品名稱為掃地機器人,得到該產品的事件致因鏈為“鋰離子電池電芯設計有缺陷 $$ 電芯短路 $$ 充電自燃”。當生產廠商在進行掃地機器人相關標準研制時,應重點關注該產品部件鋰離子電池電芯的設計問題,通過相關產品標準的制定來減少充電自燃事故發生的概率。
圖9查詢結果-產品標準研制信息查詢

4結論
本文面向智能家居質量安全標準研制時,需要掌握產品可能存在的質量安全問題及事故致因鏈等信息的需求,采集了智能家居質量安全問題事件,分析了智能家居質量安全問題領域數據特征,進行了質量安全問題事件本體構建、事件類型識別、事件及事件關系抽取等研究。通過圖譜形式實現了事件可視化,并對事理知識圖譜在智能家居產品質量安全標準研制的應用價值進行了分析。本文構建了智能家居質量安全事理知識圖譜,其蘊含的復雜關系網絡可為產品標準研制提供系統性的風險洞察和信息檢索基礎。目前的工作還存在一些不足,未來將在以下2個層次進行完善:
(1)智能家居質量安全問題事件領域數據主要來自RAPEX、CPSC等召回數據,未來可以從更多的渠道爬取更多領域數據,增加問題分析的數據量,使得結果有更強的說服力;
(2)在事件要素抽取部分,本文主要借助大語言模型輔助文本語料標注,在實際訓練過程中采取的模型主要是經典模型,未來可以考慮在實際訓練過程也借助大語言模型,訓練適用于本領域的大語言模型。
參考文獻
[1] BIZERC,LEHMANNJ,KOBILAROV G, etal. DBpedia-AcrystallizationpointfortheWebData[J].JournalWeb Semantics,2009,7(3):154-165.
[2] SUCHANEKFM,KASNECIG,WEIKUMG.YAGO:ACore semantic knowledge unifyingword netandwikipedia[C]//International Conferenceon World WideWeb.2007.
[3] HOFFARTJ,SUCHANEKFM,BERBERICHK,etal.YAGO2:A spatiallyand temporally enhanced knowledgebasefromWikipedia[J].Artificial Intelligence,2O13,194:28-61.
[4] BOLLACKERKD,EVANSC,PARITOSHP,etal.Freebase:acollaboratively created graph database forstructuringhumanknowledge[J].ACM,2008.
[5]陶家琦,李心雨,鄭湃,等.制造領域知識圖譜的應用研究現狀與前沿[J].計算機集成制造系統,2022,28(12):3720-3736.
[6]吳闖,張亮,唐希浪,等.航空發動機潤滑系統故障知識圖譜構建及應用[J].北京航空航天大學學報,2024,50(4):1336-1346.
[7]LI Z,ZHAO S,DING X,etal. EEG: knowledge base forevent evolutionary principlesand patterns[C]//Social MediaProcessing: 6th National Conference, SMP 2O17, Beijing,China,September14-17,2017,Proceedings.SpringerSingapore,2017: 40-52.
[8]鄧君,彭珺,孫紹丹,等.基于事理圖譜的游記文本知識發現:以康養旅游為例[J].現代情報,2022,42(7):105-113.
[9]劉政昊,曾曦,張志劍.面向應急管理的金融突發事件事理知識圖譜構建與分析研究[J].信息資源管理學報,2022,12(3):137-151.
[10]張詩瑩,李陽.融合事理知識圖譜與網絡輿情分析的突發事件情報支持路徑及實證研究:以危化品事故為例[J].信息資源管理學報,2023,13(4):60-71.
[11]徐海玲.基于事理圖譜的多維特征網絡輿情演化路徑研究[J].情報科學,2022,40(7):48-54.
[12]單曉紅,龐世紅,劉曉燕,等.基于事理圖譜的網絡輿情事件預測方法研究[J].情報理論與實踐,2020,43(10):165-170.
[13]劉雅姝,欒宇,周紅磊,等.基于事理圖譜的重大突發事件動態演變研究[J].圖書情報工作,2022,66(10):143-151.
[14]林穿,徐啟峰,黃奕釩.基于事理圖譜的電力安全事故預控方法[J].中國安全生產科學技術,2021,17(10):39-45.
[15]鄧健峰,王濤,程良倫.機器人故障診斷事理邏輯知識圖譜構建研究[J].計算機工程與應用,2023,59(13):139-148
[16]郭恒,黎榮,張海柱,等.多域融合的高速列車維修性設計知識圖譜構建[J].中國機械工程,2022,33(24):3015-3023.
[17]肖發龍,吳岳忠,,沈雪豪,等.基于深度學習和知識圖譜的變電站設備故障智能診斷[J].電力建設,2022,43(3):66-74.
[18]周彬,花豹,陸玉前,等.面向設備點檢故障根因分析的因果知識建模方法[J].計算機集成制造系統,2023,29(8):2708-2721.
[19]高龍,衛青延,陶劍,等.事理圖譜賦能的航空數據智能技術研究[J].航空工程進展,2023,14(2):178-190.
[20]熊奧,高暢,趙明輝,等.基于知識圖譜的核電設備健康管理知識建模與分析[J].科技促進發展,2021,17(4):640-649.
[21]簡掙峰,林崇,張立軍,等.面向設計意圖的STEP知識圖譜關鍵技術研究[J].小型微型計算機系統,2020,41(3):648-655.
[22]DEVLINJ,CHANGMW,LEEK,etal.BERT:Pre-training Deep Bidirectional Transformers for LanguageUnderstanding[J].ArXiv,2019,abs/1810.04805.
[23]葉文冰,詹仕華.基于MHA-BiLSTM的網絡流量異常檢測方法[J].現代信息科技,2024,8(2):65-69.