寧夢飛
對于構建知識圖譜并加以應用來講,圖的分布式表示尤為關鍵,本文經過對比目前廣泛應用的圖示學習模型,對現有模型存在的不合理問題進行分析,并提出基于符號語義映射的神經網絡模型,應用于學習圖分布式表示。發現該模型能夠以知識圖譜內存在的實體類關系數據為依據,運用循環神經網絡完成對符號組合的語義編碼,并最終向目標符號完成映射。
1引言
知識圖譜作為基于資源描述框架所構建的語義知識庫,在表示存儲中用實體、關系和尾實體三元組形式,實現了關系聯結實體的網狀知識結構。本文將用三元組表示事實,head表示頭實體、rel表示關系、tail表示尾實體。目前該領域相關研究中主要基于不同假設劃分為兩類模型:矩陣分解模型和隨機游走模型。盡管這兩類建模思路,應用于標準數據集測試效果顯著,但是仍然存在較差泛化能力、模型理論基礎不完備等問題。所以開展對基于符號語義映射神經網絡模型的知識圖譜表示學習算法研究。
2符號語義映射模型
2.1符號系統描述
多關系知識圖譜可以視作三維二元張量,建立其中切片對應rel關系類型的鄰接矩陣,通過運用三元組表示事實,頭實體用head表示,尾實體用tail表示,實體集用表示,關系類型集合內存在的某關系類別用rel表示。
2.2基礎模型概述
本文設計的該模型主要為了解決兩方面問題:一是如何基于“導演、戰狼”標識,完成合適分類表示的構建;二是如何構建可靠預感機制,區分答案集內與“導演、戰狼”標識易混淆的成員?;赟eq2Seq模型內所獲靈感,該模型已被證實能夠經符號序列生成組合表示可行,所以具備較強解碼能力可以向對應符號系統直接映射組合表示。所以本文設計了基于SSME的模型能夠為知識圖譜內實體關系學習維實值向量表示嵌入關系如圖1所示。

2.3 SSME模型
為了能夠對同映射框架中的實體預測及關系預測任務加以處理,如上建立SSME基礎模型,并引入附加符號溯源任務模塊,負責學習由組合表示目標關系類型的映射模式。本文稱基礎模型為實體預測模塊,此模型為關系預測模塊,基本結構為編碼器結構部位。由于該模塊結構比較接近于基礎模塊,但是該模塊達到的輸出向量太小,且兩模塊參數都彼此獨立存在,所以可以將不同視角完成映射方式構造表示,定義模型損失函數定義公式如下:

式中,等式后的兩個相加部分分別表示每模塊平均交叉熵損失,且能夠互相疊加所以解釋交叉熵損失,作為針對既定輸入情況下觀察目標的概率負對數似然。展開模型訓練過程中量模塊參數能夠根據如上公式實現反向傳播更新。
3實驗分析
3.1實驗數據
對SSME完成知識圖譜擴容任務評估,通過運用基準數據集FB15K及WN18作為基準數據集,形成FB15K-237及WN18RR的擴張數據集,其中知識庫子集用FB15K表示,其中大多數數據都與密切相關電影及體育主題。由Word Net知識庫內采樣所得WN18數據集,主要包括了詞匯關系、語義概念,該類實體主要用嚴格等級方式組織。并且本研究還建立了基于復雜網絡研究領域內圖的多標簽分類(MLC)任務對SSME模型有效性進行評估。
3.2實驗設置
由于篇幅僅說明本次實驗的2個目的,一是對SSME模型基于知識圖譜擴容任務有效性加以驗證;二是對SSME模型基于大型復雜網絡內嵌入學習能力進行驗證。
3.3知識圖譜擴容任務
經測試所得數據集試驗結果,根據該結果能夠發現4個數據集中,SSME模型較其他模型具備較強指標優勢,包括1、3、10P@N指標。假若考慮FB15K中P@1預測精準度,較ConvE模型、CompIEx模型,SSME模型明顯超出19.10 %、32.33 %,十分明顯模型優勢。表示了SSME訓練得到嵌入學習能力,能夠有效提升Freebase知識庫等下游應用程序性能。
4結束語
綜上所述,經過本次對基于符號語義映射神經網絡模型的知識圖譜表示學習算法的研究。通過建立SSME模型發現該模型,能夠以知識圖譜內存在的實體類關系數據為依據,運用循環神經網絡完成對符號組合的語義編碼,并最終向目標符號完成映射。