賈麗麗
網(wǎng)絡化時代的發(fā)展中,傳輸技術以及數(shù)字技術等高新科技的蓬勃發(fā)展,使得社會發(fā)展整體表現(xiàn)出信息碎片化的趨勢,對社會生活的各個方面帶來重要的影響作用。碎片化信息在表現(xiàn)形式方面更加隨機與靈活,并且隱含著豐富的信息,人們很容易獲取或傳播,但碎片化資源零碎,缺乏權威驗證。因此,碎片化信息往往是片面的、不完備的、甚至會背離事實。針對碎片化信息零碎和缺乏驗證的問題,部分學者開展了大量有意義的探索,如:利用知識地圖來整合碎片化知識;通過構建個人知識管理網(wǎng)絡平臺來增強個人知識管理;經(jīng)由專家系統(tǒng)來實現(xiàn)知識的加工以及推理分析。這些碎片化知識整合方法有助于用戶從碎片化信息中獲取有效的知識。隨著互聯(lián)網(wǎng)、信息科學、人工智能等技術的進一步發(fā)展,碎片化信息海量且復雜,有價值的碎片化知識提取難度愈來愈大。因此,研究如何提取海量碎片化信息形成有效知識尤為迫切。
現(xiàn)階段,在人工智能以及機器學習等高端國際會議中,出現(xiàn)很多與知識推理以及知識圖譜相關的研究成果。文獻[1]明確,能夠參照推理背景的差異將知識推理區(qū)分是傳統(tǒng)模式以及面向知識圖譜模式兩大類型;文獻[2]具體將知識圖譜相關的知識推理區(qū)分是基于潛在特征以及基于圖特征兩類的向量模型,后者能夠由知識圖譜內直接獲取到需要的邊特征信息,并且更好地對其余可能出現(xiàn)的邊進行預測與分析。文獻[3]ComplEx 模型對非對稱關系語義的捕捉以及預測效果,顯性的考慮知識圖譜中的非對稱關系,有利于提高推理效果。文獻[4]提出的多任務神經(jīng)網(wǎng)絡體系結構,能夠學習實體、關系和屬性的表示。該方法設計了兩個神經(jīng)網(wǎng)絡,包括關系網(wǎng)絡和屬性網(wǎng)絡,其中關系網(wǎng)絡對知識圖譜的結構和關系進行建模,屬性網(wǎng)絡對三元組頭尾實體和實體對應的屬性進行建模。文獻[5]明確神經(jīng)網(wǎng)絡具備更好的泛化分析以及學習推理的能力,不僅能夠學習海量的文本語料,緩解大規(guī)模知識圖譜帶來的數(shù)據(jù)爆炸問題,并且可以直接建模知識圖譜事實元組,降低了計算難度,甚至還能通過合理設計和使用輔助存儲單元,在一定程度上模擬人腦推理和思考問題的過程。目前,碎片化知識的智能推理方法研究較少,基于神經(jīng)網(wǎng)絡算法對碎片化知識進行智能推理將是一個很有前景的方向。
綜上可見,海量碎片化知識智能推理方法研究相對較少,成果有限。汪建基等[6]拉開網(wǎng)絡化人工智能以及碎片化知識處理的新篇章,為后續(xù)更好地實現(xiàn)相關研究工作打下堅實根基,并且指明后續(xù)研究中需要處理的科學問題。例如,怎樣由海量的碎片化知識內獲得需要的知識內容來幫助人工智能系統(tǒng)擁有更強大的智慧分析能力?怎樣基于海量碎片化信息實現(xiàn)良好的知識演繹以及機器推理分析?尤其是這些年碎片化信息整體表現(xiàn)出指數(shù)爆炸的增多變化趨勢,上述問題的解決對充分挖掘、利用碎片化信息具有重要意義。
通過知識圖譜建立了碎片化知識的的關系,關聯(lián)規(guī)則挖掘是實現(xiàn)關系數(shù)據(jù)庫構建以及信息存儲相關的重要規(guī)律,故而,基于粒計算的關聯(lián)規(guī)則挖掘算法可以更加便捷、高效地由碎片化信息內獲取到具備良好信息價值效果的知識內容。
該算法是粒度算法以及Apriori 算法的升級與完善,能夠更加便捷地由海量信息內得到需要的頻繁項集,獲得有價值信息。該算法具體流程分以下幾個步驟:
首先,輸入知識圖譜信息表,設定合適的最小支持度,參照知識簇具備的特征情況來實現(xiàn)信息表的粒化處理,得到粒向量grc={a1,a2,......},期間,a1=
其次,利用如下程序:

對向量ai 轉化,轉化成矩陣,根據(jù)矩陣壓縮的Apriori 算法獲得cgi的支持度。
最后,需要實現(xiàn)粒度空間相關的調整處理,將所得到的粒度向量進一步轉變是矩陣的表現(xiàn)形式,完成矩陣的壓縮以及連接處理,得到需要的頻繁項集;針對頻繁項集實現(xiàn)深入分析,進而獲得有價值知識。
綜上,基于粒計算的關聯(lián)規(guī)則挖掘算法研究碎片化知識圖譜模型識別、抽取任意主題下的概念、實例、屬性和關系方法。建立用戶檢索意圖模型,通過用戶檢索希望獲取的信息挖掘碎片化知識,通過學習挖掘,由知識圖譜內得到隱藏的價值內容,從而形成關鍵有效知識。
基于圖卷積神經(jīng)網(wǎng)絡與注意力機制相結合的知識圖譜推理方法,對碎片化知識的學習挖掘進一步補充完整,從而使碎片化知識與傳統(tǒng)知識結合形成完備的知識體系。
圖卷積神經(jīng)網(wǎng)絡(GCN)與注意力機制(Attention)相結合的知識圖譜推理方法是利用注意力機制對知識圖譜中的實體與其鄰域實體進行相關性計算,得到實體特征向量;接著通過圖卷積神經(jīng)網(wǎng)絡的參數(shù)共享技術學習實體的所有鄰域實體特征;最后將實體特征和關系特征進行特征融合,得到每個實體的隱性特征向量。知識圖譜推理對發(fā)現(xiàn)錯誤信息、挖掘隱藏信息起了很大的促進作用。解決利用神經(jīng)網(wǎng)絡進行知識圖譜推理無法有效衡量實體間相關性的問題,并使用ComplEx 作為打分函數(shù),通過顯性考慮知識圖譜中的非對稱關系,以提高知識圖譜推理的準確性。
圖卷積神經(jīng)網(wǎng)絡與注意力機制相結合的知識圖譜模型主要包括注意力層的設計、圖卷積層的設計、特征融合、實體分類、鏈接預測這五步。通過對知識圖譜的推理,對碎片化知識的學習挖掘進一步擴充完善,從而使碎片化知識形成完備的知識體系。

圖1 圖卷積神經(jīng)網(wǎng)絡與注意力機制相結合的知識圖譜模型框架
碎片化知識隨時空信息不斷變化,其圖譜結構也因此而呈現(xiàn)出動態(tài)轉變,進而推出基于潛在向量轉化卷積神經(jīng)網(wǎng)絡模型相關的自動演進算法,以便能夠更好地分析時空信息持續(xù)變化的情況下圖譜結構的變化表現(xiàn),分析碎片化知識在時空變化情況下的知識更新,形成動態(tài)碎片化信息的完備知識體系。
經(jīng)由知識圖譜內存在的隱含知識相關的推理研究,可以更大程度上完成知識覆蓋面的拓展與發(fā)展,積極處理非完備性相關的問題情況,達成良好自動演進的發(fā)展目標。文獻[7]基于潛在向量轉化神經(jīng)網(wǎng)絡模型相關的自動演進算法,把神經(jīng)網(wǎng)絡內的中間層進一步區(qū)分是卷基層、池化層以及全連接層,更好地完成實體的挖掘與分析處理。

圖2 基于潛在向量轉化卷積神經(jīng)網(wǎng)絡模型訓練與測試框架
圖2左側從用戶生成平臺獲取的兩種類型碎片化知識,分別為非結構化本和知識圖譜,通過不同模型分別獲得實體向量,然后利用它們來訓練潛在向量轉化卷積神經(jīng)網(wǎng)絡模型,使得非結構化實體文本向量通過該模型向實現(xiàn)對實體知識圖譜相關的向量轉化處理。期間,模型涉及到輸入層、卷積層、池化層、全連接層、輸出層五部分。圖2右側把非結構化文本中實體作為輸入,經(jīng)由模型運算分析獲得需要的實體知識圖譜向量,最終經(jīng)由對PIDE 模型函數(shù)值實現(xiàn)的運算來預估新實體相關的知識三元組情況,達成自動演進知識圖譜的目標。
伴隨碎片化信息的持續(xù)增多,知識圖譜的建設也在持續(xù)地動態(tài)變化,需要對知識圖譜內可能呈現(xiàn)的隱含信息進行準確地預估與分析,加大其知識覆蓋面,進而實現(xiàn)良好的知識演進目標。
本文基于粒計算的關聯(lián)規(guī)則挖掘算法從碎片化知識圖譜中提取隱含的、潛在有用的信息,從而形成關鍵有效知識。其次,基于圖卷積神經(jīng)網(wǎng)絡與注意力機制相結合的知識圖譜推理方法,對碎片化知識的學習挖掘進一步補充完整。最后,基于潛在向量轉化卷積神經(jīng)網(wǎng)絡模型訓練和測試動態(tài)變化情況下的碎片化知識,形成各領域的關鍵有效知識和完備的知識體系,以及知識自動化推理演繹。形成關鍵有效知識和完備的知識體系,實現(xiàn)碎片化知識的有效處理和高效應用,為各個領域更好地構建完整知識體系提供強大的技術與理論支持。