999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

知識圖譜新近研究進展及其在教育領域的應用挑戰

2022-11-22 10:17:42董曉曉顧恒年周東岱
數字教育 2022年5期
關鍵詞:語義研究

董曉曉 顧恒年 周東岱

(東北師范大學 信息科學與技術學院,吉林 長春 130117)

引 言

近年來,隨著大數據、人工智能等技術的迅猛發展,尤其是深度學習、知識圖譜等新一代人工智能關鍵技術的回歸和突破性發展,成為助力教育信息化 向“人工智能+”轉型的核心驅動力。知識圖譜作為一種有效支撐知識組織與分析的技術手段,最初在醫學、金融等諸多領域取得了顯著成效,伴隨著“人工智能+教育”的發展需求,教育領域也開始重視知識圖譜對教育的賦能。2017年國務院印發《新一代人工智能發展規劃》,明確提出要研究知識圖譜構建與學習、知識演化與推理等關鍵技術,構建覆蓋數億級知識實體的多元化、多學科、多數據源的知識圖譜[1]。2018年國家自然科學基金委新增設F0701教育信息科學與技術研究方向,并將“教育知識圖譜構建與導航學習”列為一項重要研究內容[2]。任友群等研究者提出在人工智能時代背景下面向不同層次教育的知識圖譜是實現個性化教育的基礎,是教育人工智能需要優先開展的基礎性工作[3]。當前我國知識圖譜研究勢頭方興未艾,然而已有研究多從技術方法視角切入研究知識圖譜的構建技術,對知識圖譜完整的生命周期缺乏系統性的梳理總結[4][5]。基于此,本研究采用定量和定性相結合的方法,首先對國內外知識圖譜研究的關注點、發展脈絡等內容進行梳理與總結,在此基礎上厘清知識圖譜構建的完整生命周期,立足教育領域確定研究框架,并對教育領域知識圖譜的未來研究做出展望,以期促進我國教育知識圖譜研究的發展。

一、文獻來源與關鍵詞分析

為有效獲取國內外知識圖譜的高質量研究文獻,研究以“知識圖譜”(knowledge graph)為關鍵詞在中英文權威數據庫檢索文獻。中文文獻以關鍵詞、篇名或摘要中含有“知識圖譜”為檢索規則在CSSCI期刊和核心期刊庫中進行文獻檢索;英文文獻以關鍵詞、標題、主題、摘要中含有“knowledge graph”為檢索規則在SCI、SSCI、A & HCI、CPCI收錄的期刊論文和會議論文中進行文獻檢索。檢索時間跨度為2012年至2022年。由于研究者對知識圖譜的理解和界定不盡相同,本研究通過通讀摘要的方法對檢索的文獻進行再次篩選,以保證研究樣本與研究主題的相關度。

關鍵詞體現了研究的核心內容,高頻關鍵詞則能代表該領域的研究核心關注點。表1顯示的是國內外知識圖譜研究的高頻關鍵詞表。由表1可知,相關研究以知識圖譜為核心,與人工智能領域語義網絡、知識表示、表示學習等密切相關,實體關系識別、命名實體識別、本體構建等是知識圖譜研究關注的重點,自然語言處理、本體技術、深度學習算法等技術手段為知識圖譜構建提供有力支持,問答系統、鏈路預測(學習路徑生成)等功能實現是知識圖譜應用的主要方向。

表1 國內外知識圖譜研究高頻關鍵詞表(前10)

二、知識圖譜研究現狀與問題

(一)知識圖譜概述

自2012年知識圖譜這一概念出現后,迅速引發了社會各界對其廣泛關注。梳理知識圖譜的發展歷程,發現其起源于20世紀60年代的語義網絡(Semantic Network),發展于本體(Ontology)和語義網(Semantic Web)。2012年企業公司發布的知識圖譜再次將這個領域帶入聚光燈下,這時的知識圖譜實現了更加智能的信息獲取和處理,然而,構建龐大而高質量的知識圖譜并不容易。

對于知識圖譜的概念界定,眾多研究者從語義知識庫角度切入,認為知識圖譜本質上是一種使用語義網絡結構組織知識的知識庫,是對知識結構的抽象表示。如有研究者認為知識圖譜由“實體1、關系、實體2”或“實體、屬性、屬性值”這樣的三元組構成的結構化語義網狀知識庫,還有研究者則認為知識圖譜是以圖的形式表現客觀世界中的實體(概念)及其之間關系的知識庫[6]。立足教育領域,可將教育領域知識圖譜理解為知識圖譜在教育領域的拓展應用,其本質是以圖的形式表示教育領域實體和實體關系的語義知識庫。

厘清知識圖譜的類型、邏輯結構和技術架構能夠幫助我們進一步認識知識圖譜。依據應用范疇,知識圖譜通常被劃分為面向全領域信息的通用知識圖譜和面向特定領域信息的領域知識圖譜兩類,通用知識圖譜強調知識信息的廣度,領域知識圖譜關注知識信息的深度。教育領域有清晰的知識結構和鮮明的領域特征,面向教育領域構建的知識圖譜屬于領域知識圖譜。此外,在領域知識圖譜研究中,研究者依據圖譜表征的對象(靜態知識或動態活動)分為靜態圖譜和動態圖譜。從邏輯結構看,主要由模式層和數據層構成,模式是抽象概括的領域知識表示,確定知識圖譜的模式是領域知識圖譜構建的核心。從構建過程看,模式構建、知識抽取、知識融合和知識更新是圖譜構建的主要流程,但通用知識圖譜通常采用自底向上構建,從底層數據中逐步歸納圖譜模式,而領域知識圖譜通常采用自頂向下構建,即先構建頂層模式后逐步向下形成圖譜。具體如圖1(見下頁)所示。

圖1 知識圖譜類型和構建流程

(二)構建流程

1.模式定義

模式是知識圖譜的框架和抽象模型,是知識圖譜構建的核心工作。不同類型的圖譜對模式的需求不同,通用知識圖譜關注知識覆蓋面的廣度,描述全面的通識性知識,通常從數據中全自動或半自動地抽取圖譜模式,該方法能夠節省一定的人力和時間,但存在準確度不高的問題;領域知識圖譜面向特定領域,對領域內容專業性和精確度要求較高,往往需要專家手工定義圖譜模式,但存在費時費力等問題。表2總結了當前知識圖譜模式定義的典型方法。

表2 知識圖譜模式定義的研究成果

2.知識抽取

節點和邊是知識圖譜的主要構成要素,節點表示真實世界中存在的概念或實體,邊表示實體及實體之間的關系,并通過屬性(值)用來描述實體的內在屬性。因此,知識抽取內容包括實體抽取、實體關系抽取和事件抽取。如表3(見下頁)所示。

表3 知識抽取的內容和方法

實體抽取有基于詞典和規則[10]、基于統計機器學習[11]和基于神經網絡[12]三種典型方法。其中基于詞典和規則的抽取方法主要由專家和語言學者手工來制定有效規則,準確率高,但工作效率低;基于統計機器學習的抽取方法需要依據大量的特征標注來保證抽取的準確性,同樣需要耗費大量的人力物力;基于神經網絡的抽取方法主要采用長短期神經網絡、卷積神經網絡等與機器學習模型相結合進行實體抽取,不需要人工標注,在大量公開數據集訓練后能獲得較好的預測性能,在一定程度上解放了人力,但覆蓋的實體類型和實體關系相對簡單。

關系抽取有基于模板[13]、基于統計學習[14]、基于神經網絡[15]和基于遠程監督[16]四種典型方法。其中基于模板的抽取方法主要是基于模式(規則)、觸發詞或字符串挖掘關系,關系抽取準確率高,但覆蓋范圍小,不適合所有關系或復雜關系的抽取;基于統計學習的抽取方法主要基于特征向量等方法從上下文信息、詞性和語法中抽取特征;基于神經網絡的抽取方法主要基于遞歸神經網絡、卷積神經網絡、循環神經網絡等方法對復雜關系結構進行特征組合,能夠在一定程度上避免特征不足的問題;基于遠程監督的抽取方法通過融合上下位等方式解決抽取語料不足的問題,但是也造成了錯誤標注和語義漂移等問題。

此外,針對事理知識圖譜的事件抽取是指將實體和實體關系同時抽取出來,除了傳統的基于模板的方法[17]和基于機器學習[18]的方法,目前主流的還有基于數據管道(pipeline)和基于聯合模型(joint model)的深度學習方法,其中基于聯合模型的方法具體又分為聯合推理(joint Inference)和聯合建模(joint modeling)兩種[19]。聯合推理借鑒集成學習的思想,基于整體優化目標整合各模型,通過整數規劃等方法進行優化;聯合建模通過將事件結構看作依存樹,并將抽取任務轉化為依存樹結構預測問題。該方法能夠減少對外部工具的依賴,減免人工設計特征的工作量和誤差的累積傳播。

3.知識融合

經由知識抽取獲取命名實體及實體關系后,往往可能會包含大量的冗余和錯誤信息,因此需要對其進行清理、整合等一系列相關處理,獲取高質量信息,提高知識圖譜的置信度。實體鏈接和實體合并是知識融合的主要手段。

實體鏈接是一種從文本中抽取得到的實體正確鏈接到知識庫中對應的條目或實體的操作流程,其關鍵技術是實體消歧和共指消解[20]。實體消歧專門用于解決同名實體產生歧義的問題,當前主要采用空間向量模型[21]、語義模型[22]、社會網絡模型[23]等將指向同一個實體對象的所有指稱項都聚合在一起,通過相似度計算等方式消除歧義,但依然存在欠缺考慮語義關系、推廣性比較差等問題。共指消解則是針對同一個實體對象的不同描述(指稱項)合并到一起的過程,降低圖譜的冗余度。

實體合并主要有合并外部知識庫和合并關系數據庫兩類,既可以將構建的知識體系以圖結構存儲在圖形數據庫中,通過實體消歧進行合并,也可以將知識體系以關系型存儲在關系數據庫中,并通過數據庫技術進行合并。

4.知識更新

遵循事物發展規律對知識圖譜節點和關系的動態發展進行實時調整稱之為知識更新。知識圖譜構建完成后并不是一成不變的,而是需要對知識圖譜中的節點和關系進行實時更新以實現知識圖譜的不斷完善。

當前研究主要從知識圖譜的模式層更新和數據層更新兩個方向展開。在模式層更新方面有通過下載整體的結構化數據并進行圖譜模式重塑的基于整體數據源的更新,也有基于眾包理念僅對新增知識進行的整理式更新。

三、教育領域知識圖譜框架構建

知識圖譜的快速發展引發了各大領域的研究熱潮,諸多單位和研究者也開始立足于教育領域關注并開展教育知識圖譜相關研究。自適應學習平臺Knewton構建了一個學術概念交叉的知識圖譜[24],百度公司搭建了基礎教育知識圖譜來支持實現個性化學習路徑的生成,余勝泉等人提出通過學科教師融合領域知識來編制學科知識圖譜[25],華中師范大學開展了基于潛在語義分析的學科知識圖譜構建研究[26],劉清堂等人建立了一種面向在線學習(E-learning)領域的知識元表征模型和基于語義場的Web資源語義聚合模型[27],李艷燕等人從智慧教育角度切入構建學科知識圖譜[28],李振等人針對教育領域從知識和認知兩個方面構建了教育知識圖譜[29],鐘卓等人進一步拓展了教育領域知識圖譜的語義信息,構建“知識—問題—能力”圖譜[30]。盡管教育領域知識圖譜相關研究已經取得豐碩的研究成果,但在圖譜模式構建層面,已有教育領域知識圖譜概念的界定、知識表征的粒度尚未達成共識,且已有教育領域知識圖譜多聚焦于對知識點和知識點之間關系的表征,欠缺對思維能力的表征刻畫,此外,既有研究在構建過程中或多或少地存在忽略教育領域特征融入等問題,導致構建的圖譜領域性不強,應用效果欠佳。

伴隨著教育活動的發展進步,人才培養更加關注學習者知識、能力和素質的全方面發展,核心素養與學科能力培養成為國內外基礎教育共同關注的研究熱點。促進核心素養發展和學科能力培養的學科知識體系不僅要包括學科基礎知識,還要包括學科思維,也就是要在學科基礎知識之上致力于學習者思維能力的培養。由此可知,面向教育領域的知識圖譜迫切需要建立一個系統、規范且以思維為主導的圖譜框架。

本研究設計了如圖2所示的教育領域知識圖譜研究框架,主要包括確定價值取向、定義圖譜模式、知識抽取、知識融合、知識更新和圖譜應用六部分內容。①厘清從知識習得走向思維發展的價值取向,并綜合考慮教師和學生的實際需求是保證研究順利開展的基礎。②在定義圖譜結構過程中,首先依據學科課程標準和課程核心內容確定學科核心概念形成知識庫,將其作為圖譜模式的最底層,然后圍繞學科核心概念抽取學習掌握核心概念的問題、任務和資源,組織形成問題資源庫,并與底層的核心概念進行映射,形成圖譜模式的中間層,最后通過解析核心概念和與之對應的問題資源確定掌握核心概念、解決問題所經歷的學習活動,通過問題解決活動過程發展思維能力,形成圖譜模式的思維能力頂層。③在定義好圖譜模式的基礎上,運用長短時記憶網絡+條件隨機場、并行化數據挖掘等方法從課程標準、教學設計等教育領域資源庫中進行知識抽取,明確實體和實體關系。④通過對實體、實體關系的向量化表示和相似度計算校驗知識抽取結果,人機協同完成知識融合工作。⑤邀請領域專家和一線教師運用投票機制等手段完成模式層的更新;基于眾包理念邀請圖譜應用者對實體和實體關系進行語義標注,進而實現數據層的更新,兩者綜合實現知識更新。⑥圖譜應用是將構建的圖譜呈現給教師和學生進行應用,具體實現的功能包括知識導航、資源聚類、認知診斷和學習推薦四方面。

圖2 教育領域知識圖譜研究框架

四、教育領域知識圖譜研究挑戰與展望

(一)融合教育領域特征的圖譜模式表征

面向特定領域垂直構建的領域知識圖譜關注知識信息的深度,領域特征信息的融入能夠有效助力領域知識圖譜應用的精準度。當下金融、醫學、電商等領域已構建出各具特色的知識圖譜,應用效果良好。相關典型研究有金融領域圍繞金融風控及精準營銷等金融業務的核心問題構建金融知識圖譜,以實現反欺詐與信用評估等功能;醫學領域圍繞疾病、藥物以及疾病與藥物的對應關系等構建醫藥知識圖譜,提高疾病—藥物的檢索效率和使用指導,為病患提供更好的醫藥服務。

與其他領域相比,教育領域包含豐富的知識概念、知識關系,有獨特的教學目標定位、教學內容活動序列及教育價值追求,學科知識也通常隱藏著“價值旨趣+問題+方法(論)+研究結論”的生成邏輯,在教育領域知識融合指導的基礎上遵循學科特有的教學邏輯規律才能保證教學活動的有效開展[31][32]。既有的學科知識圖譜模式多關注學科顯性知識的組織與表征,欠缺對教學法等隱性知識的關注,也忽略了教與學邏輯規律對學科知識圖譜模式構建的約束。因此,立足教育領域知識圖譜構建的首要任務就是深度剖析教育領域特征,厘清構建的目標定位、范圍邊界和應用需求,從教育領域特征入手明確教育知識圖譜模式構建的切入點和關鍵點。

(二)教育領域知識圖譜的跨域融合與自動更新

跨學科知識整合能力是21世紀創新型人才的必備能力,目前領域知識圖譜構建缺乏對不同領域知識關聯與融合問題的考慮。當下教育領域知識圖譜研究成果豐富,研究者從不同視角切入構建圖譜,如針對知識點和知識關聯關系的學科知識圖譜、針對考試測試題構建的試題圖譜、面向學習活動構建的事理圖譜等,圖譜種類的多樣性在支持學習的同時,也會造成知識的冗余問題。因此面向教育領域不同學科知識圖譜的模式對齊與融合是教育領域知識圖譜的下一步研究重點。

與此同時,大數據時代的到來加速了知識信息的更新速度,知識圖譜的更新也是研究關注的重點。當前知識圖譜更新多聚焦于人工手動實現,耗時耗力,少量基于機器實現的自動更新存在精確度低等問題。教育領域存在諸如教學設計、教學任務單、教學音視頻、教學測試題等多樣化數據,其復雜性在一定程度上也影響教育領域知識圖譜知識更新的準確性。因此如何選擇深度學習、強化學習算法等更合適的技術手段以實現知識圖譜的自動更新,保證效率和精確度同步實現是研究的另一關注點。

(三)教育領域知識圖譜的應用評價

知識圖譜的效果需要經由實際應用進行檢驗?,F階段,各領域知識圖譜構建方法多樣,尚未形成標準化的發展趨勢,由此知識圖譜的應用評估工作就顯得尤為重要。但目前知識圖譜應用評估方面存在應用平臺不足或搭建不完善、評價環節尚未達成統一、評價方法欠科學、評價標準空白等諸多問題。國內外許多研究機構開始探究知識圖譜的評估工作,典型代表有中國電子技術標準化研究院牽頭制訂的《信息技術 人工智能 知識圖譜技術框架(征求意見稿)》,從構建技術角度給出標準,對知識圖譜進行了規范;美國倫斯勒理工學院研制了知識圖譜測評系統,主要是對多源異構知識圖譜中存在的問題和錯誤進行檢測與評估。

評價是教學的風向標。有研究者從測評角度考慮構建教育測評知識圖譜,但本質也依舊是知識點和知識點之間的關系,構建的測評知識圖譜尚不能達到評價診斷的作用。既有的教育領域知識圖譜相關研究,不論是在模式構建層面還是技術層面,都處于小規模的理論討論階段,尚沒有考慮到基于知識圖譜的系統平臺開發與應用評價。因此,考慮教育領域知識圖譜的應用與評價是未來研究的關鍵點。立足教育領域,應從開發搭建知識圖譜實際應用平臺和建立健全知識圖譜標準化評估框架等方面開展知識圖譜的應用與評價,以提高知識圖譜的質量,促進其向標準化應用方向發展。

(四)教育領域知識圖譜由知識向認知的進階轉型

近年來,“認知圖譜”一詞開始逐漸進入大眾視野,并迅速得到了研究者的廣泛關注。認知智能追求讓計算機學會讀懂語義,能夠進行學習判斷和邏輯推理,理解與解釋是認知智能的兩個核心。知識圖譜的出現能夠加速認知智能的發展,谷歌、微軟等公司都在知識圖譜基礎上探索認知智能的發展實現。2018年,中國計算機大會圍繞“認知圖譜與推理”舉辦主題論壇,就如何與知識圖譜相結合,構建大規模、高質量的認知圖譜展開深入探討。相關典型研究目前主要出現在電商領域,提出大規模電商認知圖譜,以解決當下電商業務中存在的問答不準確、重復推薦等問題,更好地滿足用戶需求。

認知主義學習理論提出學習者追求的學習結果體現在個體認知結構的改變。建構主義學習理論認為學習是學習者根據自身經驗,通過同化與順應對外部信息主要加工處理的過程,結果也體現在個體認知結構的改變。當下,教育領域研究者主要聚焦研究在知識圖譜基礎上運用深度學習算法對學習者的認知狀態進行診斷,以達到評估學習者認知能力水平的目標,相關典型研究如在知識圖譜基礎上構建的學習認知地圖。該種方法構建的學習者認知地圖實際上默認學習者知識結構是固定不變的,但學習是一個不斷發展的過程,學習者的認知也是不斷發展的,因此,如何基于學習者個性特征構建動態發展的學習認知圖譜是教育領域認知圖譜構建亟須攻克的難題。

猜你喜歡
語義研究
FMS與YBT相關性的實證研究
2020年國內翻譯研究述評
遼代千人邑研究述論
語言與語義
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系統研究
新版C-NCAP側面碰撞假人損傷研究
“上”與“下”語義的不對稱性及其認知闡釋
現代語文(2016年21期)2016-05-25 13:13:44
認知范疇模糊與語義模糊
“深+N季”組配的認知語義分析
當代修辭學(2011年6期)2011-01-29 02:49:50
主站蜘蛛池模板: 亚洲欧美日韩久久精品| 亚洲欧洲日韩综合| 久久综合九九亚洲一区| 中国特黄美女一级视频| 国产高潮视频在线观看| 久久a级片| 福利一区三区| 免费网站成人亚洲| 日韩欧美国产成人| 91精品专区国产盗摄| 波多野结衣国产精品| 久久激情影院| 亚洲国产成人自拍| 99热这里只有免费国产精品| 中文字幕 欧美日韩| 在线欧美a| 精品91在线| 思思热精品在线8| 欧美啪啪精品| 91久久夜色精品| 国产主播一区二区三区| 国产精品任我爽爆在线播放6080| 日本亚洲欧美在线| 午夜一区二区三区| 日韩av在线直播| 国产剧情一区二区| 一级高清毛片免费a级高清毛片| 91精品国产自产在线老师啪l| 99国产精品一区二区| 久久国产精品嫖妓| 国产91精品最新在线播放| 国产又黄又硬又粗| 久久成人免费| 国产第三区| 婷婷午夜影院| 秋霞一区二区三区| 成人国产精品一级毛片天堂| 欧美性猛交一区二区三区| 国产在线观看精品| Aⅴ无码专区在线观看| 国产一级毛片yw| 女人爽到高潮免费视频大全| 日本人妻一区二区三区不卡影院| 色哟哟国产精品| 国产亚洲精久久久久久久91| 在线色国产| 在线五月婷婷| 免费一级无码在线网站| 亚洲国产无码有码| 丰满人妻中出白浆| 波多野结衣一二三| 91在线中文| 久久国产精品波多野结衣| 玖玖精品在线| 日韩人妻无码制服丝袜视频| 国产成人a在线观看视频| jijzzizz老师出水喷水喷出| 欧洲亚洲欧美国产日本高清| 天天色天天操综合网| 二级毛片免费观看全程| 91色综合综合热五月激情| 五月综合色婷婷| 乱人伦中文视频在线观看免费| 欧洲高清无码在线| 最新国语自产精品视频在| 亚洲综合第一区| 亚洲欧美日韩综合二区三区| 国产精品自在自线免费观看| 一级香蕉人体视频| 亚洲AV无码乱码在线观看裸奔| 色偷偷av男人的天堂不卡| 九色免费视频| 91热爆在线| av性天堂网| 好吊色国产欧美日韩免费观看| 国产真实乱子伦精品视手机观看| 日韩精品久久久久久久电影蜜臀| 欧美日韩一区二区在线播放 | 就去吻亚洲精品国产欧美| 国产三级毛片| 色精品视频| 久久中文字幕2021精品|