肖佳



【摘? 要】 為解決課程推薦領域存在的數據稀疏性高、啟動慢問題,保證推薦結果的精確性和高效性,文章改進基于知識圖譜的多任務特征推薦模型的基礎上,提出一種帶有知識感知圖神經網絡推薦算法,從而達到精確獲取學生潛在興趣的目的。文章以“慕課平臺(MOOC)”為案例,結合所采集的藝術類、計算機類學生課程交互數據和課程屬性,分別使用18235條交互數據和44700條課程屬性,對帶有知識感知圖神經網絡推薦算法性能進行驗證。結果表明:帶有知識感知圖神經網絡推薦算法的曲線下面積、準確率分別達到82.3%、78.2%,比奇異值分解模型提升了15%。所以,知識圖譜在提升課程推薦性能方面發揮出重要作用,可以有效解決課程推薦數據稀疏性問題,完全符合實際應用需求。
【關鍵詞】 知識圖譜;精準課程;推薦算法;神經網絡
在互聯網時代背景下,網絡課程資源變得越來越龐大化、多樣化。在這樣的情形下,學習者無法從海量的網絡課程資源中精確獲取所需要的學習資源,降低學習者的學習性和主動性。而基于知識圖譜的課程推薦算法的運用,可以有效地解決以上問題,這是由于知識圖譜憑借著自身獨特存儲結構,可以實現對個性化課程資源的精確化、實時化推薦。文章結合課程資源數據,構建相應的知識圖譜,并提出一種新型、先進的帶有知識感知圖神經網絡推薦算法,以期提高知識圖譜推薦性能。
一、面向課程推薦的知識圖譜構建
(一)課程領域知識圖譜的構建
在精準構建課程知識圖譜期間,需要對知識圖譜數據模型進行自頂而下的設計,然后,利用所設計好的知識圖譜模型,有效填充和完善相關知識數據,此時,課程領域知識圖譜構建完成。該知識圖譜具體構建步驟如下:1. 根據所確定好的課程數據源,完成對課程領域本體模型的構建;2. 通過對課程數據源進行精確化搜索,可以快速查找和提取相關實體信息;3. 借助圖數據庫,統一化存儲所提取到的實體信息,從而達到豐富知識圖譜的目的;4.對所構建好的課程領域知識圖譜進行向量化表示,從而起到有效融合推薦模型和知識圖譜的作用。
(二)課程領域本體建模
在構建知識圖譜期間,技術人員要重視課程領域本體建模這一環節,通過進行課程領域本體建模,可以促使課程相關專業術語變得更加科學化、準確化,為后期構建知識圖譜創造了良好的條件。在進行本體建模期間,需要采用圖文并茂的方式,形象化、生動化表示課程信息,確保各種課程相關信息之間建立良好的連接關系。本體建模具體操作步驟如下:首先,確定本體建模目的。為保證課程領域本體建模的有效性和可靠性,需要對課程資源相關概念進行抽象化處理,并利用課程本體,對所提取的知識模塊進行不斷的優化和填充,保證課程知識圖譜構建質量和效率。其次,收集課程數據信息。借助某在線IT技能網站,可以抓取所需要的課程資源數據。該網站為學習者提供多樣化專業課程資源。其課程形式除了涉及傳統視頻課程形式外,還用到在線編碼的實驗課程形式。在爬蟲技術的應用背景下,可以實時抓取課程簡介、課程種類、課程方向、課程作者等關鍵字段進行實時抓取。最后,分類課程領域實體概念。結合學習者對課程信息的興趣點,根據學習者與課程之間的匹配程度,進行精確推薦。課程領域實體概念可以劃分為課程方向、課程種類、課程形式等多種類型,并對不同分類的課程概念進行屬性定義。
(三)課程領域知識抽取
在抽取課程領域知識時,主要涉及以下兩種抽取方式:1. 實體抽取。在進行實體抽取期間,需要結合課程標題,查詢和抽取重要的知識關鍵詞。在課程領域知識圖譜中,所抽取的詞匯主要包含深度學習、數據結構、圖像處理等多種專業詞匯。2. 關系抽取。結合課程本體屬性,從大量的課程數據源中抽取類型、形式、屬于、作者、包含等多重關系。
(四)知識圖譜存儲與可視化
應用所構建好的課程領域本體模型抽取所需要的實體信息,并對這些實體信息進行安全化存儲。知識圖譜具有功能強大、安全可靠、結構復雜等特點,如果運用MySQL關系型數據庫,對知識圖譜相關數據進行存儲,會降低其存儲性能,導致數據查詢過慢,而Neo4j圖形數據庫的出現和應用可以有效解決以上問題。該數據庫在存儲數據期間主要用到屬性圖模型。在Neo4j圖形數據庫內含有節點和關系兩種數據,借助關系,可以將多個節點進行有效連接,以三元組的方式,向Neo4j圖形數據庫中存儲所獲取到的知識實體和關系。
(五)知識圖譜嵌入
當課程領域知識圖譜構建完成后,仍然需要采用文本數據形式真實有效地呈現知識圖譜中的實體和關系等相關信息,此時,利用知識嵌入網絡,對知識圖譜中的實體和關系相關信息進行向量化處理,確保各個概念實體之間形成一一對應的關系,使其統一映射到相應的低緯向量空間中。
二、基于知識圖譜的多任務特征推薦模型建立
為突破傳統課程推薦算法的局限性,文章建立基于知識圖譜的多任務特征推薦模型,該模型將知識圖譜作為推薦輔助性任務,各個任務之間緊密聯系,這是由于單個課程與知識圖譜的多個實體之間存在一定的關聯度,因此,單個課程結構與其實體結構比較類似。在進行基于知識圖譜的多任務特征推薦模型構建時,要添加交叉壓縮單元,借助該單元,明確單個課程與多個實體特征之間的高階交互關系,并對多個任務交叉知識轉移能力進行有效調整和控制。在交叉壓縮單元的應用背景下,可以相互補充單個課程與多個實體表征,防止多個任務出現噪聲問題,使得不同任務之間表現出較高的泛化能力。該推薦模型主要是由以下三個模塊組成:1. 推薦模塊。該模塊中的輸入量是課程向量和學習者向量;輸出量是學習者的課程選課率。在推薦模塊中,所用到的低階部分直接應用于多層感知器中,從而達到有效及時處理和篩選學習者的特征信息。另外,在交叉壓縮單元的應用背景下,可以統一化處理課程部分內容,并自動返回相應的課程特征信息,最后,將學習者特征與課程特征進行拼接,利用函數,計算和輸出相應的選課預測值。2. 知識圖譜嵌入模塊。知識圖譜嵌入模塊主要是指采用直接嵌入的方式,將實體和關系統一設置到某一向量空間中,并保留原有結構不變。3. 交叉壓縮單元。借助該模塊,可以實現對單個課程與多個實體之間特征交互關系的有效模擬。在課程推薦模塊中,其課程和知識圖譜嵌入模塊中實體之間存在一對一的關系,借助交叉壓縮單元,可以對中間層進行有效的連接。
三、基于知識圖譜的多任務特征推薦模型算法優化
首先,要淘汰和摒棄推薦模塊中的協同過濾算法,運用優化后的算法,保證維度變換效果,以達到高效化壓縮數據的目的。其次,利用優化后的算法,對所需要的低階特征進行獲取,并借助深度網絡,獲取相應的高階特征,然后,采用集成處理的方式,將設計好的圖卷積神經網絡框架直接引入知識圖譜中,從而形成一種新型、先進的帶有知識感知圖神經網絡,該神經網絡可以精確化表示和學習知識圖譜中的各個節點。最后,配合使用交叉壓縮單元和深層網絡,構建壓縮矩陣模型,從而實現對高維特征的精確化提取。總之,文章所提出的帶有知識感知圖神經網絡推薦算法,可以實現對學生課程資源的精確化推薦,在知識圖譜中,借助該推薦算法,可以實時獲取不同實體之間的高階連接關系,并有效表示出各個課程實體,聚合處理課程實體鄰域節點,從而達到實現一次迭代的目的。
四、實驗對比與分析
在進行對比實驗時,為有效地驗證文章推薦算法的有效性和可靠性,文章選用了MOOC平臺中的藝術類、計算機類學生課程交互數據和課程屬性等數據集,其中,藝術類數據集含有110門課程信息以及15915位學生對110門課程的評分;計算機類數據集主要包含298門課程信息以及9023位學生對298門課程的評分,為解決交互矩陣的稀疏性問題,將計算機類數據集中學生交互次數設置在5以上。數據集基本統計信息如表1所示。
為驗證文章提出的課程推薦算法的有效性,需要將其與奇異值分解推薦模型、基于特征的分解推薦模型、融合通道的深度推薦模型三種傳統推薦模型進行比較和分析。文章將ROC曲線下面積、準確率設置為推薦算法性能評價指標,有效地評價和衡量各個算法性能。其中,推薦模型準確率(ACC)計算公式如下:
式中TP、TN、FP、FN分別代表課程樣本被正確推薦給學生者的數量、不屬于推薦課程的樣本沒有推薦給學生的課程數量、不屬于正確推薦課程樣本被錯誤推薦給學生者的數量、屬于推薦課程的樣本沒有推薦給學生的課程數量。
在帶有知識感知圖神經網絡推薦模型中,結合驗證集,完成對學生課程評分矩陣的構建,該矩陣屬于稀疏矩陣,測試集、驗證集、訓練集三者之間比例為1:1:3,單個實驗重復操作四遍,然后,對各個推薦模型的評價性能進行計算。運用點擊率預測法,對推薦性能進行評估,在整個測試集中各個交互實例中,運用訓練后的推薦模型進行處理,并將預測點擊概率輸出和呈現在測試人員面前。最后,借助曲線下面積、準確率,對最終預測結果進行評估。課程點擊預測概率如表2所示,從數據可以看出,文章所提出的帶有知識感知圖神經網絡推薦算法所獲得的曲線下面積、準確率相對較高,遠遠超過其他傳統推薦模型,因此,文章推薦算法具有較高的有效性和可靠性,可以實現課程資源的精確化推薦。
五、結語
綜上所述,在進行課程推薦時,運用知識圖譜完成對知識抽取、表示和存儲,并在構建和優化基于知識圖譜的多任務特征推薦模型的基礎上,提出一種帶有知識感知圖神經網絡推薦算法。該推薦算法借助聚集鄰域信息,有效地提取和獲取用戶潛在興趣。結合藝術類、計算機類學生課程交互數據和課程屬性實驗結果,不難發現,文章所提出的推薦算法明顯優于其他傳統推薦算法,可以提高課程資源推薦結果的精確性和高效性,為教育領域的發展提供新的思路和方法,給學生提供個性化的課程推薦,避免學生盲目地選擇不適宜于自身發展方向的課程,從而提高教學資源的利用率和選課管理系統的運行效率。總之,文章所提出的帶有知識感知圖神經網絡推薦算法具有較高的有效性和可靠性,可滿足學習者查詢和調用個性化課程資源應用需求,有效地提高學習者的學習效率和效果。