MOOCDR-VSI:一種融合視頻字幕信息的MOOC 資源動態推薦模型

2024-02-20 08:22:12吳水秀羅賢增鐘茂生吳如萍

計算機研究與發展 2024年2期

吳水秀羅賢增鐘茂生,2 吳如萍羅瑋

1 （江西師范大學計算機信息工程學院南昌 330022）

2 （江西師范大學江西教育數字化轉型研究中心南昌 330022）

（wushuixiu@jxnu.edu.cn）

中國的教育已步入新時代，為了更好地落實科教興國、人才強國戰略，國家對教育現代化[1]和信息化[2]均提出了新要求、新使命. 同時，普通民眾對知識更新的需求不斷增高，以固定時間、確定地點進行的線下課堂教學活動，已經難以滿足知識日益更新、終生學習的新形勢和新需求. 在知識快速更新的新形勢和終身自主學習的新需求推動下，各種大規模開放式在線課程（massive open online courses，MOOC）學習平臺如雨后春筍般地發展起來，如edX、Coursera、MIT Open Courseware、Stanford Online、ITS、騰訊課堂、百度傳課、智學網和淘寶教育等. 在線學習（elearning）、開放學習（open-learning）為實現“人人皆學、處處能學、時時可學”和“終身學習”，為教育優質均衡發展和實現教育公平提供了技術上的保證；對于構建學習型社會，促進人的素質的全面提高，也具有重要的意義.

MOOC 平臺匯聚了海量的優質教學資源，這些種類繁多、琳瑯滿目的資源為廣大學習者實現自主學習的同時，也造成了“信息過載”和“信息迷航”等問題. 一項對在線學習用戶的研究表明，以不適當的課程視頻向用戶提供學習內容會降低他們的參與度[3].隨著個性化學習需求的不斷增加，基于學習者的知識偏好和學習需求向用戶推薦符合他們的興趣和認知水平的教學資源變得越來越重要.

推薦技術旨在解決“信息過載”問題，使用戶從浩如煙海的信息中快速定位到自己感興趣的內容，已經廣泛應用于許多領域，如產品推薦、新聞推薦、亞馬遜圖書推薦和Netflix 電影推薦[4-5]. 受這些領域成功案例的啟發，有研究者將推薦技術引入MOOC推薦中，用以解決學習資源與學習者興趣和需求不匹配等問題，并取得一定進展. 然而，目前的推薦方法在建模學習者學習偏好和預測學習者需求時仍然存在3 點不足：

1）無法深度挖掘課程內容的隱含信息. MOOC大多以視頻為載體向學習者傳遞知識，而視頻包含了豐富的信息，如語音、字幕等，通過挖掘課程視頻信息能夠進一步過濾與學習者需求不符的課程資源.例如，有的教師講授數據結構課程時采用C 語言，而有的教師可能采用C++或者Java 語言，這些潛在信息對于精確表示課程特征、提高推薦質量具有輔助意義.

2）容易形成“蠶繭效應”. 推薦的課程若不能在學習者興趣的基礎上適度延伸、拓展，就不可避免地產生“蠶繭效應”，造成學習者視野日益狹窄、喪失學習興致，而要打破這種“蠶房”的桎梏，就要求模型能夠挖掘課程內容的個性和共性特征，增加推薦的多樣性. 例如，學習者在學習“操作系統”課程的“哲學家進餐問題”時，模型能夠給出“信號量機制”“銀行家算法”等相關的延伸知識的推薦.

3）難以捕獲學習者動態變化的學習需求和興趣. 隨著學習者對知識的不斷內化和遷移，其需求和興趣可能會隨之變化，如何動態追蹤學習者不斷變化的學習需求和興趣也是亟待解決的關鍵問題.

針對這3 點不足，本文提出了一種融合視頻字幕信息的MOOC 資源動態推薦模型（MOOC resource dynamic recommendation model fusing video subtitle information, MOOCDR-VSI）. 視頻的字幕文本是向學習者傳遞信息的重要載體，通過提取字幕的語義特征能夠從自然語言處理的角度理解視頻內容，進而深度挖掘課程內容的隱含信息. MOOCDR-VSI 的思想類似于觀看外文電影時，雙語字幕能夠幫助觀看者理解視頻內容. 另一方面，通過引入課程內容的語義關聯挖掘視頻內容的個性和共性特征，增加推薦的多樣性，能夠適度地擴充學習者的視野和興趣.MOOCDR-VSI 首先探索學習者的學習記錄和相應的課程內容，學習記錄中的觀看完成率是刻畫學習者對當前學習內容是否感興趣的重要特征. 對于課程內容，MOOCDR-VSI 首先采用BERT（bidirectional encoder representations from transformers）[6]編碼器和多頭注意力機制獲取每個視頻字幕的語義信息和挖掘視頻內容的個性特征. 然后，MOOCDR-VSI 采用一種基于LSTM（long short-term memory）[7]的網絡結構動態建模學習者的興趣狀態. 接著通過引入注意力機制關注不同課程的共性特征. 最后，結合學習者當前的興趣狀態和課程內容的特征生成推薦列表. 總的來說，本文的主要貢獻包括4 個方面：

1）通過BERT 編碼器獲取MOOC 視頻字幕的文本表示，并采用多頭注意力從不同的語義空間捕獲局部特征間的依賴關系，深度挖掘了課程內容之間的個性信息和共性信息；

2）通過外部矩陣建模了不同MOOC 與各個知識點的關聯性，學習者每一次完成MOOC 學習后，采用一種基于LSTM 的網絡架構更新學習者對每一個知識的偏好狀態，從而動態獲取學習者的知識偏好狀態；

3）引入注意力機制捕獲MOOC 視頻之間的相關性，結合學習者當前的知識偏好狀態推薦出TopN個學習者可能感興趣的MOOC 視頻；

4）構建了融合字幕信息的MOOC 推薦模型MOOCDR-VSI，在真實學習場景下收集的MOOCCube 數據集上的實驗驗證了該模型的有效性.

1 相關工作

傳統的課程推薦算法包括協同過濾推薦算法[8-10]、基于內容的推薦算法[11]和混合的推薦算法[12-14]. 其中，協同過濾推薦算法主要依賴用戶對課程的反饋（包括評價、打分），而較少地考慮用戶和課程的內容信息，當用戶對課程的交互信息較少時，容易產生冷啟動問題. 有研究者通過引入學習行為[15]、社交網絡[16]、用戶屬性[17]和上下文[18]等輔助信息減少用戶對課程交互信息的依賴，緩解了由交互數據稀疏帶來的冷啟動問題. 基于內容的推薦算法主要依賴挖掘課程之間的相似度，為用戶推薦與過去學習相似的課程，但項目的內容信息往往同時包含結構數據和非結構數據，因此這種算法高度依賴特征工程. 為了滿足個性化學習的需求，混合推薦算法成為解決復雜場景的主流算法，如Chen 等人[19]提出了一種基于內容的協同過濾方法來獲得與內容相關的課程集，然后根據學習者學習序列，使用順序模式挖掘算法，對課程集進行篩選.Li 等人[20]通過融合用戶興趣模型和教學資源模型構建了個性化網絡教學資源系統，改進的混合推薦算法在個性化課程推薦系統中具有更好的性能，但這些方法大都將用戶偏好視為靜止狀態，即無法動態監控用戶每一次交互后的興趣變化，因此依然存在一定局限性.

近年來，深度學習因其具有強大的特征提取能力受到研究者們的關注，受其在語音分析[21]和文本處理[22]等領域成功的啟發，有研究者將深度學習引入課程推薦系統.Zhao 等人[23]提出了一種全路徑學習的推薦模型，該模型首先對學習者集合進行聚類，接著訓練LSTM 來預測學習者的學習路徑和學習成績，最后根據學習路徑預測的結果推薦個性化學習的完整路徑. Li 等人[24]提出了一種基于互信息的特征選擇（mutual information feature selection，MIFs）模型和學習者學習資源二部圖關聯模型，利用深度神經網絡挖掘學習者的個性化偏好基礎，進而為學習者推薦資源.Fan 等人[25]通過構建了一個多注意力（學習記錄注意力、課程描述注意力等）網絡模型探索多個非結構化信息，為分析學生的學習行為和進行個性化的MOOC 推薦提供了一種可解釋的策略.Wang等人[26]提出了一種基于圖神經網絡的TopN個性化課程推薦方法，并探索了2 種不同的聚合函數來處理學習者的序列鄰居. 在考慮課程內容的工作中，Xu等人[27]提出一個融入課程名稱、課程評價等信息的多模態課程特征提取的推薦框架. 考慮到課程推薦存在豐富的實體關系，Gong 等人[28]通過構建異構信息網絡（heterogeneous information network，HIN）[29]捕獲多種實體，如課程、視頻、教師之間的關系并將其納入學習過程. 這些方法相較傳統的協同過濾方法能夠獲得較好的推薦效果，但由于其無法深入挖掘課程內容的隱含信息，可能導致推薦的結果存在“蠶繭效應”，即無法在學習者興趣的基礎上進行擴展及延伸式的推薦. 另一方面，這些方法大多將學習者興趣和需求視為靜止狀態，不符合學習者的興趣隨學習時間變化的過程，因此，這些方法依然存在一定的局限性.

2 問題描述與研究思路

2.1 問題描述

課程視頻推薦可以形式化為一個有監督的序列預測問題，假設在一個學習系統中存在一個學習者S和一組課程視頻E，學習者S1的學習序列表示為其中元組表示該學生在時刻t的學習交互，titlet和captiont分別表示學習者時刻t學習的MOOC視頻的標題和字幕文本，和分別表示觀看視頻的開始時間和結束時間，dt表示該課程視頻時長. 通過預設的模型捕捉每個時刻學習者的學習興趣和需求，并預測該學習者在時刻t+1 可能感興趣的N個MOOC 視頻.

2.2 研究思路

針對傳統MOOC 推薦模型存在的無法深入挖掘課程視頻內容信息、推薦結果擴展性較差以及無法捕捉學習者動態變化的學習興趣和需求等問題，本文按照以下研究思路進行學習者興趣動態建模和MOOC 推薦：

首先，本文將BERT 作為視頻標題和字幕文本的編碼器，考慮到BERT 模型采用雙向的Transformer結構[30]，因此它能夠較好地捕獲前后文的語義信息.接著采用多頭注意力機制從不同語義空間捕獲局部特征間的依賴關系，進一步挖掘課程視頻的個性特征和共性特征，以此獲得較好的擴展性推薦結果. 對于建模學習者的學習興趣變化過程，本文采用LSTM獲取每一時刻學習者的知識偏好狀態，由于課程視頻的完成率能夠從側面反映學習者對當前視頻感興趣的程度，因此學習者每一時刻的知識偏好狀態由當前視頻的知識點和完成率共同決定. 同時，課程的知識點并不孤立而是彼此關聯，因此在這個過程中引入了課程視頻知識點的關聯性以刻畫學習者完成當前視頻學習后對潛在知識點偏好的影響. 最后通過注意力機制獲取已學習MOOC 和未學習MOOC間的關聯，并結合當前時刻學習者的知識偏好狀態召回TopN個學習者可能感興趣的MOOC 視頻.

3 MOOCDR-VSI 模型

本節給出了MOOCDR-VSI 的總體框架和各個模塊的實現過程，包括MOOC 的文本（標題文本、字幕文本）特征提取、學習者知識偏好動態建模、MOOC推薦等模塊以及模型的訓練方法.

3.1 模型總體框架

本文提出的MOOCDR-VSI 架構如圖1 所示，主要分為3 個模塊：MOOC 文本特征提取、學習者知識偏好動態建模、MOOC 推薦.

Fig. 1 MOOCDR-VSI framework圖1 MOOCDR-VSI 框架

1） MOOC 文本特征提取. MOOC 包含了標題和視頻字幕等文本信息，并通過BERT 編碼器獲得其字符級的文本嵌入表示，接著采用多頭注意力機制從不同語義空間捕獲局部特征間的依賴關系，并輸出最終文本特征的嵌入表示.

2）學習者知識偏好動態建模. 該模塊將學習者學習序列的每個交互信息作為輸入，包含經特征提取后得到的MOOC 字幕文本的嵌入表示和當前MOOC 的完成率，MOOC 標題信息經特征提取后與外部知識存儲矩陣計算當前MOOC 知識點與其他MOOC 知識點的關聯性，接著通過LSTM 輸出每次學習交互后學習者的知識偏好狀態.

3） MOOC 推薦. 該模塊將結合當前時刻學習者的知識偏好狀態以及經注意力機制提取的MOOC 視頻之間的相關性，從未學習的MOOC 資源中召回N個MOOC 視頻.

3.2 MOOC 文本特征提取

MOOC 中含有大量文本信息，包括標題、字幕等，通過這些信息能從文本的角度來理解視頻的內容.本文首先將BERT 作為編碼器，獲取MOOC 的標題和字幕文本的詞向量. 與傳統的Word2vec[31]詞向量表示方法不同，BERT 采用的雙向Transformer 結構包含位置編碼，因此能夠考慮上下文語義信息. 給定MOOC 標題文本title= {x1，x2，…，xn}和字幕文本caption= {y1，y2，…，ym}，通過BERT 預訓練模型得到標題矩陣Ot和字幕文本矩陣Oc表示：

其中Ot∈，Oc∈，n，m分別為MOOC 標題和字幕文本的長度，Ti，Cj分別表示MOOC 標題和字幕文本的第i和j個詞的向量表示，為向量維度大小d=768. 接著使用Oc在不同語義空間的文本信息：

其中headi為第i個頭的自注意力，，，為第i頭自注意力的權重矩陣，接著將所有自注意力矩陣拼接在一起，最后乘以一個權重矩陣W0得到多頭注意力M.

3.3 學習者知識偏好動態建模

學習者知識偏好動態模塊的目標是通過建模學習者的學習序列，進而追蹤學習者知識偏好狀態隨著學習過程的動態變化. 這個過程考慮了3 個方面的輸入對學習者知識偏好的影響：1）當前MOOC 標題的語義信息Ot；2）當前MOOC 視頻字幕經多頭注意力捕獲的語義信息M；3）當前MOOC 學習的完成率.

通常MOOC 標題包含了當前學習內容的知識點信息，為了量化完成當前MOOC 后對不同知識點的影響，在建模過程引入了外部存儲矩陣Mk，首先將當前MOOC 標題語義信息Ot和知識空間矩陣Mk的每一列相乘得到權重wt：

表示當前MOOC 視頻與知識空間所有知識點的相關度，Mk存儲的是MOOC 標題語義的嵌入表示. 接著，為了量化不同MOOC 視頻的完成率對學習者知識偏好的影響，采用了一種合并的方式將完成率與當前MOOC 視頻字幕文本語義的向量聚合. 具體而言，首先將學習者對當前MOOC 視頻的觀看完成率ri擴展為與字幕語義向量相同維度的全“ri”的向量，然后與Mi拼接得到維度為2d的向量xi:

接著，當前時刻學習者的知識偏好狀態可以表示為

其中為學習者對知識空間中第j個知識的偏好狀態，其含義為學習者完成當前MOOC 后對不同知識點的偏好影響由當前MOOC 與其他知識點的關聯度決定，并將關聯度映射到知識偏好狀態矩陣Hi的第j列. 接著，在時刻t，模型采用LSTM 對學習者的每一個知識點的學習偏好進行更新，即具體計算過程為：

其中Zx?，Zh?，b?是網絡參數，為學習者在時刻t對第i個知識點的偏好狀態. LSTM 是循環神經網絡的一種變體，對于處理長序列依賴問題有出色的性能，與RNN 不同，LSTM 設置了輸入門、遺忘門、輸出門來控制單元狀態在每一個時刻的更新.

3.4 MOOC 推薦

MOOC 推薦過程是從m個未學習的MOOC 視頻中召回n個當前學習者可能感興趣的MOOC 視頻，該過程采用注意力機制的方法計算學習者未學習的MOOC 視頻與過去學習的MOOC 視頻的相似度，并根據學習者當前知識偏好狀態Ht召回n個MOOC 視頻. 具體而言，學習者未學習的MOOC 與過去學習的MOOC 的相似度由它們之間的語義余弦相似度刻畫：

βij為MOOC 視頻字幕語義Mi與Mj的相似度，接著，結合學習者當前的知識偏好狀態Ht計算第i個MOOC 視頻被召回的概率：

其中yt+1為預測信息的表征，W1，W2，b1，b2為模型參數，pt+1表示第i個MOOC 視頻被召回的概率，pt+1值越大，代表學習者對其感興趣的程度越大，最后通過取pt+1前n個最大值作為推薦結果.

3.5 目標函數

模型的目標函數是基于學生MOOC 學習序列的負對數似然函數：

4 實驗與結果

本節介紹了實驗所采用的數據集、對比模型以及評價模型性能的指標. 然后給出了實驗結果以及對實驗結果的分析，包括模型損失下降過程和不同注意力頭數對模型性能的影響分析. 最后，給出了追蹤學習者知識偏好狀態的變化過程和MOOC 視頻關聯性的可視化分析.

4.1 數據集、對比模型和評估方法

本文實驗選用的數據集MOOCCube[32]為中國最大的 MOOC 平臺之一的學堂在線收集的在線學習數據集，該數據集包含了199 199 名學習者在706 門真實在線課程的選課和視頻觀看記錄，這些課程涉及38 181個教學視頻和114 563 個知識概念.

為了驗證MOOCDR-VSI 模型的有效性，本文選取了9 個典型的基準方法的對比實驗結果.

1） MLP[33]. 該方法利用多層感知器來學習用戶-項目交互的協同過濾方法.

2） FISM[9]. 該方法基于內容的方法來生成TopN推薦，該方法將項目相似度矩陣學習作為2 個低維潛在因子矩陣的乘積，緩解了模型的性能由于數據稀疏的增加而減低的問題.

3） NAIS[34]. 該方法基于內容協同過濾的神經注意項目相似性模型，通過注意力網絡區分用戶交互記錄中哪些歷史項目對預測更重要.

4） NARM[35]. 該方法基于一種具有編解碼結構的神經注意推薦機，通過在RNN 中加入注意機制來捕獲當前會話中用戶的連續行為和主要目的.

5） metapath2vec[36]. 該方法是一種異構網絡中元路徑引導的隨機行走策略，能夠捕獲不同類型節點和關系的結構和語義關聯.

6） ACKRec[28]. 該方法是一種基于圖神經網絡的注意卷積網絡知識推薦器，通過構建一個異構信息網絡，以捕獲不同類型實體之間的有效語義關系，并將其納入表示學習過程.

7） HRL[13]. 該方法是一種基于分層強化學習的課程推薦方法，其在NAIS 模型的基礎上改進以去除噪聲數據.

8）文獻[25]方法. 該方法是一種基于多級注意力的方法，通過學習記錄注意、單詞級注意、句子級注意等探索了多個非結構化信息.

9） DARL[37]. 該方法是一種基于動態注意和分層強化學習的課程推薦方法，在每次學習交互記錄中自適應更新課程的注意力權重.

參照大部分MOOC 推薦模型的研究工作，本文實驗采用命中率（hit radio，HR）和歸一化折損累計增益（normalize discount cumulative gain，NDCG）作為評估指標.HR是評價召回準確率的指標，用于衡量成功推薦給學習者的項目數所占的百分比，計算公式為：

其中GT表示所有學習者測試集長度之和，Hitsu@K表示測試集中第u個學習者的推薦列表中的項目數.NDCG是衡量精確度的指標，其值越大，表示推薦準確的結果排名越靠前，計算公式為：

其中為排名在第i位的推薦結果與第u個用戶的匹配度，如果命中測試集中的課程則=1，否則=0，IDCGu@K為DCGu@K的理想值，即可能取得的最大值.

4.2 實驗結果與分析

本文實驗模型參數為：MOOC 視頻標題文本字符長度title_length=10，該長度為標題預處理后文本的最大長度，BERT 隱藏單元數hidden_num=768（即詞向量維度大小），BERT 處理每個MOOC 字幕文本長度text_length=510，多頭注意力機制的頭數num_head=8，batch_size=128，learningrate=0.001，dropoutratio=0.2.實驗將數據集80% 的數據劃分為訓練集與驗證集，20%的數據劃分為測試集. 圖2 展示了MOOCDRVSI 方法的損失曲線. 由圖2 可知，MOOCDR-VSI 經過46 輪的迭代后基本達到收斂，RMSE（root mean square error）穩定在0.89 附近.

Fig. 2 Loss curve of MOOCDR-VSI圖2 MOOCDR-VSI 的損失曲線

實驗結果如表1 所示，MOOCDR-VSI 在HR@5，HR@10，NDCG@5，NDCG@10，NDCG@20 指標上取得了最佳的性能，比目前最優方法分別提高了2.35%，2.79%，0.69%，2.2%，3.32%，實驗結果證明了MOOCDRVSI 的有效性.圖3 展示了HR@K和NDCG@K隨著迭代次數的變化，第47 次左右迭代后趨于穩定，達到了最優效果.

Table 1 Experimental Results and Performance Comparison表1 實驗結果與性能對比

Fig. 3 HR@K and NDCG@K curves vary with the number of epoches圖3 HR@K 和NDCG@K 隨迭代次數的變化曲線

本文采用了多頭注意力從不同語義空間的文本信息提取特征，為了研究不同的注意力頭數num_head對模型性能的影響，實驗分別取num_head= 1, 2, 4, 8,12 進行實驗，不同頭數的注意力對模型的影響如圖4 所示. 圖4 中，當num_head= 8 時，模型獲得最佳效果，當num_head= 1 時，此時的多頭注意機制為自注意機制，隨著注意力頭數的增加，MOOCDR-VSI 性能取得一定提升，這驗證了多頭注意力機制能夠捕捉多方面的信息，深度挖掘MOOC 視頻的個性信息.但當繼續增加多頭注意力的頭數時，導致了MOOCDR-VSI 性能不升反降，這是由于過多的注意力頭數可能會引入噪聲信息從而誤導模型，使得模型性能下降.

Fig. 4 Effect of different attention heads on MOOCDR-VSI performance圖4 不同注意力頭數對MOOCDR-VSI 性能影響

另外，MOOCDR-VSI 模型能夠動態跟蹤學習者隨學習不斷變化的知識偏好和需求，為了證明模型追蹤學生知識偏好狀態的合理性和可解釋性，我們對同一個學習者在6 個知識點的偏好狀態進行可視化追蹤，如圖5 所示，其中深顏色表示對應知識點有較高的偏好狀態. 可以看出，該學習者在完成第5 次學習后，可能對“K_含水層_地質學”和“K_孔隙比_地質學”有較高的興趣；當完成第15 次學習后，該次學習內容可能與“K_透水性_地質學”和“K_孔隙比_地質學”等知識點具有較高的關聯性，因此捕捉到學習者可能有學習相應知識點的傾向，通過不斷追蹤學習者變化的學習偏好和需求能夠使模型更加精準地推薦相關MOOC 資源，并且使得模型能夠提供學習者知識偏好層面的解釋.

Fig. 5 Visualization of learners’ knowledge preference state changing with learning圖5 學習者隨著學習變化的知識偏好狀態可視化

除此之外，MOOCDR-VSI 具有較好的擴展學習者興趣的能力，圖6 展示了基于學習者的學習記錄的MOOC 視頻推薦結果，縱軸為一名學習者已學習過的MOOC 視頻，橫軸為向該學習者推薦的Top 10的MOOC 視頻. 從學習者的歷史學習記錄來看，該學習者可能對“化學”“基因”等學習內容感興趣，在推薦結果中給出了“編碼”“繼承”等非“化學”學科的相關延伸知識，能夠在一定程度上緩解“蠶繭效應”造成的學習者視野日益狹隘等問題，體現了推薦結果的拓展性和多樣性. 另外，模型通過計算MOOC 字幕文本之間的特征相似性而獲得MOOC 內容語義層面的相關性，這種關聯性可作為向學習者推薦MOOC 的依賴信息. 圖6 中格子顏色越深表示課程之間的相關性越高，如“K_氨基酸_化學”與“K_核酸_化學”可能在內容上有較高的相關性，這種相關性可能體現在涉及的知識點或有語義層面的共性特征，這些自動學習到的結果可以作為教育領域的數據補充.

Fig. 6 MOOC video recommendation results and their correlation analysis圖6 MOOC 視頻推薦結果及其相關性分析

5 結束語

本文提出了一種融合字幕信息的MOOC 推薦模型對學習者的知識偏好狀態進行動態追蹤，進而為學習者推薦其可能感興趣的MOOC 視頻資源. 首先通過BERT 編碼器獲得MOOC 視頻的文本語義信息的表征；接著采用多頭注意力機制提取到局部語義特征的關聯性；其次采用基于LSTM 的網絡架構捕獲學習者隨著學習不斷變化的知識偏好狀態；然后通過挖掘MOOC 視頻之間的字幕文本語義關聯性獲得MOOC 之間的相關性；最后結合當前學習者的知識偏好狀態召回TopN個學習者可能感興趣的MOOC 視頻. 這種通過深入挖掘MOOC 視頻內容的方法能夠獲得詞語級粒度的MOOC 個性信息和共性信息，從而獲得更加精準的推薦結果. 除此之外，通過追蹤學習者知識偏好狀態的變化過程和挖掘MOOC 之間的關聯性能夠使模型提供知識層面的解釋性.

后續工作我們將構建的知識圖譜引入多種實體之間，如學生與課程、課程與教師、課程與知識點等的關系作為MOOC 推薦約束的方法. 實體之間并不是相互獨立而是彼此關聯，例如，不同的教師授課具有不同的風格，不同的學習者對不同教師的授課風格具有不同的偏好，因此不同實體之間具有一定的依賴關系，將知識圖譜等輔助信息引入推薦模型獲得不同實體之間的內在關聯，可以作為MOOC 推薦任務的約束條件.

作者貢獻聲明：吳水秀負責模型的搭建與算法的設計；羅賢增和鐘茂生負責模型實現與論文的撰寫；吳如萍和羅瑋負責實驗的可行性分析.