張羽萍
?
適應性學習系統中用戶與資源畫像研究
張羽萍
(同濟大學 經濟與管理學院,上海 201805)
隨著“互聯網+”與教育的深度融合,適應性學習成為研究的熱點。而構建適應性學習系統的核心步驟之一是構建用戶和資源的畫像。目前研究對于用戶畫像的構建還不夠全面,對于資源畫像的探討更是少之又少。基于系統能收集到的靜態數據(基本信息等)和動態數據(行為信息等),確定用戶和資源的事實標簽,在此基礎上,構建模型標簽,從而畫出用戶和資源的精準畫像。
適應性學習;用戶畫像;資源畫像;標簽系統
適應性學習系統是指在網絡學習環境下,在合適的時間以合適的方式為學習者提供合適的資源,方便學習者高效學習,有利于培養學習者的自主學習能力,提高學習者學習的主動性與積極性。適應性學習系統與傳統的網絡學習不同,傳統的網絡學習系統給學習者提供的是同樣的學習資源和教學策略,并沒有關注到學習者自身的特點,容易造成學習者認知超載和網絡迷航;而適應性學習系統會根據學習者的認知能力,動態呈現相匹配的學習內容,并根據學習者不同的學習風格和需求,提供不同的學習資源和學習活動形式,能夠體現學習者的個性化特征和個性化學習行為[1]。而實現上述精準匹配和推送的前提是構建精準的用戶和資源畫像。本文為有效地支持學習者開展個性化學習,從標簽的類型出發,構建用戶與資源的標簽系統,實現其畫像的精準定位。
從數據提取維度來看,標簽可分為事實標簽、模型標簽和預測標簽。
從學習系統獲取數據,定性或定量描述事務的自然屬性、行為屬性、資源屬性等,以及根據工作人員經驗積累的業務規則進行篩選、分析生產的標簽,比如是否為活躍用戶、是否為臨考生等。
對自然屬性、行為等屬性的抽象和聚類,通過剖析事務的基礎數據為分析對象貼上相應的總結概括性標簽及指數,比如標簽代表用戶的興趣、偏好、需求等,指數代表用戶的興趣程度、偏好程度、需求程度等。
基于用戶的屬性、行為、信令、位置和特征,挖掘用戶潛在需求,針對這些潛在需求配合策略、規則進行打標,同時結合資源的屬性、特征,將其適時、適機、適景推送給用戶。從數據的時效性來看,標簽可分為靜態屬性標簽和動態屬性標簽。
長期甚至永遠都不會發生改變。一些用戶基本信息比如性別、出生日期,這些數據都是既定的事實,幾乎不會改變。
存在有效期,需要定期更新,保證標簽的有效性,比如用戶的偏好、用戶的活躍情況。
構建學生的標簽系統時,我們先根據學生的人口屬性(個人基本信息)和學習屬性(行為信息)來建立事實標簽,再由各個事實標簽提煉出建模時的模型標簽。
學生的人口屬性有姓名、性別、出生年月、籍貫、民族、就讀城市、學校名稱、就讀年級等,其中出生年齡可以確定模型標簽年齡階段、就讀城市可以確定模型標簽地區分布、學校名稱可以確定模型標簽學校級別。
學生的學習屬性用戶關注資源、用戶搜索關鍵詞,可以確定模型標簽用戶學習興趣;學生在進入系統初始填寫的風格量表可以確定學生的學習風格;根據項目之前的問卷調查結果,家長非常重視學生容易題的錯誤率,結合用戶每天登錄系統的次數和花費在學習上的時間,可以確定用戶的學習態度;以往已經有很多的文獻在研究如何確定學生的認知水平,大多都是根據學生做每道題的正確率來確定,本文基于大數據的視角,學生在每個資源上的花費時間及準確率都可以在大規模群體下得到排名,結合其錯題的重復度可以確定學生在大數據下的認知水平;我們不可能無限制地給學生推送題目,應當根據每個學生的承受指數來確定給其推送的題目數量,因此,我們根據學生每天做題的數目、做題的正確率、在系統上花費的時間來確定學生的題海壓力指數[2]。用戶標簽體系如表1所示。
表1 用戶標簽體系
模型標簽(確定權重)事實標簽(確定指數) 人口屬性 (基本信息) 姓名 性別 年齡階段出生年月 籍貫 地區分布就讀城市 學校級別學校名稱 年級 民族 學習屬性(學習行為信息)學習興趣用戶關注資源 用戶搜索關鍵詞 學習風格風格量表 學習態度 (學習投入程度)每天學習的時間 每天登陸系統的次數 容易題的錯誤率 認知水平學生在每個資源上花費時間 學生對每個資源的掌握程度 錯題的重復率 題海壓力指數每天做題數 每天做題正確率 每天在系統上學習所花時間
資源的標簽系統可以分為資源基本屬性和大數據屬性,基本屬性下可以確定的事實標簽有每個資源所屬的知識點、每個資源的內容類型(例如前試、理論、實例、概念詳解等)、每個資源的媒介類型(例如視頻、音頻、文檔、幻燈片、圖片等)、每個資源的初始難度(由教育專家給定)、每個資源的初始重要性(由教育考試大綱給定)。
大數據屬性下,我們收集到所有學生完成該資源的時間分布和對該資源的總體掌握率,根據這兩項,我們可以動態更新該資源的難度值,從而使每個資源的難度值更加精確,有利于精準推送;通過學生對每個資源的瀏覽次數、收藏數、分享數、評論數,同樣可以動態更新資源的重要性;我們根據用戶對該資源的評分、差評次數、資源自身的屬性(例如畫面質量、音頻清晰度等)來確定資源淘汰指數,實現對資源的優勝劣汰,有利用提高個性化推送的質量;最后,根據資源評分、被評論次數、被收藏次數、被點擊次數確定資源的熱度。資源標簽體系如表2所示。
表2 資源標簽體系
模型標簽(確定權重)事實標簽(確定指數) 資源屬性 所屬知識點 資源形式 資源類型(視頻、音頻、圖片、文本和綜合多媒體等) 初始難度 重要性(考試需求) 大數據屬性難度所有學生完成該資源的時間分布 所有學生對該資源的總體掌握率 資源重要性瀏覽次數 資源收藏數 資源分享數 資源評論數 資源淘汰指數被瀏覽次數 用戶評分 資源自身屬性(畫面質量、音頻清晰度等) 差評次數 資源熱度資源打分 評論次數 收藏次數 點擊次數
精準的用戶與資源畫像是構建適應性學習系統的基礎,本文從標簽系統的類別出發,詳細全面地刻畫了用戶與資源的畫像。在此基礎上,下一步的研究可以為各個模型標簽賦予權重,然后對用戶與資源進行匹配,實現精準個性化推薦。
[1]金慕鑫,楊芍,楊金梅.適應性學習系統初探[J].中國管理信息化,2017,20(12):218-219.
[2]楊現民,田雪松.中國基礎教育大數據2016—2017[M].北京:科學出版社,2018.
2095-6835(2018)24-0084-02
G434
A
10.15913/j.cnki.kjycx.2018.24.084
張羽萍(1994—),女,經濟與管理學院,碩士研究生,研究方向為管理科學與工程。
〔編輯:嚴麗琴〕