劉振棟 羅群

摘要:文章采用教學(xué)視頻標(biāo)簽化標(biāo)注視頻知識(shí)點(diǎn)、類別等信息,職業(yè)教育知識(shí)圖譜以視頻知識(shí)點(diǎn)為中心,基于在線教育平臺(tái)大數(shù)據(jù)構(gòu)建畫(huà)像模型勾畫(huà)目標(biāo)推薦用戶,分析在線教育領(lǐng)域推薦場(chǎng)景,研究基于視頻關(guān)聯(lián)網(wǎng)絡(luò)以“數(shù)據(jù)驅(qū)動(dòng)+知識(shí)驅(qū)動(dòng)”為理念的視頻推薦模式和算法。
關(guān)鍵詞:在線職業(yè)教育;知識(shí)圖譜;學(xué)生畫(huà)像;個(gè)性化視頻推薦
中圖分類號(hào):TP273? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2022)34-0104-03
1 概述
當(dāng)今,隨著云計(jì)算技術(shù)迅速發(fā)展,移動(dòng)設(shè)備、智能終端的普及,教育信息化應(yīng)用更加廣泛。在線開(kāi)放課程就是教育現(xiàn)代化的要求,依靠信息技術(shù)、智能終端和云平臺(tái)技術(shù)而進(jìn)行的具有科學(xué)性、多樣性、開(kāi)放性和創(chuàng)新性的一種教學(xué)方式[1]。在線開(kāi)放課程學(xué)習(xí)方式靈活多樣,同時(shí)可滿足不同層次、不同年齡、不同興趣等廣大學(xué)習(xí)者的需求。2019年以來(lái),線上教學(xué)方式趨于常態(tài)化,在線課程資源的建設(shè)顯得尤為重要。
隨著硬件計(jì)算能力的快速提升和數(shù)據(jù)量呈爆炸式增長(zhǎng),深度學(xué)習(xí)成為研究焦點(diǎn)。在推薦系統(tǒng)領(lǐng)域,相關(guān)的推薦算法也相應(yīng)增多[2]。目前,推薦算法包括基于圖文、用戶以及協(xié)同過(guò)濾、混合推薦等推薦算法。在線個(gè)性化教學(xué)視頻推薦,是從學(xué)生的角度出發(fā),以基于用戶的協(xié)同過(guò)濾式算法將在線學(xué)習(xí)用戶作為分析對(duì)象,在學(xué)習(xí)用戶之間找到相似用戶,這樣就可以面向目標(biāo)用戶、相似用戶和集中感興趣用戶結(jié)合知識(shí)結(jié)構(gòu)邏輯推薦沒(méi)有接觸過(guò)的視頻內(nèi)容,形成推薦[3]。在眾多推薦算法中,AutoRec算法是基于自動(dòng)編碼器(AutoEncoder) 的推薦算法,在視頻推薦過(guò)程中,該算法可根據(jù)輸入用戶訪問(wèn)視頻信息數(shù)據(jù)矩陣來(lái)重構(gòu)新的矩陣,然后根據(jù)用戶訪問(wèn)數(shù)據(jù)從大到小進(jìn)行推薦。2016年,Google發(fā)布了Wide & Deep算法,該算法將寬度模型與深度神經(jīng)網(wǎng)絡(luò)進(jìn)行聯(lián)合訓(xùn)練,結(jié)合Wide & Deep算法優(yōu)勢(shì),形成與AutoRec算法的有益補(bǔ)充,可解決推薦系統(tǒng)等大規(guī)模的帶有稀疏輸入的回歸或分類問(wèn)題。
此外,有文獻(xiàn)提出了一種通用框架,即可以表示和擴(kuò)展矩陣因子分解算法,并且能夠與深度神經(jīng)網(wǎng)絡(luò)相結(jié)合。基于深度神經(jīng)網(wǎng)絡(luò)的推薦算法可以學(xué)習(xí)出在線學(xué)習(xí)用戶和視頻之間的非線性關(guān)系,而不像矩陣因子分解算法只能學(xué)習(xí)在線學(xué)習(xí)用戶和視頻潛在特征的點(diǎn)乘關(guān)系。然而,基于深度神經(jīng)網(wǎng)絡(luò)的推薦算法網(wǎng)絡(luò)架構(gòu)難以改變,也就難以結(jié)合其他的信息改進(jìn)推薦效果[4]。因此,矩陣因子分解算法仍是推薦系統(tǒng)的一把利器。近年來(lái),與深度學(xué)習(xí)相關(guān)的推薦算法正逐年增多,同時(shí)華中科技大學(xué)根據(jù)收集到的用戶歷史行為信息,建立一個(gè)基于標(biāo)簽的視頻流行度預(yù)測(cè)模型。通過(guò)這種方式可以為目標(biāo)用戶預(yù)分配一些流行度高的視頻資源,這不僅能夠提高用戶的體驗(yàn)效果,而且也能有效地解決新用戶的冷啟動(dòng)問(wèn)題[5]。基于以上眾多研究成果和日益成熟的推薦算法,加上神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)等算法的自學(xué)習(xí)屬性,使得在復(fù)雜場(chǎng)景自學(xué)習(xí)的智能視頻分發(fā)機(jī)制的研究上也有了充分的科學(xué)意義。
2 智能視頻分發(fā)機(jī)理分析
視頻作為承載信息量最豐富的數(shù)據(jù)傳輸形式,無(wú)疑是學(xué)生學(xué)習(xí)知識(shí)的重要途徑。面對(duì)海量教學(xué)視頻資源和未來(lái)線上教育發(fā)展、學(xué)生學(xué)習(xí)途徑網(wǎng)絡(luò)信息化的大勢(shì)所趨,研究目標(biāo)是通過(guò)智能視頻分發(fā)機(jī)理,完善學(xué)生學(xué)習(xí)的個(gè)性化路徑,輔助分析并幫助學(xué)生直達(dá)適當(dāng)?shù)膶W(xué)習(xí)視頻資源,實(shí)質(zhì)上為各類學(xué)生、各類需求量身打造個(gè)性化視頻推薦系統(tǒng)。從學(xué)生個(gè)人角度來(lái)看,提高學(xué)生學(xué)習(xí)的主動(dòng)性、積極性以及學(xué)習(xí)效率,幫助學(xué)生一步一步學(xué)習(xí)掌握知識(shí)技能;從建設(shè)智慧教育的角度來(lái)看,使教育搭載上科技發(fā)展智能化的動(dòng)力系統(tǒng),進(jìn)一步完善“智慧教育”這個(gè)大課題,提高優(yōu)質(zhì)教學(xué)視頻資源的利用率;從社會(huì)經(jīng)濟(jì)發(fā)展的宏觀角度來(lái)看,能夠推動(dòng)社會(huì)基礎(chǔ)建設(shè)的教育工作,幫助完善社會(huì)發(fā)展和社會(huì)人才教育培養(yǎng)體系。目標(biāo)通過(guò)為學(xué)生提供更完善好的學(xué)習(xí)服務(wù),逐漸擴(kuò)大來(lái)完善智慧教育的建設(shè)和人才培養(yǎng)體系,最終助力社會(huì)現(xiàn)代經(jīng)濟(jì)和智能科技的蓬勃發(fā)展。
隨著社會(huì)互聯(lián)網(wǎng)等科技的快速發(fā)展和國(guó)家對(duì)于智能科技深入教育行業(yè)的支持,學(xué)生對(duì)于獲取各類知識(shí)和自學(xué)方式發(fā)生了很大的變化,關(guān)于建設(shè)智慧教育的建設(shè)成果不斷涌現(xiàn),出現(xiàn)了很多優(yōu)質(zhì)在線教育平臺(tái),例如科大訊飛的博思智慧學(xué)習(xí)平臺(tái)。針對(duì)在爆炸式增長(zhǎng)的教學(xué)視頻資源和一般推薦機(jī)理在大規(guī)模的視頻信息和數(shù)據(jù)基礎(chǔ)上開(kāi)展視頻推薦業(yè)務(wù)表現(xiàn)不足的現(xiàn)狀,結(jié)合學(xué)生各類實(shí)際學(xué)習(xí)場(chǎng)景的需求,發(fā)現(xiàn)對(duì)學(xué)習(xí)教育這一復(fù)雜應(yīng)用場(chǎng)景的教育視頻分發(fā)機(jī)理研究的必要性和實(shí)用性,進(jìn)一步調(diào)研挖掘從技術(shù)角度驗(yàn)證了這一研究的可行性。目前在線教育的發(fā)展處在快速發(fā)展階段,關(guān)于智慧教育的建設(shè)工作還沒(méi)有很完善,隨著技術(shù)的不斷進(jìn)步,將催生越來(lái)越多的基于人工智能和大數(shù)據(jù)的教育業(yè)務(wù)。
對(duì)智能視頻分發(fā)機(jī)理在教育復(fù)雜場(chǎng)景下的應(yīng)用設(shè)想是一個(gè)全新的發(fā)現(xiàn),同時(shí)也是一個(gè)全新的挑戰(zhàn)。相信依托發(fā)展教育培養(yǎng)人才的重要性和有關(guān)人工智能、大數(shù)據(jù)等科學(xué)技術(shù)的基礎(chǔ)積累,攻克這一難題將只是時(shí)間問(wèn)題。
3 智能視頻分發(fā)因素分析
筆者針對(duì)在線教育復(fù)雜場(chǎng)景下教學(xué)視頻資源,根據(jù)不同學(xué)生的專業(yè)學(xué)習(xí)路徑、認(rèn)知能力、興趣偏好和自學(xué)行為路徑等,分析設(shè)計(jì)各類學(xué)習(xí)視頻推薦場(chǎng)景,充分挖掘大數(shù)據(jù)相關(guān)技術(shù)處理海量視頻數(shù)據(jù),全方位開(kāi)展復(fù)雜場(chǎng)景自學(xué)習(xí)的智能視頻分發(fā)機(jī)理的研究。
通過(guò)前期的教育類復(fù)雜場(chǎng)景設(shè)計(jì)和技術(shù)調(diào)研工作,發(fā)現(xiàn)關(guān)于教育場(chǎng)景自學(xué)習(xí)的智能視頻分發(fā)機(jī)理與普通的智能視頻分發(fā)機(jī)理有很大不同,主要從原理、方法和規(guī)律上進(jìn)行論述。
從原理上,教育視頻推薦算法原理明顯由純數(shù)據(jù)驅(qū)動(dòng)轉(zhuǎn)向“數(shù)據(jù)驅(qū)動(dòng)+知識(shí)驅(qū)動(dòng)”,原因主要體現(xiàn)在視頻數(shù)據(jù)、用戶畫(huà)像和推薦場(chǎng)景的巨大差異上。
視頻數(shù)據(jù)方面,對(duì)一般視頻來(lái)說(shuō),其本身巨大的信息量被濃縮成幾個(gè)標(biāo)簽,例如“生活類”“體育類”“舞蹈類”等。而教學(xué)視頻的屬性標(biāo)簽分析將會(huì)復(fù)雜得多。與普通視頻相比,教學(xué)視頻本身所承載的知識(shí)點(diǎn)的關(guān)系錯(cuò)綜復(fù)雜,受眾層次和知識(shí)深度差異大,視頻分類要求嚴(yán)格等。
用戶畫(huà)像方面,現(xiàn)有的互聯(lián)網(wǎng)相關(guān)視頻產(chǎn)業(yè)的視頻推薦中,用戶畫(huà)像是清晰易構(gòu)建的;而教育場(chǎng)景下要構(gòu)建較高完整度的學(xué)生畫(huà)像,需要分析大量的學(xué)生個(gè)人數(shù)據(jù)、專業(yè)路徑和學(xué)習(xí)行為等,最終系統(tǒng)表現(xiàn)的優(yōu)劣與構(gòu)建學(xué)生畫(huà)像的質(zhì)量成正比。
推薦場(chǎng)景方面,教學(xué)視頻的推薦場(chǎng)景除了常見(jiàn)的包括進(jìn)入平臺(tái)后啟動(dòng)、觀看完視頻后等場(chǎng)景外,還有例如平臺(tái)上答錯(cuò)題目啟動(dòng),學(xué)習(xí)完某知識(shí)點(diǎn)和課程后和完成某學(xué)習(xí)任務(wù)后等諸多較為復(fù)雜的場(chǎng)景,為了完善系統(tǒng)的專業(yè)性,需要充分考慮并設(shè)計(jì)相關(guān)復(fù)雜場(chǎng)景。
從方法上,由于教育類學(xué)習(xí)資源的特殊性,需要整合基于知識(shí)圖譜的學(xué)習(xí)資源,包括制定職業(yè)教育領(lǐng)域知識(shí)圖譜標(biāo)準(zhǔn)、建立統(tǒng)一的知識(shí)點(diǎn)圖譜,積極填充教學(xué)資源和建立知識(shí)圖譜與課程的對(duì)應(yīng)等。另外由于學(xué)生畫(huà)像和推薦場(chǎng)景的復(fù)雜程度,不同于普通的視頻推薦,需要額外分析學(xué)生的認(rèn)知能力和學(xué)習(xí)行為以及交互模式等。在一些通用的視頻推薦系統(tǒng)中主要考慮的目標(biāo)是:準(zhǔn)確度、新穎度、多樣性。而在教育視頻推薦系統(tǒng)中,還需要考慮很大難度的匹配性。
從規(guī)律上,教學(xué)視頻的屬性與普通視頻差異大,所以在一些普遍推薦的規(guī)律,例如加大同類型視頻、同作者視頻等權(quán)重外,還需要重點(diǎn)考慮視頻中知識(shí)點(diǎn)的關(guān)系以及視頻的分類,例如是否同屬于一門課程,知識(shí)點(diǎn)是否重疊,是否跨專業(yè)等因素。教學(xué)視頻的特殊性,使得視頻之間也比一般視頻具有更多的關(guān)系和規(guī)律,都將在系統(tǒng)中被挖掘分析。
4 智能視頻分發(fā)總體設(shè)計(jì)
總體設(shè)計(jì)步驟如圖1所示,第一步:視頻標(biāo)簽預(yù)測(cè);第二步:復(fù)雜場(chǎng)景分析;第三步:構(gòu)建學(xué)生畫(huà)像;第四步:構(gòu)建基于知識(shí)圖譜的視頻關(guān)聯(lián)網(wǎng)絡(luò);第五步:實(shí)現(xiàn)視頻推薦模式及算法。
其中,視頻標(biāo)簽預(yù)測(cè)主要包括構(gòu)建知識(shí)點(diǎn)標(biāo)簽、難度標(biāo)簽。復(fù)雜場(chǎng)景分析包括以題推題場(chǎng)景、以視頻推視頻場(chǎng)景、搜索場(chǎng)景等。用戶畫(huà)像包括:基礎(chǔ)數(shù)據(jù)、行為數(shù)據(jù)構(gòu)建數(shù)據(jù)標(biāo)簽,基于學(xué)生作業(yè)構(gòu)建學(xué)生能力及用心程度標(biāo)簽(進(jìn)行學(xué)生作業(yè)相似評(píng)價(jià),生成用心程度標(biāo)簽),學(xué)生職業(yè)素養(yǎng)、崗位能力標(biāo)簽等。基于知識(shí)圖譜的視頻關(guān)聯(lián)網(wǎng)絡(luò)包括構(gòu)建知識(shí)點(diǎn)圖譜(包括通識(shí)課程知識(shí)點(diǎn)、專業(yè)基礎(chǔ)知識(shí)點(diǎn)、專業(yè)方向知識(shí)點(diǎn)等)與視頻集之間的關(guān)聯(lián)關(guān)系。視頻推薦模式及算法包括自適應(yīng)學(xué)習(xí)算法、適應(yīng)性學(xué)習(xí)算法,自適應(yīng)學(xué)習(xí)包括錯(cuò)題推題、錯(cuò)題推薄弱知識(shí)點(diǎn)、學(xué)習(xí)路徑規(guī)劃等,適應(yīng)性學(xué)習(xí)是指根據(jù)學(xué)生興趣愛(ài)好和習(xí)慣來(lái)進(jìn)行推薦,貫穿學(xué)習(xí)過(guò)程當(dāng)中。
5 智能視頻分發(fā)實(shí)施路徑
實(shí)現(xiàn)智能化視頻推薦,需要解決以下兩個(gè)問(wèn)題:一是如何構(gòu)建基于職業(yè)教育領(lǐng)域知識(shí)圖譜的教學(xué)視頻關(guān)聯(lián)網(wǎng)絡(luò);二是如何依據(jù)視頻關(guān)聯(lián)網(wǎng)絡(luò)進(jìn)行個(gè)性化視頻推薦。為了解決第一個(gè)問(wèn)題,首先引入教學(xué)視頻標(biāo)簽化研究,解決如何給視頻進(jìn)行標(biāo)注知識(shí)點(diǎn)、類別等信息,然后引入職業(yè)教育知識(shí)圖譜將以視頻為中心的資源關(guān)聯(lián)起來(lái),同時(shí)闡述各個(gè)視頻知識(shí)點(diǎn)的關(guān)系。為了解決第二個(gè)問(wèn)題,首先引入項(xiàng)目組已完成的學(xué)生畫(huà)像研究工作,基于在線教育平臺(tái)大數(shù)據(jù)構(gòu)建畫(huà)像模型勾畫(huà)目標(biāo)推薦用戶,然后分析在線教育領(lǐng)域推薦場(chǎng)景,接著研究基于視頻關(guān)聯(lián)網(wǎng)絡(luò)以“數(shù)據(jù)驅(qū)動(dòng)+知識(shí)驅(qū)動(dòng)”為理念的視頻推薦機(jī)制,包括推薦模式和算法。
1) 職業(yè)教育領(lǐng)域教學(xué)視頻標(biāo)簽化
分析描述教學(xué)視頻的屬性,比如所屬學(xué)科、視頻類型、教學(xué)老師、視頻知識(shí)點(diǎn)等。教學(xué)視頻的特殊性,知識(shí)點(diǎn)是否重疊,是否跨專業(yè)等因素使得視頻之間也比一般視頻具有更多的關(guān)系和規(guī)律,都需要被挖掘分析,并進(jìn)行標(biāo)簽化。
2) 基于知識(shí)圖譜構(gòu)建視頻關(guān)聯(lián)網(wǎng)絡(luò)
職業(yè)教育知識(shí)應(yīng)具備體系性、全面性。本研究以博思智慧學(xué)習(xí)平臺(tái)提供的豐富自學(xué)課程數(shù)據(jù)為基礎(chǔ),包括課程頁(yè)任務(wù)、視頻任務(wù)、試題任務(wù)、知識(shí)圖譜、錯(cuò)題集等。其中通過(guò)視頻任務(wù),學(xué)生可直觀地了解到老師需要講授的知識(shí)點(diǎn),是最有效的自學(xué)途徑之一,因此需要所有資源以視頻為中心進(jìn)行關(guān)聯(lián),研究如何利用知識(shí)點(diǎn)圖譜模型的方式對(duì)視頻進(jìn)行表示關(guān)聯(lián),圖譜上的點(diǎn)代表闡述該知識(shí)點(diǎn)的視頻,同時(shí)需要闡述各個(gè)知識(shí)點(diǎn)的關(guān)系。
3) 引入基于平臺(tái)大數(shù)據(jù)構(gòu)建學(xué)生畫(huà)像
在線學(xué)習(xí)平臺(tái)實(shí)現(xiàn)課堂全過(guò)程常態(tài)化應(yīng)用,并將產(chǎn)生大量的數(shù)據(jù)構(gòu)成了包括教師、學(xué)生、管理者在內(nèi),涵蓋課前、課中、課后教學(xué)全過(guò)程多個(gè)環(huán)節(jié)的多維教育大數(shù)據(jù)[6]。
基于上述數(shù)據(jù),將已經(jīng)研究的學(xué)生畫(huà)像成果引入,包括圍繞學(xué)生的三個(gè)層面(事實(shí)層、模型預(yù)測(cè)層、認(rèn)知模型預(yù)測(cè)層)標(biāo)簽,目的是引入平臺(tái)教與學(xué)的行為和活動(dòng)過(guò)程狀況和學(xué)生偏好、認(rèn)知能力等標(biāo)簽。
4) 分析在線教育復(fù)雜推薦場(chǎng)景
學(xué)習(xí)是由人參與其中的社會(huì)活動(dòng),而具有生命和智能特征的系統(tǒng)都是復(fù)雜系統(tǒng)。在研究教育領(lǐng)域時(shí)候,教育系統(tǒng)內(nèi)部學(xué)生、老師、知識(shí)的關(guān)系非線性,因此,要充分考慮學(xué)習(xí)的復(fù)雜性問(wèn)題。同時(shí)在線學(xué)習(xí)系統(tǒng)應(yīng)具有引導(dǎo)性,發(fā)現(xiàn)在學(xué)習(xí)時(shí)需要哪些場(chǎng)景觸發(fā)推薦算法。例如平臺(tái)上答錯(cuò)題目時(shí),學(xué)習(xí)完某知識(shí)點(diǎn)和課程后,或者完成某學(xué)習(xí)任務(wù)后等諸多較為復(fù)雜的場(chǎng)景。
5) 智能視頻推薦算法研究
結(jié)合視頻關(guān)聯(lián)網(wǎng)絡(luò),針對(duì)不同學(xué)校不同層次的學(xué)生,研究如何智能引導(dǎo)學(xué)生學(xué)習(xí)視頻學(xué)習(xí)資源,建立知識(shí)體系,培養(yǎng)學(xué)習(xí)習(xí)慣,幫助學(xué)生一步一步學(xué)習(xí)掌握知識(shí)技能。
6 結(jié)論
通過(guò)在線教育這一復(fù)雜場(chǎng)景下自適應(yīng)智能視頻分發(fā)機(jī)理研究,提出用 “數(shù)據(jù)驅(qū)動(dòng)+知識(shí)驅(qū)動(dòng)”的特色視頻分發(fā)機(jī)理,采用視頻關(guān)聯(lián)網(wǎng)絡(luò)構(gòu)建與智能視頻分發(fā)方法,解決將合適的教學(xué)視頻資源分發(fā)給需要的學(xué)生的問(wèn)題,在整個(gè)智慧教育個(gè)性化推薦的建設(shè)中具有相當(dāng)?shù)膭?chuàng)新性,也給智能驅(qū)動(dòng)學(xué)習(xí)方式變革賦予積極的意義。
參考文獻(xiàn):
[1] 陳亮,戴孝林,文斌.在線開(kāi)放課程的微項(xiàng)目化探究[J].紡織服裝教育,2021,36(6):583-585.
[2] 周瑞環(huán).基于視頻流行度及視頻分類標(biāo)簽的Top-N推薦[D].成都:西南交通大學(xué),2018.
[3] 展淵,王宇.基于用戶行為分析的視頻推薦算法研究[J].電子測(cè)量技術(shù),2017,40(4):39-42.
[4] 周瑞環(huán),趙宏宇.結(jié)合物品流行度的列表級(jí)矩陣因子分解算法[J].計(jì)算機(jī)應(yīng)用,2018,38(7):1877-1881.
[5] 柯偉兵.基于標(biāo)簽的視頻流行度預(yù)測(cè)和推薦算法研究[D].武漢:華中科技大學(xué),2016.
[6] 劉邦奇,李鑫.智慧課堂數(shù)據(jù)挖掘分析與應(yīng)用實(shí)證研究[J].電化教育研究,2018,39(6):41-47.
【通聯(lián)編輯:唐一東】