中圖分類號:TP393 文獻(xiàn)標(biāo)志碼:A
0引言
隨著科技的進(jìn)步,AI教育視頻學(xué)習(xí)逐漸成為一種新的學(xué)習(xí)模式。然而,大量AI教育視頻資源引發(fā)的“信息超載”問題,讓學(xué)習(xí)者難以快速找到自己所需的視頻,影響學(xué)習(xí)效率與質(zhì)量。因此,如何高效發(fā)現(xiàn)并推薦與之適配的AI教育視頻,做到因材施教,充分挖掘?qū)W生個性,成為教育教學(xué)中亟待解決的難題。目前,關(guān)于教育資源個性化推送問題,相關(guān)學(xué)者與專家開展了一系列研究。
王南提出基于云計算的推送方法,該方法構(gòu)建基于Hadoop的個性化推送框架,利用潛在狄利克雷分配模型對視頻主題分類,利用基于注意力機(jī)制的卷積神經(jīng)網(wǎng)絡(luò)模型對視頻主題特征提取,同時根據(jù)用戶的歷史瀏覽行為識別用戶興趣,生成個性化推薦列表,實現(xiàn)視頻推送。但該方法運算量較大,導(dǎo)致視頻個性化推送速率較慢。高宇璇等[2]提出網(wǎng)絡(luò)行為追蹤視域下推送方法,該方法結(jié)合學(xué)生的瀏覽習(xí)慣和偏好,構(gòu)建融媒體信息智能混合推送模型,通過分析不同時間段內(nèi)用戶關(guān)注的信息,提取內(nèi)在關(guān)聯(lián)特征,推送符合用戶個性化偏好數(shù)據(jù)信息。但該方法推送精度有待進(jìn)一步提升,推送的視頻用戶點擊率較低。
盡管上述方法在數(shù)據(jù)個性化推送方面取得了一定的研究成果,但是仍然存在不足。為此,文章提出基于用戶屬性的AI教育視頻個性化推送研究。
1用戶數(shù)據(jù)獲取
為方便后續(xù)分析用戶屬性,文章采集與用戶屬性相關(guān)的數(shù)據(jù)信息。用戶屬性數(shù)據(jù)分為動態(tài)數(shù)據(jù)與靜態(tài)數(shù)據(jù)2種,這2種數(shù)據(jù)共同勾勒出用戶多維度的屬性集合。靜態(tài)數(shù)據(jù)涵蓋姓名、性別、年齡等基礎(chǔ)信息。這類數(shù)據(jù)在用戶首次注冊或完善信息時被采集,數(shù)據(jù)較穩(wěn)定,在較長時間內(nèi)不會因用戶行為而發(fā)生變動。動態(tài)數(shù)據(jù)記錄用戶行為軌跡與交互信息,包括但不限于瀏覽記錄、搜索關(guān)鍵詞、訪問時間等[3]。這些數(shù)據(jù)隨用戶操作實時更新,反映用戶在使用AI教育服務(wù)過程中的興趣偏好、瀏覽習(xí)慣及情感傾向。文章對不同類型的用戶數(shù)據(jù)采用不同的采集方式:教育視頻管理系統(tǒng)經(jīng)接口采集用戶行為數(shù)據(jù)與基本數(shù)據(jù);教育視頻App通過接口和數(shù)據(jù)庫采集基本行為及互動數(shù)據(jù);微信公眾平臺、小程序、教育門戶網(wǎng)站分別借助接口與對應(yīng)后臺、原始日志采集這3類數(shù)據(jù)。
綜上,靜態(tài)數(shù)據(jù)獲取依托于AI教育的門戶網(wǎng)站、AI教育管理系統(tǒng)、移動AI教育App、微信公眾平臺等數(shù)字化服務(wù)平臺,經(jīng)系統(tǒng)數(shù)據(jù)整合關(guān)聯(lián)形成完整數(shù)據(jù)集。動態(tài)數(shù)據(jù)采集依賴各數(shù)字化服務(wù)系統(tǒng)4的日志記錄與數(shù)據(jù)分析功能。系統(tǒng)通過埋點技術(shù)記錄用戶的操作行為,將這些數(shù)據(jù)上傳至專門的文件中存儲,用于后續(xù)用戶屬性特征提取。
2用戶屬性模型構(gòu)建
文章基于采集的用戶數(shù)據(jù)信息,構(gòu)建用戶屬性模型,提煉出可量化用戶興趣屬性特征。在構(gòu)建用戶屬性模型的過程中,文章采用“ 1+NX′′ 的邏輯數(shù)據(jù)模型架構(gòu),該框架由用戶標(biāo)識和用戶興趣特征集2個部分構(gòu)成,以整合用戶的靜態(tài)屬性與動態(tài)行為信息。因此,文章建立的用戶屬性模型為:
S=l+NX
式中, s 為用戶屬性模型; l 為用戶基礎(chǔ)標(biāo)識,包括用戶姓名等; N 為用戶AI教育視頻瀏覽興趣,在實際應(yīng)用中,用戶的興趣往往呈現(xiàn)出多元化、層次化的特點,難以用單一的興趣標(biāo)簽來概括[5]。因此,文章將用戶的興趣劃分為科技、娛樂等多個類別,以便更全面地捕捉用戶的興趣偏好; X 為各類別中用戶對AI教育視頻的興趣特征詞,這些特征詞通過量化計算用戶行為數(shù)據(jù)得到,反映用戶在某一興趣類別下的具體關(guān)注點或偏好方向[。文章構(gòu)建的用戶屬性模型如圖1所示。
圖1用戶屬性模型

如圖1所示,文章首先對用戶行為數(shù)據(jù)進(jìn)行多維度分類處理,依據(jù)時間維度、頻次維度以及行為維度劃分用戶行為。其次,為了更深入地理解用戶的個性化需求,文章采用手動歸類的方法,根據(jù)用戶個性化類目中預(yù)先設(shè)定的父子關(guān)系等級體系,對用戶行為數(shù)據(jù)進(jìn)行人工標(biāo)注與歸類,從而得到用戶個性化手動歸類的特征詞。進(jìn)一步地,在各類目下,文章結(jié)合模型學(xué)習(xí)結(jié)果,提取出能夠代表該類目特征的特征詞。這些特征詞以文本內(nèi)容為基礎(chǔ),依據(jù)其在分類體系中的不同層次,劃分為多個類別。底層特征詞以單個字為基礎(chǔ),隨著層次提升,逐漸發(fā)展為詞、短語乃至句子。
3權(quán)重估算
通過計算用戶行為序列集等參數(shù),文章進(jìn)一步計算行為簇內(nèi)的平均相似度和簇間相似度,其公式為:

式中, s(xi,xj) 為用戶屬性模型中2個隨機(jī)向量xixj 之間的相似度。文章綜合這些相似度計算結(jié)果,深入挖掘用戶的興趣特征詞。這些興趣特征詞與前期通過用戶興趣模型學(xué)習(xí)得到的特征詞共同構(gòu)成用戶興趣特征集 Yc ,這2類特征詞均以二元組的形式存在,即每個特征詞都對應(yīng)一個權(quán)重值。其中,用戶興趣模型學(xué)習(xí)后的特征詞權(quán)重默認(rèn)為1;而用戶個性化手動歸類的特征詞權(quán)重則通過公式(3)計算:
式中, σ(t) 為用戶個性化手動歸類的特征詞權(quán)重; e 為經(jīng)驗值; y 為特征詞在分類體系結(jié)構(gòu)中的相差的層數(shù)。利用權(quán)重反映特征詞在分類體系中的相對重要性。
4AI教育視頻個性化推送
文章基于以上估算的用戶屬性權(quán)重,綜合考慮對象、行為、時間、內(nèi)容4種關(guān)鍵因素,描繪用戶的AI教育視頻平臺上的隨機(jī)行為模式,生成AI教育視頻個性化推送列表。對象是區(qū)分不同用戶的一種重要形式,不同用戶對于同一對象的可信度描述往往存在差異。文章通過綜合比值描述這種差異,反映用戶對于特定對象的關(guān)注程度或信任度,其公式為:

式中, E 為用戶對于特定對象的關(guān)注程度; m 為用戶屬性模型中對象總量。為了量化時間對用戶屬性的影響,文章估算用戶上網(wǎng)時間與AI教育視頻瀏覽時間的比值:

式(5)中, T 為時間對用戶屬性的影響程度; ter 為用戶上網(wǎng)時間; twe 為用戶瀏覽AI教育視頻的時間。內(nèi)容是用戶屬性的核心組成部分,也是用戶隨機(jī)行為的中心。為了量化內(nèi)容對用戶興趣的影響,文章利用詞頻-逆文檔頻率(Term Frequency-InverseDocumentFrequency,TF-IDF)算法來提取內(nèi)容中的關(guān)鍵詞,計算其最大TF-IDF閾值。該閾值可以反映內(nèi)容在用戶興趣中的重要性程度。其估算公式為:

式(6)中, D 為內(nèi)容在用戶興趣中的重要性程度; Ri-end?Ri-stand 分別為AI教育視頻文檔中關(guān)鍵詞i的頻率和逆文檔頻率; Rend?Rstand 分別為關(guān)鍵詞 i 在用戶屬性模型中的頻率和逆文檔頻率。行為是用戶對AI教育視頻的具體操作,如收藏、瀏覽、點贊等。不同的隨機(jī)行為往往對應(yīng)著不同的權(quán)重,反映用戶對內(nèi)容的興趣程度或參與度。利用公式(7)量化這種差異:

式(7)中, K 為用戶行為對AI教育視頻個性化推薦的影響程度; U 為用戶屬性模型中用戶行為 Ωn 頻次; Ud 為第 d 種行為的比例。文章通過以上4個用戶屬性模型的影響向量,構(gòu)建AI教育視頻個性化推送模型,其公式為:
H=σ(t)[f(E+T+D+K)]s
式(8)中, H 為推送的AI教育視頻; f 為衰減因子。文章通過以上模型輸出推送的AI教育視頻,向用戶進(jìn)行個性化推送,實現(xiàn)基于用戶屬性的AI教育視頻個性化推送。
5 實驗論證
為了驗證所提的基于用戶屬性的AI教育視頻個性化推送方法在實際場景中的應(yīng)用效果,筆者進(jìn)行以
下實驗。
5.1實驗數(shù)據(jù)
文章實驗使用CourseraAI教育視頻平臺的公開數(shù)據(jù)集GFAAF、JGFAH,其中,GFAAF數(shù)據(jù)集包含151526條行為數(shù)據(jù)、251422條內(nèi)容數(shù)據(jù)、153142條時間數(shù)據(jù)以及122854條對象數(shù)據(jù);JGFAH數(shù)據(jù)集則有136254條行為數(shù)據(jù)、284515條內(nèi)容數(shù)據(jù)、165847條時間數(shù)據(jù)和132594條對象數(shù)據(jù)。
筆者將以上數(shù)據(jù)作為測試數(shù)據(jù),實驗中所有數(shù)據(jù)運算均在Windows10操作系統(tǒng)、2.8GB內(nèi)存、Inteli8CPU的環(huán)境中進(jìn)行。
5.2 實驗設(shè)計
筆者利用本文設(shè)計方法向用戶進(jìn)行AI教育視頻個性化推送,實驗設(shè)計用戶數(shù)量為1000名,向每個用戶推送AI教育視頻一次,通過公式(1)一(8)完成推送的AI教育視頻服務(wù)。筆者在實驗中設(shè)置2組對照組,分別為王南提出的基于云計算的推送方法和高宇璇等[2]提出的網(wǎng)絡(luò)行為追蹤視域下推送方法。方法評價指標(biāo)選擇推送時長與推送視頻平均點擊率,評價3種方法的AI教育視頻個性化推送速率和精度。
5.3實驗結(jié)果與討論
文章實驗統(tǒng)計了不同方法在AI教育視頻個性化推送場景中的時長,如圖2所示。推送的AI教育視頻用戶點擊率如圖3所示。
用戶序號
圖2不同方法推送視頻時長

筆者通過對比圖2、圖3可以得出結(jié)論:設(shè)計方法推送時長不超過 150ms ,比王南的方法快將近30ms ,比高宇璇等2的方法快將近 50ms ,設(shè)計方法在推送速率方面具有絕對的優(yōu)勢;設(shè)計方法推送視頻用戶點擊率在 90% 以上,遠(yuǎn)高于2種主流方法,說明設(shè)計方法推送的視頻可以滿足用戶需求,具有良好的可行性與可靠性。
6結(jié)語
為了幫助用戶更加高效地挖掘出有價值的AI教育視頻資源,文章將用戶屬性融合到AI教育視頻個性化推送中,提出了一種新的推送方法和思路,有效提高了AI教育視頻個性化推送速率和精度。但隨著用戶數(shù)量的逐漸上升,用戶屬性特征的逐漸增加以及對AI教育視頻個性化推送精度要求的逐漸增高,大量的錯誤推送和非個性化推送出現(xiàn),因此,未來筆者將研究AI教育視頻個性化推送方法優(yōu)化與創(chuàng)新以及海量用戶屬性數(shù)據(jù)處理技術(shù),以此提升視頻個性化推送技術(shù)水平。
圖3推送視頻平均點擊率

參考文獻(xiàn)
[1]王南.基于云計算的短視頻媒體資源個性化推送方法[J].兵工自動化,2024(2):16-22.
[2]高宇璇,孫秉珍.“00后”大學(xué)生網(wǎng)絡(luò)行為追蹤視域下的融媒體信息推送研究[J].運籌與管理,2024(3):211-217.
[3]王圓圓.基于用戶畫像的電商平臺營銷信息個性化推薦方法[J].無線互聯(lián)科技,2024(15):14-16.
[4]謝夢怡.基于近鄰傳播聚類的多源異構(gòu)數(shù)據(jù)信息個性化推送方法[J].信息技術(shù)與信息化,2024(7):165-169.
[5]孫志剛.基于RabbitMQ智慧校園消息一站式與個性化推送的研究[J].國際援助,2023(22):97-99.
[6]張博君.基于近鄰傳播聚類的電商商品信息個性化推送研究[J].中國信息界,2024(2):246-248.
(編輯 王永超)
Research on personalized AI education video push based onuser attributes
NIU Muyuan,MA Shibo,WANG Shujun,GAO Yiming,WANG Yanan * (School of Government and Public Affairs, Communication University of China,Beijing 1OoO2O,China)
Abstract:Inresponse to the problems of long push time and low click through rate in the personalized push practice of artificial inteligence(AI)educational videos,thisarticleproposesaresearchonAI educational videopersonalized push based onuser atributes.Thearticle firstcollects userdata from digital service platforms such as AI education portals,AI education management systems,and WeChat public platforms.Basedonthe collected data,a user atribute modelisconstructed toextract quantifiable user interestatribute characteristics.Various typesof user behavior information colected internallare analyzed in depthto estimate weight vectors.Then,thearticle takes into accountthe four keyfactors of object,behavior,time,and content,to describe therandom behavior paterns of users on the AI education video platform,construct a personalized AI education video push model,and achieve personalized AI education video push.The experimental results show that thedesign method has a push duration of no more than 150 ms and a video user click through rate of over 90% .It can achieve personalized,accurate,and fast push of AI educational videos,and has good Application prospects in the field of AI educational video personalized push.
Key words:user attributes;AI educational video; personalization; object;behavior;content