張凡 劉國營



摘 要: 針對目前高校思政教育課程設置存在的形式單一、針對性不強、缺乏協同效應、無法形成個性化協同育人機制等問題,開發了一款基于改進協同過濾技術的高校思政課程推薦系統,采用基于混合的協同過濾改進算法,通過引入基于用戶興趣時效性變化的逐步遺忘曲線,較好的解決了傳統協同過濾算法存在的效率低、適應性弱、排新性等弊端。開發了對應的高校思政課程推薦系統,通過實際驗證得知,該系統運行穩定,功能完整,具有較強的實用性、魯棒性,對于營造師生協同共贏、形式多樣、個性創新的高校思政教育氛圍具有積極意義,符合新形勢下高校思政教育“澆花澆根,教人教心”的立體育人模式趨勢。
關鍵詞: 協同過濾算法; 算法優化; 思政教育; 逐步遺忘曲線; 協同育人
中圖分類號: TP319 ? ? ?文獻標志碼: A
Abstract: Aiming at the problems of single form, lack of pertinence, lack of synergy effect and incapability of forming personalized collaborative education mechanism in ideological and political education curriculum in colleges and universities, a recommendation system of ideological and political education curriculum in colleges and universities is developedbased on improved collaborative filtering technology. An improved algorithm of collaborative filtering based on hybrid is adopted, and a gradual forgetting tune based on the time-varying interests of users is introduced. The line can solve the disadvantages of traditional collaborative filtering algorithm, such as low efficiency, weak adaptability and novelty. A corresponding recommendation system for ideological and political courses in colleges and universities has been developed. Through practical verification, it is known that the system is stable, functional and complete, with strong practicability and robustness. It has positive significance for creating a win-win, diverse and innovative atmosphere for ideological and political education in colleges and universities. It is in line with the new situation that ideological and political education in Colleges and universities “watering flowers, watering roots, teaching people and teaching hearts” trend of three-dimensional educational model.
Key words: collaborative filtering algorithm; algorithmic optimization; ideological and political education; gradual forgetting curve; collaborative education
0 引言
思政教育課程作為開展高校思想政治工作的主渠道、主陣地,是實踐高校育人機制的重要途徑,也是高校理論課體系的重要組成部分,貫穿高等教育教學全過程,是高校培養社會主義建設者和接班人的重要制度載體[1],在強化高校在校生的價值引領、加強愛國奉獻主旋律宣傳教育,建立全員全過程全方位育人機制等領域發揮著基礎性作用。習近平總書記在全國高校思想政治工作會議上的重要講話從全局和戰略高度指出了高校思政教育的若干重大問題,具有很強的政治性、思想性、針對性和可操作性,是新形勢下開展高校思想政治工作的綱領性文件[2]。目前,高校思政教育大多采用大班級、公開課的方式進行集體授課,存在形式單一、針對性不強、缺乏協同效應、無法形成個性化協同育人機制等問題,基于上述不足,結合新形勢下的高校思政教育信息化需求,開發了一款基于改進協同過濾算法的高校思政課程推薦系統,系統遵循軟件工程一般化設計思想[3],對傳統的協同過濾算法進行優化,引入混合協同過濾算法,通過引入基于用戶興趣時效性變化的逐步遺忘曲線,較好的解決了傳統協同過濾算法存在的效率低、適應性弱,排新性等弊端[4]。上述系統的開發與應用為高校思政教育工作的開展提供了新途徑,有利于提升學生在思政課上的綜合素養,對于營造師生協同共贏、形式多樣、個性創新的高校思政教育氛圍具有積極意義[5]。
1 傳統協同過濾算法的基本原理及不足
協同過濾算法利用群體智慧進行模糊推薦,基于交際范圍內的共同興趣點進行個性化與相關性推薦,該算法在海量的特征點中挖掘出基于推薦規則的若干個個性化興趣點作為備選項。協同過濾算法具有較好的自適應性[6],推薦規則可以根據興趣點不同而自適應調整;協同過濾算法對長尾關鍵詞依然有效,可以較好的解決長目錄興趣點識別與推薦問題;協同過濾算法只依賴于用戶的單維度行為,不進行維度擴展,無需對推薦與預測的內容進行深入了解,具有廣泛的實適用性。協同過濾算法也具有固有缺陷,主要表現在其采用初始數據冷啟動模式,在算法啟動階段需要收集大量的用戶行為列表[7],不適用某些起始數據缺乏的場景。由于協同過濾算法采用群體智慧進行模糊推薦,往往無法很好給出推薦的依據與機理,不適用某些邏輯性較強的應用場合。
根據針對點不同,協同過濾推薦算法可以分為兩類,分別是基于用戶的協同過濾算法(UB-CF)和基于物品的協同過濾算法(IB-CF),本文以基于物品的協同過濾算法為例說明傳統協同過濾算法的基本原理。如圖1所示。
基于物品的協同過濾算法通過用戶對某一商品的個性化評分來建立商品之間的列表關系,然后基于商品之間的列表關系對用戶進行推薦并預測用戶的興趣點[8]。用戶對某一商品的評分代表用戶對商品的態度和偏好,如果用戶同時購買了兩種不同的商品,則表明兩種商品之間具有列表關系,二者具有較高的相關性,當用戶再次購買兩種商品中的一種時,另一種商品則可以預測為用戶的潛在需求。
與基于物品的協同過濾算法邏輯示意圖相對應,首先建立不同用戶對若干商品評分表,獲得若干商品之間的相似度情況,然后進行歐幾里德距離評價,得出歐幾里德距離表,分析不同商品之間的關系密切度的定性關系[9],最后進行皮爾遜相關度評價,得出皮爾遜相關度評價表,得出不同商品之間的關系密切度定量值,然后依據這些商品間的相關度對用戶進行商品推薦。為了驗證模型的實際效果,在Python 3.5.2環境下對模型進行編程實現,調用可視化仿真窗口得出商品間的相關度散點圖,如圖2所示。
2 基于改進協同過濾算法的高校思政課程推薦模型設計2.1 高校思政課程推薦模型的建立
傳統的協同過濾算法通過對比定量形式的關聯程度來表征偏好性,利用最近興趣點集合中的對象協同合作來進行預測并產生推薦對象,傳統的協同過濾算法利用前期收集的冷啟動數據集,通過固定的策略可以實現較好的推薦效果[10]。傳統的協同過濾算法在引入初期,由于沒有大量的可靠數據,存在較嚴重的數據稀疏性,無法有效的為目標用戶找到最近興趣點集合,造成算法實時性較差,當數據稀疏性達到極端時易出現新用戶冷啟動問題,造成系統的擴展性較差。考慮到高校思政課程推薦系統的受眾相對固定且層次一致,采用基于物品的協同過濾算法建立高校思政課程推薦模型[11],建模過程如下:
(1) 收集用戶行為數據
為了避免起始數據稀疏性,通過多種形式收集學生的思政課程偏好數據并根據興趣點的不同進行分組,形成初始冷啟動數據集;對初始冷啟動數據集進行預處理,為了消除數據集中存在的噪聲和用戶的誤操作,采用數據挖掘算法進行數據噪聲的過濾,為了把數據集約束在[0,1]內,需要對數據集進行歸一化處理,一般做法是將各類數據除以此類中的最大值。
(2) 進行相似度的計算
采用基于向量的方法進行相似度的定量計算,基于歐幾里德距離計算理論,假設x,y是n維空間中的任意兩個點,它們之間的歐幾里德距離,如式(1)。d(x,y)=(∑(xi-yi)2)
(1) ?根據公式(1)可知,當n=2時,歐幾里德距離就是平面上兩個點的距離,為了利用歐幾里德距離進行相似度定量計算,對公式(1)進行形式變換,如式(2)。sim(x,y)=1/1+d(x,y)
(2)其中,x,y之間的距離可以表征學生對某一門思政課程的定量偏好程度。
(3) 基于相似度門檻的鄰居計算
在獲取學生對某一門思政課程的定量偏好程度的基礎上,根據定量偏好程度尋找學生-思政課程的鄰居,基于時效性考慮,選用基于相似度門檻的鄰居計算方法,如圖3所示。
對學生-思政課程的鄰居進行最大值的限制[12],基本原則是保證落在以當前點為中心,距離為K的區域中的所有點都作為當前點的鄰居,該算法可以獲取不確定個數的學生-思政課程的鄰居,但是定量偏好程度不會出現大的波動與偏差,特別是在處理孤立點時具有明顯優勢,提高了學生-思政課程鄰居計算的一致性。
(4) 計算推薦
基于相鄰學生和相鄰思政課程信息,形成計算推薦機制,就是將所有目標學生對某一門思政課程的偏好作為一個向量來計算學生-思政課程之間的相似度,得到針對某一門思政課程的的相似課程后,根據目標學生歷史的偏好預測當前學生還沒有表示偏好的思政課程,計算得到一個連續有序排列的思政課程列表作為推薦與預測列表。2.2 高校思政課程推薦模型的優化
為了改善傳統協同過濾算法存在的不足,強化高校思政課程推薦模型的實時性,擴展高校思政課程推薦模型的適用范圍,提出并實現了一種基于改進協同過濾算法的高校思政課程推薦模型。基于高校思政課程推薦系統的實際需求,采用基于混合的協同過濾改進算法,通過引入基于用戶興趣時效性變化的逐步遺忘曲線,較好的解決了傳統協同過濾算法存在的效率低、適應性弱,排新性等弊端,模型優化過程如下:
(1) 引入歷史偏好融合機制
為了克服由于起始數據稀疏性造成的起始用戶冷啟動問題,引入歷史偏好融合機制,將所有學生的歷史偏好信息進行分組融合,根據學生-思政課程評價矩陣按照基于內容的興趣點相似性高低形成歷史偏好融合相似集,計算思政課程間的相似性。如式(3)。sim(i,j)=∑u∈U(Rui-i)(Ruj-j)∑u∈U(Rui-i)2∑u∈U(Ruj-j)2
(3) ?式中U表征所有學生的集合,Rui和Ruj分別表征某一周期內學生u對思政課程i和j的歷史偏好數據,i和j分別表征思政課程i和j的歷史偏好數據在某一周期內的均值得分。
(2) 引入基于用戶興趣時效性變化的逐步遺忘曲線
為了適應學生評分信息在時間維度上的多變性,把歷史偏好融合相似集擴展為動態數據集,逐步適應新時期高校在校生興趣點動態變化的實際需求,提高推薦的個性化、針對性、準確性。針對學生興趣點轉移較快的情況,學生對于時事的偏好,導致推薦效果與時間的相關性非常大,通過引入基于學生興趣時效性的遺忘曲線R=e-ts并對公式(3)進行優化,引入時間衰減因子s(u,v,i),融入時間對推薦規則的影響,則時間衰減因子表示如式(4)。s(u,v,i)=e-αtui-tvitimax-timin
(4) ?式中tui表征學生u對思政課程i產生偏好并評分的時間,tvi表征學生v對思政課程i產生偏好并評分的時間,tui-tvi表征學生u和學生i對思政課程i產生偏好的時間差,timax表征思政課程i被偏好的最大時刻,timin表征思政課程i被偏好的最小時刻,α表示時間衰減因子的衰減速率,基于上述分析,公式(3)可以優化,如式(5)。sim(u,v)=∑i∈luv(Rui-i)(Ruj-j)s(u,v,i)∑i∈luv(Rui-i)2∑i∈luv(Ruj-j)2
(5) ?式中,在計算學生u和學生v之間的思政課程偏好相似程度時,引入了基于學生興趣時效性的遺忘曲線R=e-ts和時間衰減因子s(u,v,i),明確了時間變化對推薦規則的制約,表明學生u和學生v對思政課程i產生偏好的時間相隔越久,學生之間相似性因為時間衰減因子的加入產生的影響就會越小。
2.3 模型仿真驗證
為了驗證引入歷史偏好融合機制、融入基于用戶興趣時效性變化的逐步遺忘曲線機制后的高校思政課程推薦模型的實際工作效果,為了具有一般性和客觀性,采用GitHub開源平臺提供的基于Python 3.5.2內核的Sklearn庫(通過編程設定規模、特征、目標、噪聲等多維限制,利用sklearn庫生成符合條件的模擬數據集),同時利用MovieLens-100k數據集為對照數據集,從思政課程推薦準確率、召回率、覆蓋率、流行度等多維度對優化后的模型進行了仿真驗證,基于Python 3.5.2編譯內核,在PyCharm 3.5環境下進行圖形化示意仿真,采用顯著差異標識在仿真圖中給出對比曲線,實驗用數據集最終仿真結果如圖4—圖7所示。
為了使Sklearn庫提供的測試數據集更貼切高校思政課程推薦模型,對用戶興趣數據集和用戶隱形興趣數據集進行了回歸映射處理,提高了數據集的純凈度,降低了數據集的冗余度,提高了仿真效率。
3 基于改進協同過濾算法的高校思政課程推薦系統設計3.1 系統的功能邏輯設計
通過實際調研一線師生,形成了對基于改進協同過濾算法的高校思政課程推薦系統的功能性需求分析,在此基礎上,對系統的功能邏輯進行設計,遵循軟件工程設計的一般流程,對系統的整體功能框架進行設計[13],系統采用B/S架構搭建實現框架,如圖8所示。
系統的功能模塊設計遵循實用性、模塊化、可擴展的原則,系統的核心模塊主要包括高校思政課程選課子模塊、高校思政課程學生評價子模塊、高校思政課程推薦子模塊、系統維護與更新子模塊等組成,各個子模塊在系統工作流的控制下協同工作,構建高效實用的高校思政課程閉環動態推薦機制,形成良性循環,為高校思政教育工作的開展提供基礎性保障。
3.2 系統工作流模型設計
基于系統的功能邏輯設計思路,結合軟件工程中工作流技術的一般模型,對系統的工作流模型進行設計,保證系統按照預定流程運轉[14]。如圖9所示。
在確定好應用學生群體之后,進行系統初始化操作,主要完成學校目前開設的思政課程信息和以往歷史周期內的學生對各門課程的偏好信息的錄入并對系統數據倉庫寫入初始值,作為改進協同過濾算法的初始冷啟動數據集;啟動思政教育課程個性化評分機制,從多維度效果評價對高校制定的個性化思政教育方案進行評價;啟動思政教育課程個性化推薦子模塊,針對不同學生個體進行個性化精確思政課程推薦,提高學生的興趣點,確保形成高校思政教育“澆花澆根,教人教心”的立體育人局面。
3.3 系統實現環境配置
基于系統面向群體的考慮,系統的實現環境應該具有通用性,可以方便學生在宿舍等日常生活環境中對系統進行便捷訪問,基于系統的工作流模型[15],在VS2016環境下對系統進行編程實現,系統運行在微軟兼容性較強的Windows 8操作系統平臺,服務器采用的硬件設備 CPU為英特爾酷睿i5,主頻2.4GHz,系統運行內存為8GB,存儲空間2TB,網絡帶寬50M獨享,系統數據存儲軟件是微軟的MS-SQLServer2016。為了提高系統的可移植性,采用模塊化設計思路,通過調用動態鏈接庫文件(.dll文件)的形式開發了一款基于改進協同過濾算法的高校思政課程推薦系統[16],該系統可以實現高校思政課程的選課與課程評價、學生對特定思政課程的偏好數據統計、針對不同學生個體進行個性化精確思政課程推薦等功能。
4 總結
為了更好的滿足新形勢下高校思政教育“澆花澆根,教人教心”的立體育人發展趨勢,積極營造師生協同共贏、形式多樣、個性創新的高校思政教育氛圍,針對目前高校思政教育課程設置存在的機械僵化、針對性不強、缺乏協同效應、無法形成個性化協同育人機制等問題,開發了一款基于改進協同過濾技術的高校思政課程推薦系統,采用基于混合的協同過濾改進算法,通過引入基于用戶興趣時效性變化的逐步遺忘曲線,設計了經過優化的高校思政課程推薦模型,通過仿真表明,該模型較好的解決了傳統協同過濾算法存在的效率低、適應性弱,排新性等弊端。系統可以實現高校思政課程的選課與課程評價、學生對特定思政課程的偏好數據統計、針對不同學生個體進行個性化精確思政課程推薦等功能,系統設計邏輯清晰,內在工作邏輯符合軟件工程的一般要求,功能模塊之間劃分合理,較好地完成了預期設計目的,初步具備在我國高校推廣使用的條件。
參考文獻
[1] 孫彥超, 韓鳳霞. 基于協同過濾算法的個性化圖書推薦系統的研究[J]. 圖書館理論與實踐, 2015(4):99-102.
[2] 趙文濤,成亞飛,王春春.基于Logistic時間函數和用戶特征的協同過濾算法[J].計算機應用與軟件,2017,34(2):285-289.
[3] 國強,張旭虎.基于協同過濾算法的MOOC個性化推薦系統[J].信息技術,2017(6):99-103.
[4] 高德毅, 宗愛東. 從思政課程到課程思政:從戰略高度構建高校思想政治教育課程體系[J]. 中國高等教育, 2017(1):43-46.
[5] 高德毅, 宗愛東. 課程思政:有效發揮課堂育人主渠道作用的必然選擇[J]. 思想理論教育導刊, 2017(1):33-36.
[6] 史巍. 論以“課程思政”實現協同育人的關鍵點位及有效落實[J]. 學術論壇, 2018, 41(4):174-179.
[7] 周朝進, 王玉珍. 基于改進協同過濾算法的農產品個性化推薦研究[J]. 邵陽學院學報(自然科學版), 2017(6):28-36.
[8] 何明,孫望,肖潤,等.一種融合聚類與用戶興趣偏好的協同過濾推薦算法[J].計算機科學,2017,44(S2):391-396.
[9] 董卓寧. 運用學生大數據提升高校思想政治工作精準度[J]. 思想理論教育, 2018(4): 108-111.
[10] 王建芳,劉冉東,谷振鵬,等.一種改進專家信任的協同過濾推薦算法[J].計算機應用研究,2018,35(2):354-357.
[11] 吳彥文,齊旻,楊銳.一種基于改進型協同過濾算法的新聞推薦系統[J].計算機工程與科學,2017,39(6):1179-1185.
[12] 王余斌,王成良,文俊浩.基于用戶評論評分與信任度的協同過濾算法[J].計算機應用研究,2018,35(5):1368-1371.
[13] 王袁媛. 基于高校思政課程教育移動學習系統的微視頻功能設計研究[J]. 自動化技術與應用, 2018, 37(11):55-58.
[14] 何平月.“互聯網+”背景下高校思政教育創新模式發展研究[J].宿州教育學院學報,2017,20(3):100-101.
[15] 杜曉霞.基于B/S模式的思政網絡教學系統開發與設計[J].自動化與儀器儀表,2017(5):246-247.
[16] 王曉萍.基于VOD的思政網絡教學系統的開發與設計[J].電子設計工程,2017,25(3):49-52.
(收稿日期: 2019.06.22)