張華欣,韓霄萌,王同梅
(1.天津濱海汽車工程職業學院,天津 300350;2.燕京理工學院,燕郊 065201)
隨著網絡從4G到5G的提升,網絡傳輸速度得到了進一步發展,為大數據時代互聯網信息技術的發展和視頻在線觀看與下載提供了有力支撐。用戶的需求隨著科技的進步更加多樣化,面對如此龐大的信息數據和用戶多樣化的需求,傳統的檢索式影視平臺顯然滿足不了用戶的觀影需求,用戶需要一種可以對龐大影視信息進行準確過濾和快速篩選的技術,保證日常需求,進而保證影視平臺用戶的忠誠度。因此智能推薦系統成為計算機領域研究的重點,其核心推薦算法的研究更是重中之重。
目前國內外關于推薦算法的研究大致從人們點擊、收藏、組群等行為信息中尋找特征并融合進自己的算法,例如協同過濾算法、分類方法等。而電影推薦領域,因舉辦Netflix競賽一直受到人們的重視與關注。隨著海量數據的快速增長,如何迅速找到有用信息成為研究人員研究關注的重點。Lemire等提出了Slope One算法,因其簡單高效,在協同過濾算法中受到很大關注。麻省理工、加州理工大學的學者發表了關于協同過濾的論文,如算法Ringo—音樂推薦,算法Jster—笑話推薦,算法Video Recommender—視頻推薦等。郭貴冰創辦的LibRec團隊開發設計了LibRec系統,它是基于java的開源推薦系統,其中包含了協同過濾、內容推薦在內的70余種推薦算法。
對推薦系統的應用不僅使客戶擁有更好的用戶體驗,更提升了當代互聯網公司用戶的忠誠度。字節跳動公司通過推薦算法,開發了“今日頭條”和“抖音短視頻”兩款用戶過億的應用軟件,算法經過相關性特征、環境特征等信息訓練之后,為用戶推薦感興趣的作品。阿里巴巴公司旗下淘寶網通過記錄用戶購買過的物品、瀏覽過的物品、收藏過的物品、年齡特征等一系列特征因素,建模預測該用戶可能喜歡的商品。豆瓣的電影推薦系統,通過對目標用戶行為偏好的抓取建立預測模型,進而對用戶進行分類。百度公司對統計用戶的搜索行為建模,為用戶推薦其可能需要的信息。以上商業軟件為商業領域推薦算法的研究提供了思路,但因其過于深奧,并不適用于學生學習,尤其是專科學生在算法及計算機應用方面的學習。
本文基于普通高等專科學校學生特點,設計和總結出基于協同過濾的智能影視推薦系統設計與實現,系統的實現可以幫助專科學生詳細了解當前計算機領域熱點內容,幫助學生搭建起算法及系統框架,為學生日后發展奠定基礎。
選用基于用戶的協同過濾算法為本文個性化推薦提供技術支持,其優點在于用戶-評分矩陣越完整推薦準確率越高。原理為:若對用戶A進行智能影片推薦,首先算法計算出與用戶A點擊、觀看等行為相似的用戶群體G,然后把G群體觀看過但用戶A并未觀看的影片推薦給用戶A。
表1是用戶user對項目item的評分,該矩陣的一個行向量表示為用戶-項目評分向量。

表1 m*n用戶-項目評分矩陣
評分數值根據用戶的行為進行分析,表2為顯性評分與隱性評分。

表2 評分內容
本文的智能影視推薦設計使用瀏覽、點擊、收藏獲得隱性評分值,再將該評分制作為評分矩陣。
通過目標用戶和其他用戶相似度的計算,找出和目標用戶具有最大相似值的其他用戶,得到最近鄰的數據集合。相似度計算步驟與方法如表3所示。

表3 相似度計算步驟與方法

中心另一家企業銀川奧特信息技術公司董事長陳華和他的研發團隊深耕智慧農牧領域,研發了“物聯網+奶牛養殖技術”。有了這項技術,牧場主只要輕點手機,即便千里之外,也能隨時隨地掌握奶牛的健康、發情配種等情況。10月12日,奧特公司發布奶牛發情監測解決方案白皮書,進而在這一領域有了 “話語權”。


在用戶最近鄰集合NESi中查找用戶,并將目標用戶與查找到的用戶的相似度的值作為權值,將鄰居用戶對該項目的評分與此鄰居用戶的所有評分的差值進行加權平均。計算方法如下:


構建用戶評分矩陣,軸為項目ID,軸為用戶ID,單元格表示項目評分,單元格內為空表示沒有評分,結果如表4所示。

表4 評分表
假設:已知用戶1和用戶2的向量,使用余弦相似性計算用戶之間相似性,若找到用戶1的最近鄰,則計算用戶1和其他所有用戶的相似度,選擇前十個結果作為最近鄰居。根據此算法,不同的用戶可以推薦出不同的影視,并且對于任意一個用戶,他們的點擊與瀏覽行為均有所不同,因此,可以實現個性化推薦。
系統包括前臺和后臺兩個模塊,前臺功能包括登錄、注冊、首頁、電影分類、電影推薦、用戶中心等功能模塊;后臺包括圖片管理、電影管理、類別管理等功能模塊,系統功能結構圖如圖1所示。

圖1 系統功能結構圖
數據庫的設計使用E-R圖描述各個功能需求,如圖2、3、4所示,采用MySQL數據庫管理數據,用戶表(users)存儲用戶性別等基本信息,電影表(movie)存儲電影片名等基本信息,系統中使用到的主要數據表有admin表、article表、asign表等。

圖2 管理E-R體圖

圖3 影視信息E-R圖

圖4 影視類別信息E-R圖
登錄模塊用來驗證身份,管理員進入后臺管理系統,進行如影片添加、刪除、修改影片信息等操作。注冊功能在注冊界面,輸入用戶名、密碼等信息即可完成注冊,登錄頁面實現如圖5所示。

圖5 登錄頁面
電影推薦模塊可以展示推薦電影,用戶可以查看詳情進行在線觀看、添加、收藏等操作,影片分類模塊主要展示不同類型影片,用戶可以根據自己喜歡的影片類型進行分類查看。方便用戶迅速查找自己喜愛的影片類型,圖6為推薦模塊的實現,圖7為分類模塊的實現。

圖6 推薦模塊

圖7 分類模塊
后臺主要實現了圖片管理、電影管理、類別管理等功能,系統管理員可以通過后臺管理功能來實現對電影推薦系統的管理,圖片管理功能模塊可實現對圖片信息進行查詢、上傳等操作;電影管理功能模塊實現對電影信息的增、刪、改、查操作。
檢驗軟件系統是否符合預定要求的最后一步是系統測試,其不但可以為系統找出更多的錯誤,并且可以給出相對應的解決方法。用戶注冊測試、電影列表測試分別見表5和表6。

表5 用戶注冊測試表

表6 電影列表測試表
測試結果表明,界面完整且跳轉正常,用戶注冊、用戶登錄等功能可以正常使用,電影列表可以正常點擊、評論、收藏,本系統所有功能均可實現,操作簡單、運行性能良好,符合預期設想與用戶需求。
本文以協同過濾算法為主要算法,本著服務職校學生理解與運用機器學習基本算法的實現原則,以講解協同過濾算法為開端,構建系統模型,實現系統設計,完成系統測試,驗證系統的有效性。將來繼續以突破算法為重點,實現更精準的推薦。