999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于協同過濾和標簽的混合音樂推薦算法研究

2021-04-18 23:45:40黃川林魯艷霞
軟件工程 2021年4期

黃川林 魯艷霞

摘? 要:結合音樂這一特定的推薦對象,針對傳統單一的推薦算法不能有效解決音樂推薦中的準確度問題,提出一種協同過濾技術和標簽相結合的音樂推薦算法。該算法先通過協同過濾技術確定相似用戶,再通過相似用戶對某一歌手的標簽評分預測另一用戶對該歌手的偏好程度,從而選擇更符合用戶喜好的音樂進行推薦,以此提升個性化推薦效率,為優化音樂推薦系統提供參考方法。

關鍵詞:協同過濾;標簽;音樂推薦;推薦系統

中圖分類號:TP312? ? ?文獻標識碼:A

文章編號:2096-1472(2021)-04-10-04

Abstract: Traditional single recommendation algorithm cannot effectively solve the accuracy problem in music recommendation. In view of music, a specific recommendation object, this paper proposes a music recommendation algorithm combining collaborative filtering technology and tags. First, collaborative filtering technology is used to identify similar users. Then, another users preference for a singer is predicted through similar users' tag ratings for the singer. Thus, recommended music is more in line with the users preference, which enhances personalized recommendation efficiency and provides a reference method for optimizing music recommendation system.

Keywords: collaborative filtering; tags; music recommendation; recommendation system

1? ?引言(Introduction)

隨著移動互聯網、云計算、智能終端、物聯網技術的飛速發展,文本、音頻、視頻、圖像、社交網絡等各種各樣的信息在網絡上正以爆炸式的形勢增長,豐富了人們的日常生活和學習工作內容[1-2]。信息技術和互聯網技術的迅速發展產生了海量信息,這些信息雖然極大地豐富了我們的個人需求,但也帶來了信息過載的問題。為了更好地滿足用戶個性化需求,以及解決信息過載問題,推薦系統應運而生。在這個信息過載的時代,互聯網已經成為人們生活中最重要的組成部分,然而,如何從海量的互聯網信息中篩選出我們感興趣的內容就成為一個難題。推薦系統根據用戶興趣愛好等特征,個性化推薦滿足用戶需求的對象,目前已經在電子商務、信息門戶、社交網絡、移動位置服務、多媒體娛樂等領域得到了廣泛應用[3]。

硬件成本的降低和技術的進步導致了數字音樂的快速發展,無論是在線音樂還是移動音樂都深受人們的喜愛。Spotify、Pandora、豆瓣音樂等各類各樣的音樂網站和音樂電臺在飛速發展中為用戶提供了成千上萬首歌曲[1]。然而,大量可用的音樂使得用戶更難以找到他們喜歡的音樂,這就是所謂的選擇悖論[4]。由于音樂具有種類豐富、數量龐大、收聽時間短以及連貫性和次序性等特點,傳統單一的推薦算法并不能有針對性地解決音樂推薦的準確度問題。如Last.fm是通過協同過濾進行推薦的,Pandora是通過內容相似性進行推薦的[5]。本文根據用戶偏好、歌曲標簽進行深度數據挖掘,運用協同過濾和基于標簽的AHP混合推薦算法為用戶推薦適合的音樂,以此提升個性化推薦效率,為優化音樂推薦系統提供參考方法[6]。

2? ?推薦算法(Recommendation algorithm)

推薦算法是推薦系統的核心和關鍵部分,也是該領域研究最活躍的方向之一[7],推薦算法的好壞決定了推薦系統的性能和推薦結果的準確性[8]。協同過濾、基于內容、基于規則等推薦算法各有優缺點,為了取長補短,混合算法將各種推薦算法混合進行使用。

2.1? ?協同過濾算法

在音樂推薦系統中應用最多的一種算法是協同過濾算法,這種算法根據目標用戶的習慣愛好、個人興趣等歷史信息而對事物進行評價[9],然后推薦相關物品給用戶。這些歷史信息可能是用戶的瀏覽或購買記錄,也可能是問卷調查等用戶填寫的相關信息。基于協同過濾的推薦算法具有很強的個性化,可以自動地發現用戶潛在的興趣,從而逐漸提高系統推薦性能[10]。這種方法適合很多推薦對象,包括處理電影、音樂、圖書和酒店等非結構化的對象[11]。協同過濾算法的工作原理如圖1所示。

2.2? ?層次分析法

層次分析法(Analytic Hierarchy Process, AHP)是1980年美國著名運籌學家T. L. Saaty在其論文中首次提出的簡單而又靈活的多準則決策算法[12]。這種算法將決策專家的主觀判斷轉換為定量的客觀表述,本質是一種決策思維方式,把復雜系統分解為各個組成因素,進而按支配關系把這些決策問題的核心影響因素分組,構建層次結構,用層次化模型處理要解決的問題,設置優先級,然后利用兩兩比較的方式,計算每個因素對最終決策的影響程度,最后還要進行一致性檢驗[13]。AHP算法通過如下五個步驟來確定屬性權重,并得出推薦的綜合評分。

第一,定義其評估屬性,把要解決的問題層次化處理,如圖2所示。

第二,構造比較矩陣。

第三,檢驗比較矩陣一致性。

第四,計算矩陣權向量。

第五,得出推薦的綜合評分。

本文核心算法綜合使用了基于用戶的協同過濾推薦算法和基于標簽的AHP層次分析法。首先,分析計算用戶的聽歌記錄,根據用戶選擇歌手的播放次數,建立了用戶與歌手矩陣模型,模型中的每行表示一個用戶,每列表示一個歌手,每個行向量表示用戶對每個歌手的喜好程度,再使用余弦相似度算法尋找目標用戶的相似用戶。然后,基于歌手標簽使用AHP層次分析法生成個性化推薦列表,以此推薦給經過協同過濾算法產生的目標用戶。

3? 個性化的音樂推薦系統(Personalized music recommendation system)

本文的實驗數據來源于世界上最大的社交音樂平臺Last.fm

在網上公布的數據,在這個音樂庫里,有上億首歌曲曲目和來自全球250個國家超過一千萬的歌手[14]。用戶可以在Last.fm音樂網站獲取免費在線聽歌或者下載音樂等多種音樂服務,這使得Last.fm有上千萬的用戶每個月都在線聽歌,產生了海量的用戶數據。這些數據包括用戶編號、聽歌記錄、歌曲名、專輯、標簽(歌手、流派、年代、心情等描述性信息)、好友關系等豐富的信息。

3.1? ?基于用戶的協同過濾算法尋找相似用戶

在個性化的音樂推薦系統中,采用基于用戶的協同過濾算法,一般是通過計算用戶對音樂的偏好相似度,從而得到最近鄰用戶。例如,若用戶1需要進行個性化推薦,需要先找到同用戶1有相同偏好的其他用戶,然后將這些用戶喜歡的、感興趣的并且用戶1沒接觸過的歌曲推薦給用戶1。

余弦相似度是最常用的相似度算法之一,它被廣泛地應用于圖像處理、文檔檢索等領域之中。在協同過濾推薦算法中,評分矩陣中的一行向量代表一個用戶。設向量分別為A、B,元素值是用戶對產品的評分值,0值代表用戶對該產品沒有評分。兩個向量A、B之間的夾角余弦值就代表了這兩個用戶之間的相似度。計算公式如下:

本文選取音樂平臺中聽歌行為比較頻繁的用戶,其用戶編號為135、257、397、560、935、1551,以用戶播放次數為評分依據,得到用戶對歌手的行為矩陣,如表1所示。

根據矩陣數據,對用戶進行兩兩比較,使用公式(1)計算用戶之間的相似度,計算結果如表2所示,例如用戶135與用戶257的相似度為0.38。由此可知,與用戶935最相似的用戶為用戶257,相似度為0.73。

用戶257的播放列表中有50位歌手,其中有15首在用戶935的播放列表中。即如果把用戶257的播放列表中的50位歌手都變成推薦列表推薦給用戶935,則準確率為15/50×100%=30%。如果可以對用戶257的播放列表中的50位歌手按照用戶935的收聽喜好再進行一次篩選推薦,則可以有效地提高推薦的準確率。

3.2? ?基于標簽的AHP層次分析法推薦音樂

標簽是信息系統中用來代表一段信息的無層次的關鍵詞或術語,通過這種用來描述物品的關鍵詞,可以輔助系統對物品的檢索。不同系統打標簽的方式不盡相同,有作者或專家打的標簽,也有普通用戶打的標簽。用戶可以以個人非正式化的語言來編輯標簽,表達對物品的看法。利用這些標簽數據能夠反映用戶的興趣偏好,將其引入推薦系統中,可以輔助建立偏好模型,提高推薦系統的性能。通過數學的方法,使用AHP量化決策因素獲得相對于目標層決策問題重要程度的比較值。整個過程需要經過以下四個步驟:

(1)建立問題模型

AHP層次分析法建立了目標層、準則層、方案層三層模型,來定量分析那些抽象而主觀的決策問題。本文擬推薦的目標用戶為用戶935,影響用戶對歌手喜愛度的因素有很多。在聽歌過程中,用戶935最感興趣的標簽包括電子音樂(electronic)、電子體音樂(ebm)、工業音樂(industrial)、德國音樂(german)、合成音樂(synthpop)、暗黑電音(dark electro),這些標簽的使用次數如表3所示,以此構建的推薦層次分析模型如圖3所示。

由表3可以看出,用戶935在選擇歌手時最看重的是“電子音樂”,而“暗黑電音”的重要性是最低的。

(2)構建比較矩陣

采用1—9量化指標構建比較矩陣,來量化因素之間的重要程度。通過評價因素兩兩之間的相對重要程度,來得到某一決策問題的影響因素相對于解決該問題的權重。通過對全局的統籌把握,決策人對比兩兩因素之間的重要性,以此劃分為同等重要、稍微重要、明顯重要、強烈重要和極其重要共五個等級,并且每個等級都用1—9的數字進行標注[13],如表4所示。

影響用戶對歌手喜好的因素有很多,且不同的用戶有不同的權重考量,通常用戶意識中對于這些因素重要性的考慮都是不清晰的。采用九級標度法構造這些因素間重要程度比較矩陣,通過求解比較矩陣的特征向量,得到各因素相對重要性程度的權重向量,從而將各因素的重要性進行量化[15]。以目標用戶935所做的比較矩陣為例進行說明,如表5所示,例如:“電子音樂”相對于“工業音樂”的重要程度是4,而“工業音樂”相對于“電子音樂”的重要程度是1/4。

(3)檢驗矩陣的一致性

使用AHP方法,無論在何種階段、由何人分析,最終得到的決策結果都不能過分偏離理想決策方案,即需要保持思維的一致性。對于比較矩陣是否具有完全一致性,AHP決策分析法提出了數學化的指標:一致性指標CI(Consistency? Index)。利用CI反映比較矩陣偏離一致性的程度,CI值越大,表示該矩陣偏移一致性程度越大,反之越小,其計算如公式(2)所示:

其中,為比較矩陣A的最大特征根,n為比較矩陣的階數。通過計算可得,用戶935所做的比較矩陣中最大特征值=6.3684,根據公式(2),CI=(6.3684-6)/5=0.0737。

AHP通過引入平均隨機一致性指標RI(Random Index),對比較矩陣進行一致性檢驗,避免比較矩陣出現邏輯性錯誤[16]。RI與n值的對應關系如表6所示。

通過隨機一致性比率CR(Consistency Ratio)的大小檢驗比較矩陣的一致性,如公式(3)所示:

當CR<0.10時,說明比較矩陣構建合理,通過一致性檢驗;反之,當CR≥0.10時,說明該比較矩陣包含邏輯判斷錯誤,就需要修正比較矩陣。用戶935所做的比較矩陣A為六階矩陣,所對應的RI值為1.24。根據公式(3),CR=0.0737/1.24=0.0594,經計算CR<0.10,通過一致性檢驗。

(4)計算矩陣權向量

一致性檢驗通過合格后,構建的比較矩陣就可以用來計算每個因素的權重值。計算得到的權向量為:

U=(0.8243,0.4700,0.2636,0.1454,0.0819,0.0480)

權向量U的各分量即為歌手在用戶935心中的重要性量化數值,可以看出,電子音樂、電子體音樂、工業音樂、德國音樂、合成音樂、暗黑電音在用戶935中的重要性依次為0.8243、0.4700、0.2636、0.1454、0.0819、0.0480。

(5)歌手的綜合評分

本文在Last.fm音樂網站中抽取了目標用戶935的相似用戶257對六位歌手關于評價因素的播放次數,如表7所示。

這里把播放次數作為標簽評分,用戶257對某位歌手的“電子音樂”標簽評分為h1,而“電子音樂”在用戶935心中的重要性為0.8243,那么可以認為該歌手的“電子音樂”在用戶935心中的加權評分為0.8243h1。同樣,計算電子體音樂、工業音樂、德國音樂、合成音樂、暗黑電音在用戶935心中的加權評分,分別計為0.4700h2、0.2636h3、0.1454h4、0.0819h5、0.0480h6。將各個因素的評分相加即為該歌手在用戶935心中的綜合評分H:

H=0.8243h1+0.4700h2+0.2636h3+0.1454h4+0.0819h5+0.0480h6

按照以上步驟分別計算歌手1、歌手2、歌手3、歌手4、歌手5、歌手6的綜合評分:

H1=0.8243×2+0.4700×5+0.2636×8+0.1454×4+0.0819×9+0.0480×1=7.4741

H2=0.8243×6+0.4700×4+0.2636×5+0.1454×2+0.0819×7+0.0480×3=9.1519

H3=0.8243×9+0.4700×7+0.2636×2+0.1454×4+0.0819×5+0.0480×6=12.5150

H4=0.8243×7+0.4700×8+0.2636×3+0.1454×3+0.0819×2+0.0480×5=11.1609

H5=0.8243×8+0.4700×9+0.2636×4+0.1454×5+0.0819×6+0.0480×3=13.2412

H6=0.8243×6+0.4700×2+0.2636×3+0.1454×4+0.0819×7+0.0480×9=8.2635

最后將綜合評分較高的歌手3、歌手4、歌手5推薦給用戶935。

按照上述AHP推薦方法,對用戶257的播放列表中的50位歌手全部進行綜合評分,篩選出評分較高的25位歌手進行推薦,實驗表明,推薦列表中有13首歌曲都是目標用戶935測試集中的歌曲,準確率為13/25×100%=52%。

4? ?結論(Conclusion)

隨著音樂業務的迅猛發展,音樂庫越來越豐富,用戶喜好的差異化也越來越大。現在音樂業務推廣的一個難點就是如何便捷、快速地從龐大的音樂庫中對用戶進行精準的個性化推薦。本文通過對音樂網站中保存的海量用戶行為記錄進行分析,通過協同過濾算法確定相似用戶,再基于用戶的興趣標簽,為用戶做出個性化音樂推薦,給音樂領域的推薦算法提供了一種新的思路和參考。

參考文獻(References)

[1] 金蕾.個性化音樂推薦算法的研究與實現[D].濟南:山東大學,2017.

[2] 盧麗靜,朱杰,楊志芳.基于大數據的個性化音樂推薦系統[J].廣西通信技術,2015 (1):24-27.

[3] 劉治宇.基于混合推薦算法的情境感知音樂推薦系統研究與實現[D].成都:電子科技大學,2015.

[4] HYUNG Z, LEE K. Music recommendation using text analysis on song requests to radio stations[J]. Expert Systems with Applications, 2014, 41(5):2608-2618.

[5] CAI R, ZHANG C, WANG C, et al. MusicSense: Contextual music recommendation using emotional allocation modeling[C]. The 15th ACM International Conference on Multimedia, 2007.

[6] 胡昌平,查夢娟,石宇.融合個體興趣與群體認知的音樂個性化推薦模型[J].信息資源管理學報,2018,29(2):97-103.

[7] 李新衛.基于Hadoop的音樂推薦系統的研究與實現[D].西安:西安工業大學,2018.

[8] 李卓遠,曾丹,張之江.基于協同過濾和音樂情緒的音樂推薦系統研究[J].工業控制計算機,2018,31(7):130-131;134.

[9] 林麗姍.基于協同過濾算法的社區音樂推薦系統的設計與實現[D].長沙:湖南大學,2016.

[10] 蔡英文.基于多屬性評分的電子商務個性化推薦算法研究[D].南昌:江西財經大學,2016.

[11] 董曉梅.圖書借閱系統中的協同過濾推薦技術研究[D].大連:大連理工大學,2015.

[12] 李亮.評價中權系數理論與方法比較[D].上海:上海交通大學,2009.

[13] 王璐.基于本體的個性化推薦系統[D].成都:電子科技大學,2013.

[14] 蔡瑞瑜.基于社會上下文約束和物品上下文約束的協同推薦[D].杭州:浙江大學,2012.

[15] 郭宇紅,楊金然.一種基于AHP的智能電影推薦方法[J].南京郵電大學學報(自然科學版),2015(35):105.

[16] 單毓馥,李丙洋.電子商務推薦系統中服裝推薦問題研究[J].毛紡科技,2016,335(5):70-73.

作者簡介:

黃川林(1979-),女,碩士,副教授.研究領域:電子商務數據分析,個性化推薦.

魯艷霞(1977-),女,碩士,教授.研究領域:輿情分析,應急管理.

主站蜘蛛池模板: 91精选国产大片| 国产91高跟丝袜| 中文成人在线| 中文字幕天无码久久精品视频免费| 亚洲日韩AV无码一区二区三区人| 先锋资源久久| 无码综合天天久久综合网| 久草视频一区| 91在线激情在线观看| 欧美日本激情| 99视频在线免费观看| 国产精品无码一区二区桃花视频| 九九这里只有精品视频| 欧美激情伊人| 伊人中文网| 日韩精品一区二区深田咏美| 日韩精品无码免费一区二区三区 | 亚卅精品无码久久毛片乌克兰| 91久久性奴调教国产免费| 精品视频第一页| 孕妇高潮太爽了在线观看免费| 亚洲国产欧美自拍| 日韩欧美在线观看| 久久无码高潮喷水| 狠狠亚洲五月天| 日韩免费毛片| 国产一级毛片网站| 欧美日韩国产精品va| 國產尤物AV尤物在線觀看| 国产成人一区在线播放| 亚洲av无码人妻| 97视频在线精品国自产拍| 久久黄色免费电影| 永久在线精品免费视频观看| 亚洲最新地址| 亚洲美女久久| 久久综合干| 色哟哟国产精品一区二区| 成人日韩精品| 国产91精品调教在线播放| 一级毛片网| 美美女高清毛片视频免费观看| 久久人体视频| 一级片一区| 激情爆乳一区二区| 国产在线精品99一区不卡| 国产伦精品一区二区三区视频优播| 制服丝袜亚洲| 99性视频| 999在线免费视频| 国产在线视频欧美亚综合| 欧洲精品视频在线观看| 国产精品视频观看裸模| 欧美在线精品怡红院| 久久视精品| 亚洲无码熟妇人妻AV在线| 国产欧美日韩另类精彩视频| 国产视频a| 久久久精品久久久久三级| 国产美女主播一级成人毛片| 国产一二视频| 国产高清不卡视频| 亚洲色欲色欲www网| 国产又粗又爽视频| 精品久久久无码专区中文字幕| 二级毛片免费观看全程| 国产精品欧美在线观看| 高清欧美性猛交XXXX黑人猛交| 久久久久国色AV免费观看性色| 99国产精品一区二区| 露脸国产精品自产在线播| 国产精品yjizz视频网一二区| 中文字幕有乳无码| 国产精品福利一区二区久久| 国产成人精品日本亚洲77美色| www.亚洲国产| a级毛片免费在线观看| 国产成人精品一区二区秒拍1o| 亚洲国产成人无码AV在线影院L| 伊人久久大香线蕉成人综合网| 自偷自拍三级全三级视频| 亚洲国产成人久久精品软件|