999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

推薦系統中的算法

2019-10-14 12:01:36黃茂洲
科技風 2019年1期
關鍵詞:數學

黃茂洲

摘 要:近些年隨著大數據時代的來臨,人們對于信息的需求量日益增多。那么,由此產生的一個自然的問題是:我們如何在浩瀚的數據海洋中盡可能準確地找到自己所感興趣的內容呢?由此,在計算機科學領域中便產生了一個特定的研究領域——個性化的推薦系統。而推薦算法正是推薦系統的核心所在。個性化的推薦系統運用在生活的不同領域中,它主要是利用用戶的行為數據和其之相關的物品屬性等,通過特定的數學算法來達到向用戶推薦所感興趣信息的目的。現代個性化的推薦系統所利用的推薦算法可以分為4種,在這篇論文中,我們將分別來討論這四種不同的推薦算法的特征。

關鍵詞:數學;理論計算機科學;推薦系統;算法

1 導引

數學是計算機科學的基礎。在二十世紀六、七十年代時,計算機科學在當時僅僅數學的一個分支。一個很典型的例子,便是世界上第一個計算機科學的博士霍蘭德,在密歇根大學攻讀博士學位時,一開始便是學習的是數學專業,后來轉到了密歇根大學新成立的計算機與通信科學系,而這也成為世界上第一個真正的計算機科學系。

當時光進展到二十一世紀時,計算機科學這個領域已經擁有了非常廣闊的研究領域與眾多不同方向的科研人員。而此時,計算機科學在很多方面地發展,已經開始從相反的方向來推動數學的發展。但是,在其中,一個始終沒有發生變化的核心主題便是,計算機科學的數學基礎,也就是理論計算機科學。

理論計算機科學的一個重要的研究課題便是設計適應于計算機科學中的各種不同應用場景的算法。算法指的是程序員通過特定的計算機語言,輸入計算機系統中的一系列解決特定問題的清晰而明確的指令,使得計算機能夠在有限的時間以內得出所符合設計要求的計算結果。

一個特定的算法都必須具備自己的要素(數據對象的運算和操作)以及五個基本特征(有窮性,確切性,輸入,輸出項及可行性)。

在這篇論文中,我們主要通過機器學習中的現代個性化的推薦系統這個主題,去嘗試討論四種不同的推薦算法的特征。

2 推薦算法

計算機與網絡早已經融入到了我們的日常的生活、學習、生活中,成為了我們不可或缺的助手與朋友。隨著近四、五十年計算機科學的高速發展,計算機與網絡已經徹底改變了我們的日常生活、學習、工作習慣。

智能化是理論計算機科學研究的一個主要目標,近些年來的實踐已經充分證明,機器學習的方法雖然在一些特定的問題環境下還存在一些局限性,但是總體來說它是當前實現智能化這個目標最有效的一個方法。

學習僅僅是計算機科學中的一個專門術語,用更為嚴格的數學語言來說,學習即是統計的意思。機器學習,簡單地說,僅僅是利用計算機這個平臺,利用統計學的方法,去對數據集進行分析與歸納。現代個性化的推薦系統便是機器學習中的一個重要的主題,也是我們日常生活中較為熟悉的一個機器學習的貼切的例子。推薦算法是推薦系統的核心所在,一個特定的算法本質上就是一個計算的過程。推薦算法的計算主要來自于數學中的線性代數與概率統計,其中一個核心的概念,便是矩陣。

正如我們上面所提到,機器學習中的學習的意思等價于概率論中的統計,那么構成機器學習理論的一個重要數學分支是概率統計便不會讓人感到太奇怪。但是,另一方面,什么是矩陣?什么是線性代數呢?矩陣這個詞看似十分的抽象,事實上,一個矩陣僅僅是一個數或者文字的一個排列而構成的一張表格。我們可以對矩陣定義加法,減法,乘法等等基本的運算。通過這些計算的規則去研究矩陣的各種性質的學科,便是線性代數。

在日常生活中,許許多多的APP或者各式各樣的網站會根據顧客的瀏覽歷史記錄或是其他的相關數據,較為準確的給顧客們推薦他們所感興趣的內容,例如網易云音樂的每日推薦和亞馬遜的推薦讀物等等。這些看似神奇的推薦應用背后其實都僅僅是依靠著特定的推薦算法來實現的。

正如我們在第一節的最后所總結的一樣,推薦系統中的各種算法也具備算法的基本條件,但它們的特別之處在于它們是在通過一個特定的矩陣來分析各個用戶的行為數據而得到的一些相關的統計結果(如下圖所示),這其實就是為什么推薦系統一般能夠準確的得出一個人的喜好的背后原理所在。

上面的統計圖代表了一個虛構的音樂收集矩陣。不同的數字所代表的意義如下:單曲循環=5,分享=4,收藏=3,主動播放=2,聽完=1 拉黑=-5如此類推。最后把得分最高的歌曲推薦給相應的用戶即可(如下圖所示)

一個矩陣也許很復雜,線性代數中的一個常用的方法,便是把矩陣分解成一些更簡單的矩陣的乘積,通過研究這些更簡單的矩陣,來得到原始矩陣的一些有用的性質。矩陣的UV分解是線性代數中分解一個矩陣的經典的方法,我們在這里不做詳細地解釋,但是我們推薦對此感興趣的讀者去參看參考文獻[2]中的第二章。

利用矩陣的UV分解將每個用戶的潛在因子求出,再利用解析幾何中高維歐幾里得空間中兩個向量夾角的余弦公式相乘就可以得出得分矩陣。于是系統把得分最高的歌曲推薦給相應的用戶即可(如下圖示,統計圖中的紅色的字體即代表推薦的歌曲)

現代個性化的推薦系統所利用的推薦算法主要可以分為4種,在下面,我們將分別來討論這四種不同的推薦算法的特征。此外,在一些特定的問題中,還會涉及到一些非傳統的,并不常用的推薦算法,限于篇幅,我們在這篇文章中暫不介紹,感興趣的讀者可以參看參考文獻[1]中的相應章節。

第一種方法是基于對象的行為數據的協同過濾算法(Collaborative Filtering,CF)。通過在對象的歷史行為(例如用戶的瀏覽記錄,購買記錄等等)歸納出一種特定的模式,再通過這些行為記錄,利用一些基本的統計知識來分析這些用戶的歷史行為與產品的相似度。最后推薦將相似度最高且此用戶未瀏覽過的內容推薦給用戶。這種算法可依據收集的用戶的歷史數據,來推薦世界上的任何一種東西。這個算法的實施步驟主要來說可分為三個主要的階段:(1)收集、分析各個用戶的行為記錄。(2)尋找相近用戶。也就是找到和該用戶相似度最高的用戶。為了達到該目的,一般會使用調整余弦相似性來計算。

(3)推薦。將計算得出相似度最高的產品且該用戶當前沒有瀏覽過的產品推薦給該用戶即可。這個算法的優點是所需要的產品的知識較少,推薦內容準確,推薦領域較廣等等。但它的缺點是強烈地依賴用戶反饋的準確性和數量,新用戶無法得到相應的反饋等。

第二種的推薦算法是基于流行度:這種算法是現在的機器學習應用領域中最為常見也是當前應用得最為廣泛的算法。原因是因為這個算法的運算方式非常簡便迅捷。將各個項目的流行度進行排序,再將排行靠前的流行項目推薦給用戶即可。例如微博的熱搜,音樂APP中的最熱歌曲,各大新聞等。這個算法的優點是算法簡單,操作簡便快捷,推薦內容適用于大眾和新用戶。而它的缺點是不能推薦相對個性化的內容和領域。

第三種算法是基于內容的推薦算法。假如我是一款系列游戲的愛好者,當游戲商更新了這個游戲新的一個版本時,那么我一定會很感興趣,但以上的兩種算法都不太可能將這個更新結果推薦給我。那么這時候就會利用基于內容的推薦算法。它的理論依據主要來源于信息的過濾和檢索。通過分析用戶的歷史搜索記錄或是其他的相關的歷史行為數據,從中提取關鍵字標簽,如下圖示

然后推薦系統將這些標簽視作屬性,將用戶與數據視為歐幾里得空間中的不同向量想,系統計算出各個向量的距離,這個距離就從數值上反應了內容與用戶的相似度了。這個算法的優點是能夠比較好的解決冷啟動問題,也不會被流行度所限制,因為算法本身是直接根據內容來進行檢索。而它的 缺點是過度專業化,需要較高的產品知識與龐大的數據構造分類器。基于內容的推薦算法會一直根據標簽給用戶推薦與他們密切相關的內容,而使得推薦失去了原本的多樣性。

最后一種推薦算法是基于模型的推薦算法。基于模型的推薦算法有不同的具體實施過程,而且他們幾乎都用到了機器學習中的一些經典的方法。一般最簡單的基于模型的方法是logistics回歸預測,推薦系統通過分析用戶的歷史購買、瀏覽記錄等行為數據,得出有限多個影響用戶的特征屬性,例如性別,年齡,地區等等。用一個變量來代表著用戶對特定產品的喜好程度。于是,這些數據形成了一個二維平面中的散點圖,推薦系統通過線性回歸擬合出一個近似函數,函數上的點來近似這些統計數據。接著系統再分別算出這些特征屬性所對應的系數,便可以得出對應物品的權重值,權重值越大就代表這個產品對用戶越重要。基于模型的算法十分快速,一般用于新聞和廣告領域,它的優點是推薦的內容可以多樣化,而它的缺點則是算法局限于時效性。

3 總結和將來的工作

機器學習中的現代個性化的推薦系統與我們的日常生活有著密不可分的聯系,它使我們的眼界更加開拓。隨著現代計算機科學地迅速發展,推薦系統中的核心——推薦算法也在不斷的發展,但每一種算法都還是存在著一定的局限性。在將來的工作中我們可以注重在技術方面上解決這些問題,通過更深入地學習數學與理論計算機科學知識,去嘗試設計更好的推薦算法,使得推薦系統可以更加成熟。

參考文獻:

[1]李航,統計學習方法,第1版,北京:清華大學出版社,2012.

[2]伊恩·古德費洛,約書亞·本吉奧,與亞倫·庫維爾,深度學習,第1版,人民郵電出版社,2017.

猜你喜歡
數學
中等數學
中等數學(2021年4期)2021-12-04 13:57:52
中等數學
中等數學(2021年7期)2021-12-03 04:01:41
中等數學
中等數學(2021年1期)2021-12-02 03:08:08
中等數學
中等數學(2021年3期)2021-12-02 00:28:14
中等數學
中等數學(2020年11期)2020-12-18 01:23:21
我們愛數學
我為什么怕數學
新民周刊(2016年15期)2016-04-19 18:12:04
數學到底有什么用?
新民周刊(2016年15期)2016-04-19 15:47:52
我難過,因為我看到數學就難過
數學也瘋狂
主站蜘蛛池模板: 成人伊人色一区二区三区| 日韩国产一区二区三区无码| 国产白浆在线| 亚洲中文精品人人永久免费| 亚洲视频一区在线| 女人18一级毛片免费观看| 免费国产高清视频| a国产精品| 国产精欧美一区二区三区| 九色视频线上播放| 成人字幕网视频在线观看| 最新国语自产精品视频在| 精品剧情v国产在线观看| 无码福利视频| 国产女人综合久久精品视| 久久国产精品夜色| 91极品美女高潮叫床在线观看| 色噜噜综合网| 精品综合久久久久久97超人该 | 黄色网页在线观看| 中国精品自拍| 91精品啪在线观看国产60岁 | 亚洲国产成人麻豆精品| 国产一级毛片在线| 国产精品国产主播在线观看| 日韩欧美中文| 亚洲人妖在线| 精品欧美日韩国产日漫一区不卡| 亚洲免费播放| 国产99精品视频| 久久人妻xunleige无码| 色一情一乱一伦一区二区三区小说| 亚洲成在人线av品善网好看| 亚洲人成在线免费观看| 日本一区二区三区精品国产| 婷五月综合| 亚洲日韩AV无码精品| 国产精品片在线观看手机版 | 欧美亚洲综合免费精品高清在线观看| 国产高清无码麻豆精品| 精品国产aⅴ一区二区三区| 免费 国产 无码久久久| 无码网站免费观看| 97国产精品视频人人做人人爱| 操国产美女| 性欧美在线| 国产成人a在线观看视频| 91亚洲国产视频| 亚洲国产中文欧美在线人成大黄瓜| 在线观看免费黄色网址| 十八禁美女裸体网站| 国产精品无码影视久久久久久久| 欧美激情视频二区三区| 国产毛片高清一级国语| 国产91小视频在线观看| 中美日韩在线网免费毛片视频| 五月天久久婷婷| 激情乱人伦| 亚洲中久无码永久在线观看软件| 国产91九色在线播放| 国产欧美另类| 亚洲区第一页| 尤物精品国产福利网站| 五月激情综合网| 精品自窥自偷在线看| AⅤ色综合久久天堂AV色综合| 欧美性精品| 成年女人a毛片免费视频| 成人福利在线看| 亚洲最大情网站在线观看| 亚洲女人在线| 成人免费视频一区| 精品国产91爱| 青青热久麻豆精品视频在线观看| 免费中文字幕在在线不卡| 色婷婷在线影院| 久久久久久久久18禁秘 | 欧美日韩国产综合视频在线观看 | 91福利在线观看视频| 自拍欧美亚洲| 国产乱肥老妇精品视频| 伊人网址在线|