999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于KNN算法的約會網站配對模型的應用研究

2019-01-08 08:37:44劉淑英鄒燕飛李依橋趙瑤瑤王偉
數字技術與應用 2019年10期
關鍵詞:機器學習

劉淑英 鄒燕飛 李依橋 趙瑤瑤 王偉

摘要:約會網站數據量非常大,如何從眾多數據對象中,選擇適合自己的人群,成為數據分析中的一個研究問題。本文主要闡述了該模型的具體實現過程,主要包括數據采集、數據歸一化處理、構造算法模型、評估算法模型。通過采用實例數據集進行模型的訓練和測試,實驗結果表明:該模型能較準確的進行約會對象的匹配,測試誤差較小。

關鍵詞:機器學習;KNN算法;Python

中圖分類號:TP391 文獻標識碼:A 文章編號:1007-9416(2019)10-0128-02

0 引言

如今網站的快速發展,人們的生活和工作都離不開網絡。人們的生活節奏也在逐漸加快,工作越來越忙了。約會網站吸納了眾多的單身青年參與,積累了大量的用戶資源。而且我國廣大的上班族群體為約會網站提供了良好的用戶基礎[1]。一個好的約會網站可以帶動婚戀等多種產業的發展,但是目前的約會網站對約會對象的數據處理有時候不夠準確,約會配對成功率不夠高。通過對網站數據進行分析,采用KNN算法較好的完成約會配對,為網站用戶提供較好的服務。

1 KNN算法

KNN,也稱K-最近鄰居,是機器學習算法最簡單的一種[2-3]。它既可以用來分類,也可以是回歸方法。它把實例的特征向量作為輸入,再計算訓練集與新數據特征值之間的距離,之后選出距離k個最近的分類。如果k=1,最近鄰類就是待測數據。KNN算法主要涉及三個問題:距離度量,k值選擇和分類決策規則。我們最主要討論分類決策規則。分類決策規則就是指多數投票,或基于距離的加權投票。由輸入實例的k個鄰近訓練實例中的多數類別決定輸入實例的類別[4-5]。

2 模型實現

本模型使用的樣本數據一共有1000行,該模型采用80%的數據作為訓練集,20%的數據作為測試集來進行模型訓練,數據預處理使用的方法是歸一化。模型具體實現分為六個步驟,分別是采樣數據、樣本數據可視化、預處理、獲取模型、模型訓練、預測。我們的測試數據主要包括婚戀人員的特征,分別是年飛行常客里程數、玩視頻耗時百分比、周消耗冰激凌公升數,我們首先標記此部分數據,1代表一點也不喜歡,2代表有一點喜歡,3代表非常喜歡。為了更直觀的的理解樣本數據,數據采用Matplotlib庫進行繪圖分析,如圖1所示。

2.1 預處理

根據前面所述可知,三個特征值之間的差距有點大,所以在模型訓練之前,必須把數據放到同一量級,即數據預處理。本模型采用歸一化方法,目的是把不一樣的特征數據縮放到相同的一個相似區間中。

2.2 獲取模型

該部分功能是獲取模型,也就是構造KNN分類器。核心思想就是,如果一個樣本在特征空間中的k個最相似的樣本中的大多數屬于某一個類別,則該樣本也屬于這個類別。

該過程通過計算各個訓練數據與測試數據之間的距離,按照距離遞增關系排序,選取距離最小的k個點,確定k個點所在類別的出現頻率,返回前k個點中出現頻率最高的類別作為測試數據的預測分類。這樣就構造出了KNN分類器。

2.3 模型訓練

我們講1000個樣本數據劃分為訓練集和測試集,該部分的核心代碼如下所示。

for i in range(num_test_vecs):

classifier_result = classify0(norm_mat[i, :], norm_mat[num_test_vecs:m, :],

dating_labels[num_test_vecs:m], 4)

if classifier_result != dating_labels[i]:

error_count += 1.0

right_ratio = 1 - error_count / float(num_test_vecs)

2.4 樣例預測

該部分功能是對新數據進行預測分類,用戶輸入待約會對象的數據,預測出這條數據的分類,可以判斷喜歡程度。核心代碼如下。

def classify_main():

result_list = ['一點也不喜歡', '有點喜歡', '非常喜歡']

ff_miles = float(input("每年獲得的飛行常客里程數:"))

percent_tats = float(input("玩視頻游戲所消耗時間百分比:"))

ice_cream = float(input("每周消費的冰淇淋公升數:"))

dating_data_mat,dating_labels = init_data()

norm_mat,diff_dt,min_value = feature_scaling(dating_data_mat)

in_arr = array([ff_miles, percent_tats, ice_cream])

classifier_result = classify0((in_arr - min_value)/diff_dt, norm_mat, dating_labels, 3)

print("你對這個人的喜歡程度:",result_list[classifier_result-1])

3 結語

本文通過采用KNN算法對婚戀數據數據進行分析,采用Python數據可視化庫中的函數和Matplotlib庫完成對數據的分類。通過測試結果,可知,模型學習的準確率達到了92%,基本能夠滿足我們的要求。

參考文獻

[1] 黃鶴.關于我國婚戀網站網絡交友的研究[D].武漢:華中師范大學,2011.

[2] 石曉宇.基于Google App Engine的移動信息服務的研究[D].大連:大連理工大學,2011.

[3] 黎爽.基于Python科學計算包的金融應用實現[D].南昌:江西財經大學,2017.

[4] 胡元,石冰.基于區域劃分的KNN文本快速分類算法研究[J].計算機科學,2012,39(10):182-186.

[5] 康春花,張淑君,李元白,等.KNN認知診斷法及其應用[J].江西師范大學學報(自然科學版),2019,43(02):135-141+159.

猜你喜歡
機器學習
基于詞典與機器學習的中文微博情感分析
基于網絡搜索數據的平遙旅游客流量預測分析
時代金融(2016年27期)2016-11-25 17:51:36
前綴字母為特征在維吾爾語文本情感分類中的研究
科教導刊(2016年26期)2016-11-15 20:19:33
基于支持向量機的金融數據分析研究
機器學習理論在高中自主學習中的應用
主站蜘蛛池模板: 毛片手机在线看| 国产人免费人成免费视频| 婷婷亚洲视频| 国产自在线播放| 国产成人无码AV在线播放动漫| 青青青国产精品国产精品美女| 四虎国产在线观看| 9cao视频精品| 国产精品手机视频| 国产精品自拍合集| 中文字幕在线免费看| 77777亚洲午夜久久多人| 91无码人妻精品一区| 国产乱人视频免费观看| 综合天天色| 69精品在线观看| 国产91色在线| 怡红院美国分院一区二区| 久久久久国产精品熟女影院| 日韩欧美中文亚洲高清在线| 久久semm亚洲国产| 91啪在线| 欧美精品色视频| 国产综合亚洲欧洲区精品无码| 欧美日韩午夜| 亚洲日本中文综合在线| 国产在线精品美女观看| 国产成人无码久久久久毛片| 国产精品主播| 不卡网亚洲无码| 亚洲无码A视频在线| 波多野结衣无码AV在线| 国产女人爽到高潮的免费视频 | 亚洲国产成人精品无码区性色| 97人人做人人爽香蕉精品| 国产视频欧美| 在线免费无码视频| 福利视频99| 欧美区一区二区三| a毛片在线| 日本高清视频在线www色| 亚洲av无码片一区二区三区| 国产激情无码一区二区三区免费| 国产高清无码第一十页在线观看| 成人精品视频一区二区在线 | 国内精品视频区在线2021| 色久综合在线| 欧美综合成人| 伊人久久大香线蕉成人综合网| 97se亚洲综合在线韩国专区福利| 97久久精品人人| 日韩高清成人| 人妻精品全国免费视频| 精品撒尿视频一区二区三区| 国产欧美日韩综合在线第一| 亚洲日本中文字幕乱码中文 | 99re在线免费视频| 日韩在线2020专区| 素人激情视频福利| 天天综合天天综合| 91在线无码精品秘九色APP | 九九精品在线观看| 亚洲无码免费黄色网址| 免费不卡视频| 国产精品毛片一区视频播| 一级一级一片免费| 国内视频精品| 亚洲一区第一页| 亚洲成人动漫在线| 免费va国产在线观看| 国产99视频免费精品是看6| av在线人妻熟妇| 国产激爽爽爽大片在线观看| av性天堂网| 9久久伊人精品综合| 欧美日韩国产在线观看一区二区三区| 国产精品视频白浆免费视频| 国产菊爆视频在线观看| 日韩一区二区在线电影| 久久五月天综合| 国产精品视频观看裸模| 成人在线欧美|