999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于分布式KNN分類器的大數據分類處理方法設計

2021-08-06 09:16:40雷宇
新型工業化 2021年4期
關鍵詞:分類實驗方法

雷宇

(長江職業學院數據信息學院,湖北 武漢 430074)

0 引言

在網絡技術應用愈發廣泛的社會背景下,相關大數據技術的研究已成為了社會中的焦點問題,如何有效處理大規模數據量已成為技術產業的研究重點。尤其在現代化社會背景下,商業技術、生產技術、經營技術不斷更新,導致社會中可用的數據量顯著性提升。面對海量增長的數據集合,若不及時采用有效的處理方式,不僅會使數據存儲出現負荷危險,甚至會在一定程度上造成對數據使用的低效率性[1]。為此,本文引進分布式KNN分類器,使用k-近鄰算法,設計一種大數據分類處理方法,確保對價值數據集合的有效聚類。

1 基于分布式KNN分類器的大數據分類處理方法

1.1 基于分布式KNN分類器聚類大數據回歸任務

在設計大數據分類處理方法的過程中,引進分布式KNN分類器,對大數據回歸任務進行聚類處理。在此過程中,可借鑒分類器運行中的KNN算法,將其定義為一種非參數計算方法[2]。假定參與訓練的大數據樣本集合表示為Ds,參與測試的大數據樣本集合表示為Ts,每個樣本集合中的數據量均表示為n,樣本數表示為t。此時,可認為集合中的每一個數據樣本均為一個多元特征的數據組[3]。表達公式如下。

公式(1)中:p表示為樣本對應屬性;ω表示為樣本數據所屬類別。假定數據樣本的對應空間表示為D,則對于訓練大數據樣本集合Ds而言,Ds的ω屬于一個已知項;Ts的ω屬于一個未知項。

此時,使用KNN算法對未知項進行檢索,以歐幾里德距離作為度量的標準,選擇K個升序樣本值,對大數據樣本集合進行聚類處理。處理過程中,設定樣本集合的復雜度表示為n×D,每個樣本均存在k個近鄰點,結合近鄰點的數量,對距離進行計算,并將最終的計算結果作為大數據樣本聚類的結果[4]。此過程可用如下計算公式表示。

公式(2)中:hloss(h)表示為大數據樣本聚類結果(/距離計算結果);xi表示為漢明損失量i;Y表示為升序樣本值;q表示為樣本標簽長度;h表示為歐幾里德距離度量單位,導出計算結果,完成對于分布式KNN分類器的大數據回歸任務聚類處理。

1.2 整合MR框架的大數據分類處理流程

在完成上述相關處理的基礎上,結合MR框架,對大數據樣本集合進行分類處理。流程如下圖1所示。

圖1 整合MR框架的大數據分類處理流程

按照上述圖1所示的流程,在進行大數據分類處理的過程中,可定義一個value處理鍵,將待分類的樣本數據進行Map映射處理,完成映射處理后的數據樣本集合通??勺鳛橹苯訕颖緮祿?,即存在任意一個處理分區,可實現對任意鍵進行關聯分類處理。而提出的Map映射鍵通常需要應用在一個指定中間key上,即與value處理鍵進行配對,當匹配結果存在顯示存在關聯性,即可認為鍵位具備對應分類特征,便可直接將此鍵位與value處理鍵連接,完成配對。當匹配結果存在顯示不存在關聯性時,即可認為鍵位不具備對應分類特征,需要對大數據樣本集合進行持續篩選,只有篩選結果滿足Map映射關系時,或映射鍵通常位于指定中間key上時,即可認為樣本數據集合與其具備一定的直接關聯,此時便可執行對樣本的分類處理。綜合上述分析,完成對大數據分類處理方法的設計。

2 對比實驗

在完成上述對基于分布式KNN分類器的大數據分類處理方法設計后,本文提出下述對比實驗,希望通過設計對比實驗的方式,證明本文設計方法的有效性。在本文設計的此次實驗中,選擇Higuust;Guiggi;Caggerts;A-hugs;B-reasts五個大數據集合作為此次實驗的數據樣本。上述提出的數據集合中不僅涉及了大量的實例性內容,同時也涵蓋了大量對集合的描述性數據內容。對提出的大數據集合進行描述。

上述提出的大數據樣本集合U型均符合交叉對比實驗需求,隨機選擇樣本數據集合中的85.0%的數據信息作為實驗數據(/訓練樣本),剩余數據樣本則作為對測試數據。本次實驗在互聯網支撐下進行,設定主分類節點上包括5個信息節點,即每組數據均可被劃分為5類,信息節點采用Ei2.0-2560處理器進行處理。除上述提出的實驗要求,與實驗環境相關的參數可用如下表1表示。

表1 實驗環境布設

在完成對實驗環境的布設后,分別采用本文設計的基于分布式KNN分類器的大數據分類處理方法與傳統分類處理方法,對測試樣本集合進行分類處理。將漢明指數、加速比值、分類時間等多項參數作為評估方法的依據,執行對比實驗。結果如下表2所示,實驗結果以本文方法/傳統方法表示。

表2中,F表示為方法應用價值,如上述表3所示的實驗結果,看出本文大數據分類處理方法,在實際應用中,無論是在處理中的漢明損失,或是分類處理時長、加速比值等方面,其優勢顯著高于傳統方法。為此,得出本文此次對比實驗的結果:本文設計的大數據分類處理方法,具有更高的處理效率、更低的數據損失率,相比傳統的方法,本文方法更優[5]。

表2 對比實驗結果

3 結語

本文使用分布式KNN分類器,利用KNN算法,從聚類大數據回歸任務、整合MR框架的大數據分類處理流程兩個方面,完成對大數據分類處理方法的設計。并通過對比實驗得出最終結論:相比傳統的大數據分類處理方法,本文設計的大數據分類處理方法,具有更高的處理效率、更低的數據損失率,整體應用價值相對較高。

猜你喜歡
分類實驗方法
記一次有趣的實驗
分類算一算
做個怪怪長實驗
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
NO與NO2相互轉化實驗的改進
實踐十號上的19項實驗
太空探索(2016年5期)2016-07-12 15:17:55
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
主站蜘蛛池模板: 国产国语一级毛片| 亚洲成人在线免费观看| 国产无码性爱一区二区三区| 91毛片网| 欧美综合区自拍亚洲综合绿色 | 国产精品亚欧美一区二区三区| 成年看免费观看视频拍拍| 伊人久久久久久久久久| 久草网视频在线| 91亚洲精品第一| 中文字幕一区二区人妻电影| 精品久久蜜桃| 色国产视频| 国产真实乱人视频| 欧美三级日韩三级| 国产高清在线丝袜精品一区| 亚洲综合精品第一页| 久久女人网| 在线观看欧美国产| 免费一级毛片完整版在线看| 亚洲一级毛片在线观播放| 国产精品林美惠子在线播放| 日韩成人在线网站| 在线亚洲天堂| 人人爱天天做夜夜爽| 国产成人综合亚洲欧美在| 久久免费看片| 欧美一级在线看| 华人在线亚洲欧美精品| 看av免费毛片手机播放| 小13箩利洗澡无码视频免费网站| 国产无码制服丝袜| 国产一级无码不卡视频| 精品伊人久久久香线蕉 | 国产精品视屏| 亚洲一区网站| 免费人欧美成又黄又爽的视频| 久久香蕉国产线看观看式| 久久人人97超碰人人澡爱香蕉| 欧美成人精品在线| 国产精品妖精视频| 国产精品55夜色66夜色| 亚洲αv毛片| 国产精品 欧美激情 在线播放| 国产视频入口| 国产成人高清精品免费软件| 国产视频a| 国产亚洲高清在线精品99| 精品无码日韩国产不卡av| 91福利国产成人精品导航| 免费无码AV片在线观看国产| 不卡网亚洲无码| 99精品高清在线播放| 久久99蜜桃精品久久久久小说| 欧美日韩一区二区三| 四虎影视库国产精品一区| 亚洲乱强伦| 高清乱码精品福利在线视频| 日本精品视频一区二区| 人妻丝袜无码视频| 久久精品这里只有国产中文精品| 日韩在线网址| 亚洲最大福利网站| 亚洲人成影院午夜网站| 国产高潮视频在线观看| 中文字幕亚洲另类天堂| 国产成人精品综合| 韩国自拍偷自拍亚洲精品| 粗大猛烈进出高潮视频无码| 国产精品免费露脸视频| 国产91在线|日本| 亚洲天堂日本| 波多野结衣一区二区三区四区视频| 97se亚洲综合不卡| 欧美视频在线观看第一页| 中文字幕乱妇无码AV在线| 国产精品手机在线播放| 国内熟女少妇一线天| 亚洲精品不卡午夜精品| 欧美国产精品不卡在线观看 | 亚洲第一极品精品无码| 亚洲人成影院在线观看|