999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于hadoop平臺的分布式數據挖掘系統的設計探討

2017-04-25 12:12:09陳志雄
數字技術與應用 2017年1期
關鍵詞:數據挖掘

陳志雄

摘要:在社會經濟快速發展的情況下,網絡信息技術的更新速度越來越快,如今,促進了大數據時代的進一步發展,而Hadoop作為分布式系統的代表,也成為大數據挖掘系統的重要組成部分之一。分布式數據挖掘系統的主要任務是利用Hadoop搭建分布式集群環境,然后在該環境上部署相應的數據挖掘任務,前提是要對分布式文件系統HDFS和MapReduce的并行編程模式原理進行深入的分析研究,同時選擇運用K-means聚類算法,使Hadoop平臺的數據挖掘系統的任務具有良好的發展效率,同時也能顯示其計算能力的擴展性能。下面就Hadoop平臺的分布式數據挖掘系統的設計進行深入的分析探討,進而促進信息數據系統的進一步發展。

關鍵詞:Hadoop平臺;數據挖掘;系統設計;K-means

中圖分類號:TP311.13 文獻標識碼:A 文章編號:1007-9416(2017)01-0179-01

1 數據挖掘的簡單概述

Hadoop是一個分布式系統基礎架構,它實現了一個分布式文件系統,具有極高的容錯性,在因特網上是最受歡迎的搜索關鍵字的內容分類工具,能夠解決許多具有伸縮性的問題,能提高文件搜索效率[1]。而數據挖掘系統是在Hadoop平臺建立的,因此,數據挖掘系統的發展與Hadoop平臺緊密結合。數據挖掘主要是在大量數據中尋找有價值的信息技術,主要由以下三個階段組成,數據準備階段,需要對大量的信息進行清理,并對數據整合,同時還對數據格式進行轉換;數據挖掘階段,根據相應的智能算法對數據進行分析,然后形成一定的數據模式;結果評估階段,主要根據挖掘出的數據模式的運行效果進行評判,對沒有任何效果的評估模式全部排除。

2 數據挖掘的主要任務與具體計算方法

2.1 數據挖掘基本任務分析

數據挖掘的任務是由大數據發展的方向決定的,同時為數據挖掘工作提供了方向,由于數據挖掘以尋找數據模式為主,并且數據模式也是隨著數據的應用領域不同而發生變化,因此,在數據挖掘期間,其任務主要分為描述性挖掘和預測性挖掘兩種。描述性挖掘任務主要根據數據的一般特征,對數據庫中的數據進行概括、總結,然后尋找數據之間的關系和類型,最終形成固定的數據模式;對于預測性挖掘主要根據接觸的數據做出相應的判斷,并加入與之相對應的新的數據的模式[2]。

2.2 數據挖掘的具體計算方法

數據聚類算法是對數據進行拆分合并同類項計算,也就是將數據項劃分為多層次的子集,對具有相似特性的數據項進行歸類,然后對同一個子集中的數據進行計算,該計算方法主要根據數據自身的特性來劃分。具體如下所示:

在數據庫B中,所有數據的集合為未知數X={X1,X2,X3……Xn},而在許多的X中有一部分具有相似性,因而Xi(i=1,2,3……n)。其中對于一個整體集合X,被許多具有相似的X組合分割成m個子集,出現了許多的C1,C2,C3……Cn。同時每一個子集還要滿足一定的條件:①每一個子集不能為零;②所有的子集整合后必須恰好等于集合X;③每一個子集不能有共同交集;④i必須不等于零。

聚類法是數據挖掘算法的重要組成部分,而K-m eans算法是最常用的最基本的聚類算法。主要根據空間中K個中心點對相對應的數據對象進行聚類,當然這個點不是固定不變的,而是設定一個或幾個點后進行逐一的變換更新,在不斷更新分配數據時,就能尋找到符合條件的聚類結果[3]。經過長期的更新分配之后,根據數據聚類的規律總結數據模式,然后將這一模式作為數據挖掘系統的固定函數模式,在以后的數據挖掘計算中只需要代入相關的數據就可以快速獲取結果。

如上述的函數式,在數據挖掘計算中,需要對Ck固定,就可以選擇出最優的Xk;對Xk固定后,就能選擇最優的Ck,他們選擇的結果都是花費代價最小的時候。采用K-means計算法可以獲得一個最優解的值,這個值會使得挖掘的數據接近最優,并且在數據挖掘中的優勢非常的顯著。

3 結語

Hadoop是一個能夠對大數據進行分布式處理的軟件平臺,具有極高的可靠性和高效性,因而在數據挖掘系統設計方面能夠提供很好的幫助,尤其在數據挖掘計算方法方面,能夠根據數據挖掘的數據模式建立比較固定優越的計算模式。

參考文獻

[1]郭建偉,李瑛,杜麗萍,趙桂芬,蔣繼婭.基于hadoop平臺的分布式數據挖掘系統研究[J].中國科技信息,2013,13:81-83.

[2]羅剛.基于HADOOP的數據挖掘平臺分析與設計[J].電子世界,2013,18:16-17.

[3]樊龍,萬定生,顧昕辰.基于Hadoop云平臺的水利普查數據挖掘系統的設計和實現[J].計算機與數字工程,2014,05:831-834+875.

猜你喜歡
數據挖掘
基于數據挖掘的船舶通信網絡流量異常識別方法
探討人工智能與數據挖掘發展趨勢
數據挖掘技術在打擊倒賣OBU逃費中的應用淺析
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
一種基于Hadoop的大數據挖掘云服務及應用
數據挖掘在高校圖書館中的應用
數據挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數據挖掘研究
利用數據挖掘技術實現LIS數據共享的開發實踐
主站蜘蛛池模板: 亚洲成网777777国产精品| 久久男人视频| 亚洲黄色片免费看| 午夜视频免费试看| 午夜三级在线| 成人午夜网址| 免费网站成人亚洲| 色婷婷成人网| 国产日产欧美精品| 色婷婷啪啪| 国产一区二区三区在线观看视频| 亚洲精品777| 男女男精品视频| 亚洲国产黄色| 伊人久久福利中文字幕| 国产视频一区二区在线观看| 无码高潮喷水在线观看| 欧美午夜在线观看| 一区二区三区四区日韩| 无码一区二区波多野结衣播放搜索| 久久这里只有精品23| 最新日本中文字幕| 日韩精品欧美国产在线| 国产成本人片免费a∨短片| 国产亚洲精品91| 91视频精品| 日本影院一区| 国产精品成人一区二区不卡| 婷婷午夜影院| 国产精品亚欧美一区二区| 欧洲免费精品视频在线| 欧美精品啪啪一区二区三区| 伊人福利视频| 亚洲侵犯无码网址在线观看| 日韩专区第一页| 日韩欧美中文字幕在线精品| 一区二区欧美日韩高清免费| 亚洲天堂精品在线| 国产在线观看91精品亚瑟| 国产在线八区| 成人韩免费网站| 在线国产三级| 18黑白丝水手服自慰喷水网站| 免费毛片全部不收费的| 中文字幕在线观看日本| 国产精品无码影视久久久久久久| 亚洲二三区| 97亚洲色综久久精品| 中字无码精油按摩中出视频| 国产精品真实对白精彩久久| 国产午夜看片| 亚洲女同欧美在线| 一级成人a做片免费| 亚洲综合狠狠| 国产成人凹凸视频在线| 午夜日韩久久影院| 色综合天天娱乐综合网| 国产黄网永久免费| 久久精品波多野结衣| Aⅴ无码专区在线观看| 福利小视频在线播放| 九色视频最新网址| 91综合色区亚洲熟妇p| 午夜欧美在线| 国产精品久久久久久久伊一| 在线观看免费国产| 在线欧美a| 黄色网址免费在线| 欧美性久久久久| 亚洲成人福利网站| av在线手机播放| 99伊人精品| 真实国产乱子伦视频| 国产欧美高清| 在线免费观看a视频| 天天综合网色| 日韩性网站| 在线精品欧美日韩| 免费观看欧美性一级| 成人在线观看一区| 国产91透明丝袜美腿在线| 97视频精品全国免费观看|