999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于云計算的大數據挖掘內涵及解決方案研究

2019-02-13 09:15:51平金珍班婭萌
數字通信世界 2019年5期
關鍵詞:數據處理數據挖掘可視化

王 茜,平金珍,班婭萌

(石家莊信息工程職業學院,石家莊 050035)

所謂的大數據挖掘技術,其實就是從海量數據信息中進行有價值信息提取的技術。伴隨著物聯網、云計算等技術的發展,數據信息復雜程度不斷提高,采用傳統數據挖掘算法已經無法實現數據實時挖掘。基于云計算模式建立大數據挖掘體系架構,需要結合大數據特征實現相關技術集成,達到有效實現數據挖掘的目標,繼而使大數據挖掘技術優勢得到充分發揮。

1 基于云計算的大數據挖掘內涵

云計算實際就是建立在網絡基礎上的超級計算模式,能夠借助分布式計算機和互聯網提供計算或存儲等服務。采用云計算,用戶能夠從不同應用平臺登錄數據中心,實現數據存儲、下載或計算分析。該種模式帶有虛擬化的特點,具有較強的可拓展性,能夠實現數據分布式存儲和并行計算。在云計算模式下實現大數據挖掘,需要構建融合多種計算模式和存儲模式的體系架構。根據功能,可以將架構劃分為支撐平臺層、功能層和服務層。在平臺層,可以為大數據挖掘分析提供豐富資源,為數據分析和存儲提供支持,運用云計算相關技術及工具實現大數據處理,提供豐富云環境[1]。

借助云環境,不僅可以獲得數據和軟硬件資源,也能實現數據預處理和分析。功能層負責結合用戶需求進行挖掘工具調用,實現數據智能化分析。服務層需要采用可視化等技術實現數據處理結果的展示,為用戶提供服務。現階段,基于云計算的大數據挖掘體系通常存在功能少的問題,無法滿足用戶多樣化需求,因此需要針對用戶大數據挖掘需求提出科學解決方案。

2 基于云計算的大數據挖掘解決方案

2.1 平臺解決方案

結合大數據挖掘體系架構可知,平臺層是實現大數據挖掘與分析的關鍵環節。采用Hadoop 平臺,能夠為多功能大數據挖掘體系架構的實現提供支持。從結構上來看,Hadoop 平臺包含數據源、大數據挖掘平臺、用戶層三個部分,數據源為復雜處理對象,由結構、半結構和非結構數據組成。在大數據挖掘平臺上上,包含各種計算模式,面對實時數據可以提供多種分析與挖掘功能。用戶層可以提供系統認知與接受服務,實現數據信息交互。Hadoop 以HDFS、MapReduce 和HBase 為核心,能夠快速運行,并且具有較高擴展性和容錯性,能夠實現數據批處理和流處理,增強數據流的可伸縮性。但采用Hadoop 難以進行擁有復雜關系的圖數據處理,無法為內存計算提供支持,因此需要融入并行計算PowerGraph 等工具,促使數據處理和查詢速率得到提高。

2.2 數據預處理

采用Hadoop 平臺進行數據預處理,不同于傳統數據挖掘,無需采用既定ETL 等驅動方法實現靜態數據處理,而是能夠根據數據變化進行技術的選用,實現動態數據預處理。具體來講,就是采用多模式實體識別、遠程自動采集融合、數據流實時處理等各種技術獲得更強迭代計算、并行計算等能力。在數據傳輸遷移期間,采用Sqoop 等流式計算技術完成數據流同步處理,使數據能夠得到即時處理。而大數據的處理不關注因果聯系,只是根據數據間的關聯關系進行數據處理,因此更能增強數據預處理的實時性。

2.2 數據存儲管理

以往數據挖掘需要采用行存儲方式,利用關系數據庫系統進行多維數據模型、結構化數據等各種數據的存儲,數據將被隨機存儲。由系統內部進行存儲模式定義,導致數據存儲相對被動,缺乏可擴展性,并且無法實現數據靈活管理。采用大數據挖掘技術,主要采用列存儲或行存儲模式,能夠對結構和非結構數據進行存儲。采用該種數據存儲管理方法,能夠使數據得到靈活存儲管理,增強體系可拓展性。為保證數據一致性,同時對關系數據模型進行兼容,需要采用Spanner 系統,為同步跨數據中心復制提供支持。采用不確定關系模型進行數據存儲,能夠對動態數據進行直接存儲。

2.3 數據計算分析

在數據計算分析方面,過去采用集中批處理方式。針對大數據,需要實現多種計算模式相融合,完成數據分布并行處理。面對多維、立體、海量數據,可以實現云平臺和數據挖掘平臺功能融合,促使平臺分析能力和分布式并行計算能力得到增強。集成R 分析軟件,能夠整合傳統和現有挖掘算法。在對動態圖數據進行計算時,需要采用數據管理系統進行低延遲查詢。針對數據流,需要運用滑動窗口模型實現概率維度索引,完成數據單次近似連續分析。實際查詢數據的過程中,需要采用PigLatin 等相應查詢語言,能夠實現數據靈活查詢。

2.4 數據挖掘展示

對采用數據挖掘算法處理得到的數據,還要進行展示。過去采用的挖掘技術僅能展示出簡單數據結果集,所以只適用于數量小、關系簡單的情況。針對大數據挖掘得到的信息,需采用文字、報表和可視化圖形等各種方式進行模型效果展示。能夠采用的圖形包含餅狀圖、散點圖、GainLift 圖等,受I/O 限制,難以對多維、海量和動態數據間的聯系進行反映[2]。采用人機交互方式,能夠采用圖像、動畫等方式增強數據解釋直觀性,達到較好的可視化效果。現階段,能夠采用的可視化技術包含聚類分析可視化技術、宇宙星球圖、標簽云等,需要采用并行算法實現數據并行處理,完成高效原位分析,獲得協同可視化效果。

3 結束語

大數據作為新興事物,目前依然未能得到較好的挖掘處理。在云計算基礎上,針對大數據挖掘體系架構存在的問題提出相應解決方案,采用Hadoop 平臺豐富體系功能,能夠實現數據信息實時處理,為用戶提供有效信息資源。實際采用該方案時,需要結合數據預處理、存儲、分析計算和展示需求進行技術的合理應用,繼而取得良好大數據挖掘效果。

猜你喜歡
數據處理數據挖掘可視化
基于CiteSpace的足三里穴研究可視化分析
認知診斷缺失數據處理方法的比較:零替換、多重插補與極大似然估計法*
心理學報(2022年4期)2022-04-12 07:38:02
基于Power BI的油田注水運行動態分析與可視化展示
云南化工(2021年8期)2021-12-21 06:37:54
ILWT-EEMD數據處理的ELM滾動軸承故障診斷
水泵技術(2021年3期)2021-08-14 02:09:20
探討人工智能與數據挖掘發展趨勢
基于CGAL和OpenGL的海底地形三維可視化
“融評”:黨媒評論的可視化創新
傳媒評論(2019年4期)2019-07-13 05:49:14
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
一種基于Hadoop的大數據挖掘云服務及應用
基于希爾伯特- 黃變換的去噪法在外測數據處理中的應用
主站蜘蛛池模板: 狼友av永久网站免费观看| 九九九精品成人免费视频7| 无码专区第一页| 成人午夜久久| 麻豆精品视频在线原创| 成人福利在线视频| 日韩免费成人| 91破解版在线亚洲| 日本www在线视频| 国产97视频在线| 日韩欧美91| 精品无码日韩国产不卡av| 免费国产不卡午夜福在线观看| 久久人人爽人人爽人人片aV东京热 | 国产欧美日韩另类| 欧美国产成人在线| 91成人在线观看| 亚洲成人动漫在线观看| 免费观看亚洲人成网站| 一级毛片在线直接观看| 国产欧美日韩一区二区视频在线| 亚洲无码视频一区二区三区| 99热最新网址| 日韩亚洲综合在线| 国产资源站| 欧美色99| 欧美午夜视频在线| 亚洲最猛黑人xxxx黑人猛交 | 国产一级裸网站| 在线网站18禁| 久久中文字幕2021精品| 欧美区日韩区| 国产精品男人的天堂| v天堂中文在线| 伊人久久大线影院首页| 首页亚洲国产丝袜长腿综合| 一本大道东京热无码av | 91丝袜乱伦| 国产精品女在线观看| 99爱视频精品免视看| 日日拍夜夜嗷嗷叫国产| 免费一级α片在线观看| 无码免费视频| 女人18毛片一级毛片在线| 欧美一道本| 在线精品自拍| 欧美久久网| 欧美无遮挡国产欧美另类| 久久久久88色偷偷| 欧美无遮挡国产欧美另类| 日韩精品成人在线| 五月天综合婷婷| 无码一区中文字幕| 在线免费观看AV| 欧洲av毛片| 在线看国产精品| 国产精品3p视频| 亚洲天堂777| 亚洲Va中文字幕久久一区| 全免费a级毛片免费看不卡| 2048国产精品原创综合在线| 亚洲不卡无码av中文字幕| 亚洲成a人片7777| 亚洲国产91人成在线| 亚洲欧洲日韩久久狠狠爱| 91久久偷偷做嫩草影院精品| 最新国产成人剧情在线播放| 中文字幕欧美成人免费| 99在线国产| 九一九色国产| 国产亚洲欧美在线视频| 人妻中文字幕无码久久一区| 国产人成午夜免费看| 国产亚洲欧美日韩在线观看一区二区| 欧美日韩国产系列在线观看| 成人一区在线| 91视频免费观看网站| 亚洲国产亚洲综合在线尤物| 亚洲国产日韩一区| 亚洲欧美日韩精品专区| 欧美不卡在线视频| 热伊人99re久久精品最新地|