999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大數據發展趨勢

2018-01-17 16:02:58李潔
電子技術與軟件工程 2017年22期
關鍵詞:機器學習數據分析大數據

本文先根據大數據的不同處理方式,介紹幾種不同形式大數據處理平臺以及他們各自對應的幾個典型應用,并指出了具有代表性的處理系統。之后對建立于這些系統框架上的大數據分析技術應用作出場景分析,并對大數據行業發展存在的問題和機遇進行了詳細的闡述。

【關鍵詞】大數據 數據分析 Hadoop 機器學習

1 引言

大數據在近幾年迅速成為最具有熱點的一個話題,科技、企業界乃至于各國政府都對其十分關注,大數據帶來的機遇和挑戰已經成為了各界的焦點。

以宏觀的角度來看,大數據是物理世界、信息世界和人類世界的紐帶,物理世界通過網絡將反應自身特性的數據反映到信息世界中,人類世界憑借界面的交互手段對自己的數據向信息世界進行輸入和操作。大數據的特征可總結為5點,即體量大、速度快、模態多、難辨識和價值大密度低五大特性,數據量的龐大并不是目前大數據的主要難點,真正的挑戰在于數據類型的多樣性、不確定性以及對數據處理即時響應的要求。

出于應對處理數據困難的探索,開源界推出了Hadoop,Spark等應對不同應用場景的大數據處理系統,同時相應的分析技術如:深度學習、可視化、知識計算等,這些大數據系統已經逐漸得到廣泛的應用。

2 大數據處理系統

2.1 批量式數據處理系統

批量式數據有三個主要的特性:

(1)數據量巨大,目前已經達到PB級。

(2)數據來源與具體應用系統,精度相對較高。

(3)數據的價值密度相應低下,如視頻數據,在視頻播放的過程中,有價值的數據可能只有僅僅幾秒,而這也需要專用的算法對有價值的數據進行提取,同時提取數據的行為將會消耗一定的時間,所以存在諸多限制,常常會造成處理結果不甚理想。

綜合以上三點特性,批量式數據的處理需要相對比較成熟的技術和作業手段。

批量式數據的應用:

(1)搜索引擎:互聯網是大數據的重要來源,知名的搜索引擎如美國的Google,我國的百度等大型互聯網搜索引擎,通過與廣告相關數據的批量處理,來及時改變廣告投放的策略,根據分析用戶的喜好,更改廣告的分布以提高用戶的點擊量。

(2)社交網絡:目前的社交網絡和各大社交app每天都將產生巨大的數據量,新浪微博、微信等用戶眾多的社交網絡每時每刻都在產生大量的非結構化數據(視頻、圖片、文本),針對這些數據進行批量式處理,可以幫助分析方發現社交網絡中人際之間的潛在關系和他們的共同網絡,根據這一共同特性進行更新升級,可以進一步提升用戶的使用體驗。

(3)電子商務:在淘寶、京東、亞馬遜等電商網站上,產生大量的商品瀏覽記錄、購買記錄和評論記錄,批量處理這些數據,商鋪可以針對用戶的熱度對商品進行重新排布,app可以根據每個用戶的喜好為其進行個性化推送,生產公司可以用處理結果對每個不同地區的市場方針進行部署。

(4)網絡安全:在金融服務和情報機構中,可以通過對批量數據的處理來檢測客戶交易等操作是否存在異常,由此對潛在的欺詐行為進行預防預警。

代表性的處理系統:

2003年Google發布了GFS(Google File System),2004年發布MapReduce編程模型,掀起了大數據開發的高潮,在學術界和產業界產生了強烈反饋。作為MapReduce及GFS的開源版本,Nutch項目Hadoop在2006年發布了HDFS和MapReduce,MapReduce成為大數據標準的數據處理模型。HDFS是分布式文件系統,負責數據存儲,MapReduce是大數據編程模型,負責批量大數據運算。Hadoop已經形成了生態圈,其子項目有Hive,HBase,Pig等。如圖1所示。

2.2 流式數據處理系統

流式數據還有以下幾點共同特性:

(1)流式數據的每個單元都帶有標志時間的標簽和相關屬性,所以處理流式數據通常是按照時間順序來進行的。

(2)流式數據可以由無結構、半結構、結構化數據組成,故其處理流程復雜、數據純度不高。

(3)流式數據具有活動性。

典型應用:

(1)金融銀行業:金融銀行行業的運營數據,具有短時效性,數據結構也混雜,對這些流式數據進行處理,可以幫助銀行發現其內在特征,幫助銀行做出實時決策。

(2)數據采集:隨著物聯網的興起,NBIoT的廣泛應用,終端設備產生海量實時數據。當前主要有傳感器數據采集、日志采集、Web操作日志采集,使用流式系統獲取實時數據信息,達到動態預警及通知功能。

2.3 代表性的處理系統

2.3.1 Storm系統

Storm誕生于BackType公司,隨著BackType被Twitter收購,Storm轉為開源并在GitHub上公布。在2014年9月正式成為Apache旗下的頂級項目。

Storm是實時的Hadoop,在實時數據處理領域扮演Hadoop之與批量數據處理領域的角色。Storm解決了Hadoop在處理實時數據面臨的瓶頸,采用分而治之理念的Hadoop在處理實時性要求高的場景顯得老態龍鐘。如圖2所示。

Storm采用Master/Slave體系結構,與Hadoop主從架構一樣,Nimbus是整個集群的控制節點,負責指令的分發和系統的監控。Supervisor是從節點,負責具體任務執行。

2.3.2 Samza系統

Linkedin開源了消息隊列Kafka,得到業界廣泛應用,相當部分流式數據處理系統都使用KafKa作為分布式消息處理模塊。Linkedin于2013年基于YARN和Kafka開發了一套流式處理框架—Samza。endprint

Kafka(數據層)、YARN(執行層)、Samza API(處理層)構成了Samza系統的整體架構。如圖3所示。

Samza的主要特點是依賴YARN和Kafka。

3 對大數據領域的思考及總結

開源大數據解決方案日新月異,各有使用場景,總體來說總結出幾種發展趨勢:

(1)平臺適應多樣華,Hadoop成為大數據平臺事實上的標準,適用于批處理數據分析應用場景。利用內存實現加速的Spark在實時性要求高的場景中有更好的適配性。在大數據平臺家族中,出現了Spark,TEZ,Drill,Storm,Flume,Scribe等新技術,其并不是要取代Hadoop,而是要促進大數據生態環境的完整化發展。

(2)數據處理實時性:在物聯網、大數據蓬勃發展的基礎上,將海量數據(PB級別)處理時間縮短到幾秒級別的實時計算需求越發強烈。

(3)專業化:專業化是提高效率的必經之道,業界多通過定制化的軟硬一體解決方案實現低成本、高并發的解決方案。

參考文獻

[1]周寶曜,劉偉,范承工.大數據戰略·技術·實踐[M].電子工業出版社,2013:127-130.

[2]Greenberg A,Hjalmtysson G,Maltz D A, et al.A clean slate 4D approach to network control and management[J]. ACMSIGCOMM Computer Communication Review,2005,35(05):41-54.

[3]Taigman Y,Yang M,Ranzato M,Wolf L.Deepface: Closing the gap to human-level performance in face verification.In:Proc.Ofthe IEEE CVPR,2014.

[4]Plaisant C,Carr D,Shneiderman B.Image-Browser taxonomy and guidelines for designers.IEEE Software,1995,12(02):21-32.

[5]Feblowitz J.Analytics in oil and gas:The big deal about big data. In:Proc.of the SPE Digital Energy Conf,2013.

[6]Hive.https://hive.apache.org/.

[7]Pig.https://pig.apache.org/.

[8]Hbase.https://hbase.apache.org/.

[9]MongoDB.http://www.mongodb.org.

作者簡介

李潔(1979-),男,河南省桐柏縣人。大學本科學歷。高級工程師,研究領域為通信網絡、信息安全、云計算。

應昌成(1996-),男,上海市人。本科在讀。研究領域為大數據分析、海洋技術。

作者單位

上海科技網絡通信有限公司 上海市 200000

上海大數據試驗場工程技術研究中心 上海市 200000endprint

猜你喜歡
機器學習數據分析大數據
基于網絡搜索數據的平遙旅游客流量預測分析
時代金融(2016年27期)2016-11-25 17:51:36
前綴字母為特征在維吾爾語文本情感分類中的研究
科教導刊(2016年26期)2016-11-15 20:19:33
Excel電子表格在財務日常工作中的應用
淺析大數據時代背景下的市場營銷策略
新常態下集團公司內部審計工作研究
中國市場(2016年36期)2016-10-19 04:31:23
淺析大數據時代對企業營銷模式的影響
基于支持向量機的金融數據分析研究
基于大數據背景下的智慧城市建設研究
科技視界(2016年20期)2016-09-29 10:53:22
主站蜘蛛池模板: 国产精品免费福利久久播放| 成年网址网站在线观看| 欧美日韩激情| 亚洲天堂网在线播放| 久久性妇女精品免费| 亚洲男人天堂2018| 国产亚洲欧美日韩在线一区二区三区 | 精品少妇人妻无码久久| 激情无码字幕综合| 国产精品人莉莉成在线播放| 久久中文无码精品| 四虎精品黑人视频| 熟妇丰满人妻| 国产一区二区三区视频| aⅴ免费在线观看| 国产精品免费入口视频| 久久综合丝袜日本网| 日本一区二区三区精品国产| 午夜a级毛片| 日韩天堂在线观看| 欧美色99| 亚洲AV无码一区二区三区牲色| 国产69精品久久| 国产精品熟女亚洲AV麻豆| 在线日本国产成人免费的| 69视频国产| 亚洲无码精品在线播放| 午夜电影在线观看国产1区| 99在线观看国产| 性网站在线观看| 国产呦视频免费视频在线观看| av午夜福利一片免费看| 综合网久久| 成人在线第一页| 香蕉精品在线| 欧美日韩亚洲综合在线观看 | 成人福利在线视频| 18黑白丝水手服自慰喷水网站| 亚洲精品无码日韩国产不卡| 久夜色精品国产噜噜| 人妻一区二区三区无码精品一区| 亚洲香蕉在线| 91在线无码精品秘九色APP| 91久久夜色精品| 天天综合亚洲| 日本欧美精品| 国产一区自拍视频| 午夜视频在线观看区二区| a级毛片免费看| V一区无码内射国产| 亚洲成人一区二区| 亚洲精品成人片在线观看| 91精品亚洲| 熟女日韩精品2区| 国产成人8x视频一区二区| 国产欧美日韩免费| 久久精品人妻中文系列| 强奷白丝美女在线观看 | 91青草视频| 成人精品免费视频| 免费在线播放毛片| 国产精品亚洲一区二区三区z| 97人人做人人爽香蕉精品 | 日本午夜三级| 亚洲三级电影在线播放| 18禁高潮出水呻吟娇喘蜜芽| 亚洲一区二区视频在线观看| 91精品aⅴ无码中文字字幕蜜桃| 亚洲伊人电影| 2021最新国产精品网站| 国产综合色在线视频播放线视| 欧美午夜小视频| 日韩一二三区视频精品| 亚洲一区网站| 国产在线观看91精品| 黄色网址免费在线| 人妻精品全国免费视频| 日韩一区二区三免费高清| 怡红院美国分院一区二区| 青青久视频| 99久久免费精品特色大片| 日韩无码真实干出血视频|