999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大數據驅動的互聯(lián)網時代

2014-01-14 07:41:22吳江
知識就是力量 2014年10期
關鍵詞:用戶

吳江

2014年9月的最后一周,阿里巴巴在紐約證券交易所(NYSE:BABA)正式上市,這是歷史最大規(guī)模的首次公開募股(IPO),更標志著互聯(lián)網進入了一個新的時代 ,一個屬于中國本土互聯(lián)網企業(yè)的大數據時代。

大數據的前世今生

大數據或稱海量數據,指的是所涉及的數據量規(guī)模巨大到無法通過人工,在合理時間內達到截取、管理、處理,并整理成為人類所能解讀的信息。在總數據量相同的情況下,與個別分析獨立的小型數據集相比,將各個小型數據集合并后進行分析,可得出許多額外的信息和數據關系性,可用來察覺商業(yè)趨勢,判定研究質量,避免疾病擴散,打擊犯罪或測定實時交通路況等。

大數據的定義看起來高高在上,事實上卻已經和我們的日常生活息息相關。豆瓣音樂可以通過相似用戶群體的行為推斷出每個用戶最可能喜歡哪首歌,甚至喜歡看什么樣的電影。阿迪達斯可以通過其門店銷售數據的整合分析,更準確地了解不同地域文化的消費者對其產品款式的偏好,從而更智能地決定門店的庫存?zhèn)湄洸呗浴D郴閼倬W站更是正在試圖通過引入一款能夠識別相似臉的系統(tǒng),從用戶過往的選擇數據中總結歸納用戶喜歡何種臉型,讓用戶看到的異性推薦個個喜歡。淘寶網能夠預測每個用戶可能感興趣的商品是什么,由此可以生成對于每一個用戶的個性化推薦,這也就是大家經常能看到的淘寶網側邊欄的商品推薦。通過更精確的分類商品信息的大數據分析,淘寶網更是可以回答很多一般人難以回答的有趣問題,比如18歲的群體最喜歡什么顏色的T恤,或者南方人和北方人對于運動飲料的偏好有什么不同?

簡單的用戶行為分析可能并不會產生太多的價值,而在一個極大規(guī)模上的用戶行為分析,往往可以從趨勢上得出非常有價值的預測,在商業(yè)決策上尤其如此。以我們都知道的農夫山泉礦泉水做一個例子,農夫山泉想要獲得這樣一些市場數據幫助決策:超市里怎樣擺放水堆更能促進銷售?什么年齡的消費者在水堆前停留更久?他們一次購買的量有多大?氣溫的變化讓購買行為發(fā)生了哪些改變?競爭對手的新包裝對銷售產生了怎樣的影響?這些問題看似簡單,卻很難做出有說服力的準確回答。

要回答這些問題,需要收集大量的數據。來自農夫山泉的業(yè)務員每天要來到當地超市拍攝10張照片:水怎么擺放、位置有什么變化、高度如何……一天要跑15個調研地點,每天上傳150張照片,產生的數據量約為10M,這似乎并不是個大數字。而農夫山泉在全國有10000個業(yè)務員,這樣每天的數據量就是100G,每月為3TB。雖然大家都清晰地知道,問題實時的答案就在其中,但得出答案并不容易,這就需要大數據相關的技術做支持。

大數據的數學方法和技術革新

谷歌公司(Google)曾經指出:“真正重要的不是我們可以做什么,而是我們能在什么樣的規(guī)模上做。”

如果你需要每天分析100行數據,只需要有紙和筆就可以了。如果你需要每天分析100000行數據,按照現代計算機的處理能力,你也僅僅需要一臺電腦,設計一個程序即可。但當需要處理的數據級別到了1000000000這個級別(TB級別),一臺性能強大的服務器工作站恐怕已經難以滿足你的需要了,特別是你需要實時或者接近實時的處理速度的時候。這樣的需求引領出了一個計算機與數值計算領域的熱點——分布式計算(Distributed Computing)。

分布式計算,即使用一個集群的計算機通過網絡連成系統(tǒng),把需要進行大量計算的工程數據分區(qū)成小塊,由多臺計算機分別計算,在上傳運算結果后,將結果統(tǒng)一合并得出數據結論的科學。如何將問題進行分割?如何均衡每個處理節(jié)點(即單個計算機)的工作負荷?如何高效可靠地把單個節(jié)點的結果整合成最終的結果?為了從計算機硬件和軟件上解決這些問題,多種多樣的計算模型和概念被設計出來。其中最有代表性的包括云計算、MapReduce(Hadoop)、虛擬化等等。而這股浪潮僅僅只能算剛剛開始,如同馬云所說:我們正在從信息科技時代走向數據科技時代。

海量數據與互聯(lián)網新職業(yè)

玩轉大數據,第一件重要的事情就是獲得海量的有價值的數據。而恰恰在這一點上,中國本土互聯(lián)網企業(yè)有著相當的優(yōu)勢。中國人口眾多,經濟活躍,有大量的互聯(lián)網用戶,用戶資源的豐富直接決定了用戶行為數據的豐富。淘寶網有著超過3億的注冊用戶,騰訊的注冊用戶數量早已超過10億,這些用戶數據本身無疑就是一座金礦。

阿里數據庫=40000個圖書館?

據報道,目前在阿里數據平臺事業(yè)部的服務器上,攢下了超過100PB已處理過的數據——也就是104857600GB。這相當于40000個西雅圖中央圖書館,580億本藏書。

新一代的技術必然帶動了新一代的技術人員需求。在大數據時代,“數據科學家”和“數據工程師”在硅谷已經成為最炙手可熱的工作職位之一。相比傳統(tǒng)的軟件工程師,數據科學家更像是站在數學(統(tǒng)計學)和計算機科學之間的群體,他們的日常工作既包括了軟件設計開發(fā),又包括數據建模和統(tǒng)計分析,同時還要具備將數據處理范式轉化為可行的軟件解決方案的能力。本土互聯(lián)網企業(yè)也十分重視在數據科學上的人才儲備,在可預見的將來,數據科學的從業(yè)者必將大受追捧。

(責任編輯/冷林蔚)

猜你喜歡
用戶
雅閣國內用戶交付突破300萬輛
車主之友(2022年4期)2022-08-27 00:58:26
您撥打的用戶已戀愛,請稍后再哭
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年5期)2016-11-28 09:55:15
兩新黨建新媒體用戶與全網新媒體用戶之間有何差別
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
挖掘用戶需求尖端科技應用
Camera360:拍出5億用戶
100萬用戶
主站蜘蛛池模板: 国产福利小视频在线播放观看| 国产嫩草在线观看| 欧美自慰一级看片免费| 久操中文在线| 国产综合网站| 欧美在线三级| 久久77777| 亚洲精品国产精品乱码不卞| 高清不卡毛片| 欧美v在线| 国产a v无码专区亚洲av| 精品伊人久久久香线蕉 | 亚洲日韩高清在线亚洲专区| 中文字幕第4页| 欧洲成人在线观看| 欧美亚洲一区二区三区导航| 香蕉伊思人视频| 亚洲视频三级| 免费啪啪网址| 999精品色在线观看| 香蕉视频在线观看www| 亚洲手机在线| 色吊丝av中文字幕| 2021国产在线视频| 国产美女久久久久不卡| 亚洲午夜片| 激情爆乳一区二区| 国产91无毒不卡在线观看| 亚洲一区二区在线无码| 国产免费黄| 自拍偷拍一区| 一本大道无码高清| av手机版在线播放| 99九九成人免费视频精品 | 国产av一码二码三码无码| 91色爱欧美精品www| 国产日韩欧美一区二区三区在线| 精品1区2区3区| 欧美精品色视频| 日日拍夜夜操| 欧美特级AAAAAA视频免费观看| 五月婷婷综合网| 高清欧美性猛交XXXX黑人猛交 | 色综合网址| 国产精品久久久久无码网站| 白丝美女办公室高潮喷水视频| 久久精品中文字幕少妇| 亚洲码一区二区三区| 天堂在线亚洲| 亚洲AV无码乱码在线观看代蜜桃 | 色妞www精品视频一级下载| 又污又黄又无遮挡网站| 亚洲视频欧美不卡| 国产精品一区二区久久精品无码| 91在线视频福利| 欧美成在线视频| 91小视频在线观看| 欧美日韩成人| 国产丝袜丝视频在线观看| 日韩成人在线网站| 亚洲无码久久久久| 青青操国产视频| 蜜桃视频一区| 国产白浆一区二区三区视频在线 | 99热国产在线精品99| 欧美三級片黃色三級片黃色1| 黄片在线永久| 国产成人午夜福利免费无码r| 国产本道久久一区二区三区| 久久网综合| 色成人综合| 九九热精品在线视频| 制服丝袜一区| 美女扒开下面流白浆在线试听| 四虎影视永久在线精品| a级毛片一区二区免费视频| 国内黄色精品| 国产成人精品无码一区二| 国产一级毛片高清完整视频版| 久久综合五月| 亚洲美女操| 国产日韩欧美在线播放|