摘 要:本文從介紹大數(shù)據(jù)及分析大數(shù)據(jù)應(yīng)用經(jīng)典案例,分別是淘寶數(shù)據(jù)魔方的應(yīng)用、Netfilx用大數(shù)據(jù)捧火美劇《紙牌屋》、辛辛那提動(dòng)物園與IBM合作應(yīng)用Cognos Business Intelligence s商業(yè)智能等不用領(lǐng)域的應(yīng)用,來(lái)介紹大數(shù)據(jù)應(yīng)用方面的相關(guān)案例,并得出相關(guān)啟示。
關(guān)鍵詞:大數(shù)據(jù);案例分析;聯(lián)系
在計(jì)算機(jī)發(fā)展越來(lái)越快的今天,網(wǎng)絡(luò)信息技術(shù)已經(jīng)成為人們生活中重要的一部分。衣食住行等各方面常常都用到網(wǎng)絡(luò),比如人們的網(wǎng)絡(luò)購(gòu)物、去某個(gè)旅游景點(diǎn)的出行安排、觀看哪部電影電視劇等,我們不僅是生活在如今的信息時(shí)代,也是一個(gè)由無(wú)窮無(wú)盡的數(shù)據(jù)組成的時(shí)代,隨著成千上萬(wàn)的人的各種行為活動(dòng)產(chǎn)生的數(shù)據(jù),政府、企業(yè)、商家等通過(guò)一定的數(shù)據(jù)應(yīng)用技術(shù),來(lái)促進(jìn)著社會(huì)的不斷發(fā)展。本文將通過(guò)五個(gè)案例來(lái)詳細(xì)地了解一下這些大數(shù)據(jù)應(yīng)用的具體情況。
1 大數(shù)據(jù)
對(duì)于大數(shù)據(jù)的定義國(guó)際社會(huì)尚無(wú)統(tǒng)一定論,常用對(duì)大數(shù)據(jù)的定義是指利用常用的軟件及工具捕獲、管理和處理數(shù)據(jù)中所耗時(shí)間超過(guò)可承受時(shí)間的數(shù)據(jù)集,是互聯(lián)網(wǎng)發(fā)展到一定階段的產(chǎn)物,對(duì)于它的定義,國(guó)際社會(huì)提出過(guò)“3V”、“4V”等定義,在“4V”基礎(chǔ)上,增加了“Veracity”變?yōu)椤?V”定義,即:Volume,Variety,Velocity,Value,Veracity。這5個(gè)方面代表大數(shù)據(jù)的5種不同方面特點(diǎn),分別為:數(shù)據(jù)量龐大(Volume)、數(shù)據(jù)種類(lèi)豐富(Variety),數(shù)據(jù)速率快(Velocity),數(shù)據(jù)價(jià)值高(Value),要求真實(shí)性(Veracity)。由此5種特點(diǎn)而組成的大數(shù)據(jù),與云計(jì)算和物聯(lián)網(wǎng)等新興技術(shù)共同作用下,人類(lèi)數(shù)據(jù)量與數(shù)據(jù)種類(lèi)爆發(fā)式增長(zhǎng),打破了以往數(shù)據(jù)庫(kù)的限制,通過(guò)互聯(lián)網(wǎng)即可對(duì)世界任何一個(gè)角落的數(shù)據(jù)進(jìn)行挖掘、分析和利用,對(duì)人類(lèi)社會(huì)具有顛覆性的影響,一方面,大數(shù)據(jù)推動(dòng)了數(shù)據(jù)的管理與檢索,如果將之前的數(shù)據(jù)集比作池塘,那大數(shù)據(jù)就是一片大海,數(shù)據(jù)量巨大,并且通過(guò)不同方法可以達(dá)到不同的效果。另一方面,數(shù)據(jù)猛增,對(duì)數(shù)據(jù)的真實(shí)性和個(gè)人數(shù)據(jù)安全進(jìn)行了更加嚴(yán)格的要求。
2 大數(shù)據(jù)應(yīng)用經(jīng)典案例分析
2.1 Netflix用大數(shù)據(jù)捧紅美劇紙牌屋
通常而言,影視影視投資是具有較大的風(fēng)險(xiǎn),就過(guò)去經(jīng)驗(yàn)而言,電影的票房與投資回報(bào)率、電視劇的收視率、都是很難預(yù)測(cè)的,但美國(guó)影視公司的一部電視劇——新版紙牌屋(House of Cards”,被稱作是基于大數(shù)據(jù)分析,進(jìn)行創(chuàng)作、拍攝,從劇本主題的選擇,到導(dǎo)演演員的選擇,拍攝和后期制作,都是經(jīng)過(guò)大數(shù)據(jù)分析得出來(lái)的結(jié)論。Netflix公司提前一年時(shí)間運(yùn)用大數(shù)據(jù)對(duì)用戶的觀看習(xí)慣,進(jìn)行分析指導(dǎo)影視節(jié)目制作。
2.2 淘寶數(shù)據(jù)魔方
眾所周知,在淘寶網(wǎng)迅猛發(fā)展的今天,淘寶網(wǎng)不僅獲得了經(jīng)濟(jì)價(jià)值,還擁有著不可估量的潛在價(jià)值。海量的數(shù)據(jù)里潛藏的經(jīng)濟(jì)價(jià)值,為淘寶的決策、發(fā)展提供了重要的依據(jù)。每天有數(shù)十億的各種商品瀏覽記錄、上千萬(wàn)的收藏、成交、評(píng)價(jià)記錄,幫助淘寶、商家借助大數(shù)據(jù)背后重要線索、規(guī)律開(kāi)展運(yùn)營(yíng),幫助消費(fèi)者進(jìn)行理性的購(gòu)物決策,是至關(guān)重要的。
在淘寶運(yùn)用的三種數(shù)據(jù)分析工具:量子統(tǒng)計(jì)、淘寶指數(shù)、數(shù)據(jù)魔方中,本文將介紹數(shù)據(jù)魔方這一典型的應(yīng)用案例。
淘寶數(shù)據(jù)產(chǎn)品的技術(shù)框架,通過(guò)對(duì)數(shù)據(jù)的流向來(lái)劃分,可以把分為數(shù)據(jù)源、計(jì)算層、存儲(chǔ)層、查詢層和產(chǎn)品層等五層結(jié)構(gòu)(如圖1所示),數(shù)據(jù)源層包括主戰(zhàn)備庫(kù)、RAC、主站日志等,處于數(shù)據(jù)產(chǎn)品技術(shù)的頂層,計(jì)算層對(duì)實(shí)時(shí)流數(shù)據(jù)進(jìn)行計(jì)算,然后在存儲(chǔ)層進(jìn)行存儲(chǔ),用戶通過(guò)搜索、查詢、瀏覽等也可生成一系列原始數(shù)據(jù)。根據(jù)對(duì)這些數(shù)據(jù)的收集、整理,數(shù)據(jù)魔方可以了解到用戶的偏好、購(gòu)物習(xí)慣等,這些數(shù)據(jù)中蘊(yùn)含著巨大的商業(yè)價(jià)值。
2.3 辛辛那提動(dòng)植物園與IBM
辛辛那提動(dòng)物園是最早提出全球動(dòng)物保護(hù)的機(jī)構(gòu),在動(dòng)物繁殖學(xué)領(lǐng)域中的突破性調(diào)研取得了優(yōu)異的成績(jī),為全球物種保護(hù)起到了非常重要的作用。作為美國(guó)最受歡迎的動(dòng)物園以及一所非營(yíng)利性組織,動(dòng)植物園除了一部分資金來(lái)自于地方政府,但每年三分之二的預(yù)算需通過(guò)自籌來(lái)運(yùn)營(yíng)。如果保證動(dòng)植物園的良好運(yùn)行,辛辛那提動(dòng)植物園與IBM合作,運(yùn)用多年來(lái)入園客戶數(shù)據(jù)的累積分析,茹日常銷(xiāo)售的數(shù)據(jù),商品的購(gòu)買(mǎi)時(shí)間、購(gòu)買(mǎi)類(lèi)型、購(gòu)買(mǎi)數(shù)量等了解到了動(dòng)植物園的發(fā)展趨勢(shì),管理層依據(jù)這些數(shù)據(jù)優(yōu)化決策開(kāi)展運(yùn)用,動(dòng)植物園的銷(xiāo)售額得到大幅提升。
3 結(jié)語(yǔ)
通過(guò)一系列的應(yīng)用案例我們可以得到一些啟發(fā):政府與企業(yè)可以通過(guò)聘請(qǐng)專家,培養(yǎng)大數(shù)據(jù)專業(yè)人才;全面科學(xué)地收集整理數(shù)據(jù),進(jìn)行集中式存儲(chǔ);購(gòu)買(mǎi)使用科學(xué)創(chuàng)新數(shù)據(jù)驅(qū)動(dòng)的產(chǎn)品,保證收集到的數(shù)據(jù)真實(shí)有效、便于利用;建立數(shù)據(jù)中心,對(duì)收集整理的數(shù)據(jù)進(jìn)行科學(xué)的分析,從而得到數(shù)據(jù)中蘊(yùn)含的巨大的經(jīng)濟(jì)價(jià)值與社會(huì)價(jià)值。
參考文獻(xiàn):
[1]埃絲特·戴森.大數(shù)據(jù)利弊之辯[J].中國(guó)經(jīng)濟(jì)報(bào)告,2013(06):23-24.
[2]趙春雷,喬治·納漢.“大數(shù)據(jù)”時(shí)代的計(jì)算機(jī)信息處理技術(shù)[J].世界科學(xué),2012(02):30-31.
作者簡(jiǎn)介:劉倩倩(1988-),女,漢族,吉林四平人,碩士,助理館員,畢業(yè)于長(zhǎng)春理工大學(xué)。