






[編者按]數(shù)據(jù)是與自然資源一樣重要的戰(zhàn)略資源,大數(shù)據(jù)技術(shù)就是從數(shù)量巨大、結(jié)構(gòu)復(fù)雜、類(lèi)型眾多的數(shù)據(jù)中,快速獲得有價(jià)值信息的能力,它已成為學(xué)術(shù)界、企業(yè)界甚至各國(guó)政府關(guān)注的熱點(diǎn)。本講座將分3期對(duì)大數(shù)據(jù)進(jìn)行討論:第1期介紹了大數(shù)據(jù)的提出、含義、特點(diǎn),大數(shù)據(jù)和云計(jì)算的關(guān)系以及大數(shù)據(jù)典型應(yīng)用;第2期介紹大數(shù)據(jù)獲取、存貯、搜索、分享、分析、可視化等方面的關(guān)鍵技術(shù),并對(duì)當(dāng)前熱點(diǎn)技術(shù)—可視化進(jìn)行重點(diǎn)分析;第3期將探討數(shù)據(jù)流挖掘等實(shí)時(shí)數(shù)據(jù)分析技術(shù),介紹大數(shù)據(jù)中非結(jié)構(gòu)化數(shù)據(jù)處理和挖掘技術(shù),并給出大數(shù)據(jù)發(fā)展面臨的挑戰(zhàn)與應(yīng)用前景。
5 大數(shù)據(jù)生態(tài)系統(tǒng)
5.1 大數(shù)據(jù)生態(tài)系統(tǒng)
2011年6月,IBM架構(gòu)師Stephen Watt在《Deriving new business insights with Big Data》文中對(duì)大數(shù)據(jù)生態(tài)系統(tǒng)進(jìn)行了簡(jiǎn)單描述,提出大數(shù)據(jù)生態(tài)系統(tǒng)實(shí)際上就是數(shù)據(jù)的生命周期,即數(shù)據(jù)采集、存儲(chǔ)、查找、分析和可視化的過(guò)程[1],見(jiàn)圖1。
在這樣的生態(tài)系統(tǒng)中,每個(gè)環(huán)節(jié)都存在著不同的商業(yè)需求,而需求的出現(xiàn)必然會(huì)導(dǎo)致創(chuàng)新的產(chǎn)生。所以,在每一個(gè)環(huán)節(jié)都有不少企業(yè)在深耕自己所在的領(lǐng)域,試圖通過(guò)新技術(shù)和新方法來(lái)實(shí)現(xiàn)新的商業(yè)模式。
5.2 大數(shù)據(jù)生態(tài)圖譜
隨著大數(shù)據(jù)生態(tài)系統(tǒng)的逐步形成,很多人在嘗試?yán)L制和更新大數(shù)據(jù)生態(tài)系統(tǒng)圖譜,希望通過(guò)對(duì)大數(shù)據(jù)領(lǐng)域的公司、技術(shù)、產(chǎn)品進(jìn)行細(xì)分,及時(shí)了解到大數(shù)據(jù)生態(tài)系統(tǒng)全貌。在眾多圖譜當(dāng)中,比較有代表性的是美國(guó)On Grid Ventures公司Matt Turck等人于2012年10月繪制更新的大數(shù)據(jù)生態(tài)圖譜V2.0[2],如圖2所示。
盡管各個(gè)圖譜的分類(lèi)方法、全面性、時(shí)效性、權(quán)威性各不相同,但我們?nèi)钥梢杂^察到:
(1)大數(shù)據(jù)領(lǐng)域的企業(yè)主要集中在數(shù)據(jù)集市、數(shù)據(jù)存儲(chǔ)(基礎(chǔ)設(shè)施)、數(shù)據(jù)分析、數(shù)據(jù)應(yīng)用4個(gè)層面,其中數(shù)據(jù)應(yīng)用層面又包含數(shù)據(jù)服務(wù)、數(shù)據(jù)檢索、商務(wù)智能,可視分析等。這正符合數(shù)據(jù)科學(xué)中對(duì)數(shù)據(jù)全生命周期管理的描述。此外,很多企業(yè)業(yè)務(wù)覆蓋大數(shù)據(jù)多個(gè)層面,有的企業(yè)甚至已經(jīng)建立了完整的大數(shù)據(jù)棧,成為“大數(shù)據(jù)應(yīng)用服務(wù)提供商”。
(2)在大數(shù)據(jù)領(lǐng)域,活躍著的除了IBM、ORACLE等眾多知名公司外,像Splunk、Tableau等專(zhuān)業(yè)大數(shù)據(jù)公司也及時(shí)跟上了大數(shù)據(jù)的浪潮,成功地獲得了投資者和業(yè)界的關(guān)注。
(3)開(kāi)源軟件與大數(shù)據(jù)的結(jié)合迸發(fā)出驚人的顛覆性力量,更多廠商開(kāi)始使用開(kāi)源大數(shù)據(jù)工具,以支持其大數(shù)據(jù)業(yè)務(wù)。
大數(shù)據(jù)生態(tài)系統(tǒng)中覆蓋大量的技術(shù)和產(chǎn)品,其中一些在大數(shù)據(jù)技術(shù)發(fā)展道路中起到了巨大的推動(dòng)作用。
(1)Hadoop
在大數(shù)據(jù)時(shí)代,Hadoop可以說(shuō)是最耀眼的明星。憑借其開(kāi)源和易用的特性,Hadoop不僅是大數(shù)據(jù)時(shí)代數(shù)據(jù)處理的首選,也是擁有海量數(shù)據(jù)處理需求的公司的標(biāo)準(zhǔn)配置。此外,許多商業(yè)創(chuàng)新也都圍繞Hadoop展開(kāi)的,并在大數(shù)據(jù)時(shí)代占據(jù)一席之地,如Cloudera推出的軟件發(fā)布包可以幫助企業(yè)更方便地搭建以Hadoop為中心的數(shù)據(jù)管理平臺(tái);MapR則將Hadoop的速度改造為原來(lái)的3倍;海量數(shù)據(jù)管理軟件商Platfora旨在提供一個(gè)更為友好且更具操作性的用戶界面,它可以兼容包括Cloudera和MapR等多種Hadoop版本,能夠大大降低使用Hadoop的門(mén)檻;而AsterData(已被TeraData收購(gòu))的核心技術(shù)SQL-to-MapReduce可將海量非結(jié)構(gòu)化數(shù)據(jù)的處理技術(shù)和結(jié)構(gòu)化數(shù)據(jù)的數(shù)據(jù)倉(cāng)庫(kù)技術(shù)結(jié)合,以彌補(bǔ)傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)的公司所欠缺的高速處理海量非結(jié)構(gòu)化數(shù)據(jù)的能力。
(2)NoSQL
與Hadoop密切相關(guān)的NoSQL也一直是大數(shù)據(jù)領(lǐng)域的熱點(diǎn)。NoSQL憑借其高性能和可擴(kuò)展性等優(yōu)勢(shì),成為關(guān)系數(shù)據(jù)庫(kù)的強(qiáng)勁對(duì)手,在大數(shù)據(jù)時(shí)代占據(jù)一席之地。根據(jù)存儲(chǔ)模型和特征,NoSQL大致可分為列存儲(chǔ)、文檔存儲(chǔ)、key-value存儲(chǔ)、圖存儲(chǔ)、對(duì)象存儲(chǔ)、XML數(shù)據(jù)庫(kù)等類(lèi)型,雖然也存在個(gè)別數(shù)據(jù)庫(kù)可被歸為多種類(lèi)別的現(xiàn)象,其中,HBase、MongoDB、Cassandra、CouchDB、Neo4j、HyperTable等NoSQL已被相當(dāng)多的企業(yè)和開(kāi)發(fā)人員所熟知。
(3)NewSQL
無(wú)論NoSQL是被解釋為NoSQL,還是后來(lái)的Not Only SQL,其不支持結(jié)構(gòu)化查詢語(yǔ)言 (SQL)語(yǔ)言的特性為開(kāi)發(fā)人員帶來(lái)諸多不便。因此,為了同時(shí)滿足高性能和支持SQL兩個(gè)方面,NewSQL被設(shè)計(jì)出來(lái)。NewSQL作為全新的關(guān)系數(shù)據(jù)庫(kù)產(chǎn)品,或?qū)㈥P(guān)系模型的優(yōu)勢(shì)發(fā)揮到分布式體系結(jié)構(gòu)中,或?qū)㈥P(guān)系數(shù)據(jù)庫(kù)的性能提升到不必進(jìn)行橫向擴(kuò)展的程度,這使得NoSQL面臨前所未有的挑戰(zhàn)。典型的NewSQL有VoltDB、Marklogic、Xeround、NuoDB等。
(4)Data Marketplace
除了解決大數(shù)據(jù)處理、存儲(chǔ)問(wèn)題之外,開(kāi)放數(shù)據(jù)資源也在相當(dāng)大程度上加速了大數(shù)據(jù)技術(shù)的發(fā)展。目前大部分的企業(yè)所面對(duì)的數(shù)據(jù)都是由內(nèi)部系統(tǒng)或者交易記錄日志之類(lèi)的東西所產(chǎn)生的,然而如果能夠獲得企業(yè)自己無(wú)法獲得,或者已經(jīng)被處理過(guò)的外部數(shù)據(jù),那么內(nèi)外數(shù)據(jù)融合分析后產(chǎn)生的價(jià)值將不可估量。因此,能夠下載或者訪問(wèn)數(shù)據(jù)集,自然而然也就成為了商業(yè)需求,甚至美國(guó)政府都推出了官方的數(shù)據(jù)集網(wǎng)站。
2009年5月,美國(guó)聯(lián)邦政府正式啟用了官方公共數(shù)據(jù)資源分享網(wǎng)站Data.gov,其數(shù)據(jù)內(nèi)容涵蓋了所有美國(guó)聯(lián)邦政府行政部門(mén)在運(yùn)營(yíng)管理過(guò)程中采集、生產(chǎn)或轉(zhuǎn)換而來(lái)的、有潛在價(jià)值的、可供再次開(kāi)發(fā)利用的數(shù)據(jù)集。Data.gov鼓勵(lì)個(gè)人開(kāi)發(fā)者使用政府發(fā)布的數(shù)據(jù)集,開(kāi)發(fā)出新穎的應(yīng)用。值得一提的,該網(wǎng)站于近期正式對(duì)外發(fā)布了全新的“開(kāi)源政府平臺(tái)”(OGPL),該平臺(tái)的代碼將會(huì)對(duì)全球的開(kāi)發(fā)者開(kāi)放。
在中國(guó),數(shù)據(jù)堂(datatang.com)是目前最為專(zhuān)業(yè)的科研數(shù)據(jù)共享服務(wù)平臺(tái),該平臺(tái)致力于為全球科研機(jī)構(gòu)、企業(yè)及個(gè)人提供科研數(shù)據(jù)支持,其數(shù)據(jù)內(nèi)容主要是科研數(shù)據(jù)集,同時(shí)也提供浮動(dòng)車(chē)歷史數(shù)據(jù)、路況歷史數(shù)據(jù)和車(chē)牌數(shù)據(jù)等,用戶也可以上傳發(fā)布自己的數(shù)據(jù)。通過(guò)該平臺(tái)不僅使得中國(guó)的科研機(jī)構(gòu)、企業(yè)、高校和個(gè)人之間可以充分共享數(shù)據(jù),也促進(jìn)各類(lèi)科研數(shù)據(jù)價(jià)值的最大化。
在全球范圍的大數(shù)據(jù)熱潮中,對(duì)于大多數(shù)企業(yè)來(lái)說(shuō),大數(shù)據(jù)與自己有什么關(guān)系?如何快速直觀地理解和發(fā)現(xiàn)大數(shù)據(jù)中的價(jià)值?沒(méi)有足夠“大”數(shù)據(jù)的情況下如何才能在大數(shù)據(jù)時(shí)代獲益?雖然這些問(wèn)題還沒(méi)有完美的答案,但許多企業(yè)已經(jīng)進(jìn)行了積極的嘗試,通過(guò)數(shù)據(jù)可視化嘗到了大數(shù)據(jù)的甜頭。
6 可視化和可視分析
在眾多描述大數(shù)據(jù)的詞語(yǔ)中,“金礦”、“油田”等的描述最為常見(jiàn),這意味著人們開(kāi)始意識(shí)到大數(shù)據(jù)中蘊(yùn)含著豐富的價(jià)值。然而,巨大的數(shù)量、數(shù)據(jù)的固有復(fù)雜性及未知的分析目標(biāo)都放大了任務(wù)的難度。如果能夠有一種簡(jiǎn)單的方式對(duì)數(shù)據(jù)規(guī)律進(jìn)行直觀展現(xiàn),必將使大數(shù)據(jù)中的價(jià)值得到快速理解和發(fā)現(xiàn),可視化就是這樣的方式。
6.1 數(shù)據(jù)可視化、信息可視化和可視
分析概述
可視化由來(lái)已久,1861年法國(guó)工程師Charles Joseph Minard繪制了《拿破侖征俄戰(zhàn)役圖》可以看作可視化領(lǐng)域的經(jīng)典案例。到了18世紀(jì)后期數(shù)據(jù)圖形學(xué)誕生,抽象信息的視覺(jué)表達(dá)手段一直被人們用來(lái)揭示數(shù)據(jù)及其他隱匿模式的奧秘。隨著20世紀(jì)50年代計(jì)算機(jī)圖形學(xué)的出現(xiàn),信息技術(shù)加速了可視化的演變。時(shí)至今日,可視化已經(jīng)發(fā)展為數(shù)據(jù)可視化、科學(xué)可視化、信息可視化、可視分析這幾大方向。
數(shù)據(jù)可視化起源于20世紀(jì)50年代,其基本思想是將數(shù)據(jù)庫(kù)中每個(gè)數(shù)據(jù)項(xiàng)作為可視化圖形中單個(gè)元素,同時(shí)將數(shù)據(jù)的各個(gè)屬性值以多維數(shù)據(jù)的形式表示,通過(guò)從不同維度觀察數(shù)據(jù)而達(dá)到對(duì)數(shù)據(jù)深入洞察和分析的目的。
科學(xué)可視化是一個(gè)典型的交叉學(xué)科,源于1987年布魯斯·麥考梅克等人編寫(xiě)的網(wǎng)絡(luò)文件系統(tǒng)(NFS)報(bào)告《Visualization in Scientific Computing》(意為“科學(xué)計(jì)算之中的可視化”)。科學(xué)可視化主要是將具有幾何結(jié)構(gòu)的三維數(shù)據(jù)轉(zhuǎn)換為圖像,應(yīng)用領(lǐng)域涵蓋科學(xué)和工程的多個(gè)方面。
信息可視化也是一個(gè)跨學(xué)科領(lǐng)域,出現(xiàn)于20世紀(jì)90年代,旨在為許多應(yīng)用領(lǐng)域之中大規(guī)模非數(shù)值型信息資源的視覺(jué)呈現(xiàn)提供支持,這些信息資源可能是軟件系統(tǒng)之中眾多的文件、大規(guī)模并行程序的日志蹤跡信息、網(wǎng)站內(nèi)容等。與科學(xué)可視化相比,信息可視化側(cè)重于異質(zhì)數(shù)據(jù)集,如非結(jié)構(gòu)化文本當(dāng)中的點(diǎn)。
可視分析則起源于2005年,它是一門(mén)通過(guò)交互可視界面來(lái)分析、推理和決策的科學(xué),通過(guò)將可視化和數(shù)據(jù)處理分析方法結(jié)合,提高可視化質(zhì)量的同時(shí)也為用戶提供更完整的大規(guī)模數(shù)據(jù)解決方案[3]。如今,針對(duì)可視分析的研究和應(yīng)用逐步發(fā)展,已經(jīng)覆蓋科學(xué)數(shù)據(jù)、社交網(wǎng)絡(luò)數(shù)據(jù)、電力等多個(gè)行業(yè)。
雖然在這幾大方向之間的邊界還未完全清晰,不過(guò),其相互關(guān)系和區(qū)別可以總結(jié)如下:數(shù)據(jù)可視化外延不斷擴(kuò)大,可以認(rèn)為數(shù)據(jù)可視化包含科學(xué)可視化、信息可視化和可視分析;科學(xué)可視化處理的是那些具有天然幾何結(jié)構(gòu)的數(shù)據(jù);信息可視化處理的是異質(zhì)的抽象的數(shù)據(jù)結(jié)構(gòu);可視分析則主要通過(guò)意會(huì)、推理、互動(dòng)融合的方式來(lái)挖掘數(shù)據(jù)中的問(wèn)題和原因。
可視化融合了問(wèn)題的求解和藝術(shù)表現(xiàn)方式兩個(gè)方面,允許我們同時(shí)通過(guò)理性和感官方式來(lái)感受數(shù)據(jù),那么怎樣才是成功的可視化?Noah lliinsky在《數(shù)據(jù)可視化之美》一書(shū)中提到[4],一個(gè)稱(chēng)得上“美”的可視化,必須具備新穎、充實(shí)、高效和美觀4個(gè)關(guān)鍵要素。新穎性體現(xiàn)在必須從嶄新的視角觀察數(shù)據(jù),傳統(tǒng)可視化展現(xiàn)方式(如柱形圖)雖易理解,但不夠新奇有趣,是不足以激發(fā)讀者新的理解的;充實(shí)性體現(xiàn)在可視化一定要為讀者提供獲取信息的途徑,從而向讀者傳遞信息甚至知識(shí);高效性指成功的可視化須盡可能直截了當(dāng),而不允許展示太多與目標(biāo)和主題無(wú)關(guān)的信息;美觀是指合理的圖形構(gòu)建(坐標(biāo)軸、布局、色彩、線條等)是實(shí)現(xiàn)可視化之美的必要因素。這四要素必須同時(shí)具備,否則不能對(duì)數(shù)據(jù)進(jìn)行有意義地呈現(xiàn)。
6.2 可視化之美
美麗的可視化作品不同于傳統(tǒng)的可視化,它們能夠通過(guò)創(chuàng)造不同于慣例的圖形構(gòu)建方式,揭示數(shù)據(jù)顯性和隱性的特征,使讀者在對(duì)可視化效果感到驚喜的同時(shí)收獲啟示。通過(guò)以下的一些案例我們可以充分體會(huì)到這一點(diǎn)。
(1)電信數(shù)據(jù)可視化——《都市移動(dòng)族》
當(dāng)今城市被通訊數(shù)據(jù)所充斥,每個(gè)打電話發(fā)短信的人都生成特定時(shí)間地點(diǎn)的數(shù)據(jù)包,然而這些數(shù)據(jù)中有何規(guī)律?2008年,法國(guó)faberNovel公司對(duì)巴黎國(guó)際音樂(lè)節(jié)和新年夜產(chǎn)生的手機(jī)數(shù)據(jù)進(jìn)行監(jiān)測(cè)和可視化,幫助法國(guó)電信運(yùn)營(yíng)商O(píng)range建立《都市移動(dòng)族Urban Mobs》(圖3)[5]。它不僅讓我們發(fā)現(xiàn)城市活動(dòng)中豐富的一面,同時(shí)也使電信運(yùn)營(yíng)商在流量分析、業(yè)務(wù)推薦等方面獲得啟示。
(2)電信數(shù)據(jù)可視化——《活力日內(nèi)瓦》
手機(jī)可以看作是實(shí)時(shí)記錄并上傳用戶地理位置信息的移動(dòng)傳感器,2011年,瑞士日內(nèi)瓦市政府與Interactive Things公司合作,將市民每天在日內(nèi)瓦市的行動(dòng)軌跡的手機(jī)GPS數(shù)據(jù)進(jìn)行記錄,并制作城市生活(Ville Vivante) [6] 動(dòng)態(tài)顯示瑞士電信每時(shí)每刻的數(shù)據(jù)流向。圖4展示的是晚上六點(diǎn)到午夜之間人們移動(dòng)的軌跡。這種融合基于位置的服務(wù)(LBS)和電信數(shù)據(jù)的可視化方式不僅使政府和公眾對(duì)城市生活有了重新認(rèn)識(shí),同時(shí)也產(chǎn)生不可估量的經(jīng)濟(jì)政治效益。
(3)智慧城市——《實(shí)時(shí)新加坡》
現(xiàn)代城市中每天都在產(chǎn)生海量的數(shù)據(jù),如何才能讓政府和市民更快了解城市每時(shí)每刻的變化,幫助政府提高管理效能,為市民提供生活便利?2011年,美國(guó)麻省理工大學(xué)可感知實(shí)驗(yàn)室為新加坡建立了“LIVESingapore”實(shí)時(shí)新加坡平臺(tái)[7](圖5),該平臺(tái)能夠?yàn)楣娞峁?shí)時(shí)的城市活動(dòng)及環(huán)境信息。其中,“實(shí)時(shí)通訊”顯示新加坡語(yǔ)音通訊、短信及網(wǎng)絡(luò)使用情況,“等時(shí)地圖”實(shí)時(shí)呈現(xiàn)新加坡居民交通耗時(shí)情況;“雨天打車(chē)”結(jié)合降雨監(jiān)測(cè)和出租車(chē)數(shù)據(jù)進(jìn)行可視化,從而在雨天智能調(diào)配出租車(chē);“城市熱島”將新加坡區(qū)域溫度與能源消耗的關(guān)系進(jìn)行可視化。通過(guò)對(duì)城市生活、環(huán)境數(shù)據(jù)的可視化,可助力提高城市公共服務(wù)質(zhì)量,改善市民生活,真正意義上實(shí)現(xiàn)智慧城市。
(4)北京大學(xué)PKUVIS微博可視分析工具
結(jié)合社會(huì)網(wǎng)絡(luò)分析中的概念和可視化的呈現(xiàn)方法,佐以統(tǒng)計(jì)和智能數(shù)據(jù)挖掘的方法,可以為海量復(fù)雜社會(huì)網(wǎng)絡(luò)提供快速、直觀和智能的分析和呈現(xiàn)方法[8]。2012年北京大學(xué)可視化與可視分析小組開(kāi)發(fā)了支持可視化瀏覽和分析微博熱點(diǎn)事件的“PKUVIS微博可視分析工具”(圖6)[9]。該工具將一條條獨(dú)立的微博連接起來(lái),通過(guò)直觀的視圖清晰地呈現(xiàn)出一個(gè)事件中微博轉(zhuǎn)發(fā)的過(guò)程,從而讓用戶能夠迅速地發(fā)現(xiàn)事件中的關(guān)鍵人物、關(guān)鍵微博、重要觀點(diǎn),同時(shí)通過(guò)可視化的方式可以更好地分析新浪微博傳播脈絡(luò)以及事件的發(fā)生與發(fā)展的過(guò)程。
(5)電力大數(shù)據(jù)可視化
美國(guó)Space-Time是一家提供新一代地理空間和可視化解決方案的創(chuàng)業(yè)公司,2011年,Space-Time為美國(guó)加州獨(dú)立系統(tǒng)運(yùn)營(yíng)商設(shè)計(jì)了一套可以實(shí)時(shí)監(jiān)控電力傳輸系統(tǒng)能源基礎(chǔ)設(shè)施的可視化軟件Space-Time Insight(圖7)[10],該可視化系統(tǒng)通過(guò)控制室中的一個(gè)80英寸的顯示屏,在地圖上實(shí)時(shí)展示長(zhǎng)達(dá)25 000 km的輸電線路狀況,工作人員一旦發(fā)現(xiàn)一個(gè)地區(qū)出現(xiàn)了問(wèn)題,就可以根據(jù)該地區(qū)問(wèn)題的嚴(yán)重性和臨近地區(qū)的反應(yīng)來(lái)做出決策。不僅簡(jiǎn)化了日常運(yùn)營(yíng)復(fù)雜度,還在盡可能降低影響的情況下解決問(wèn)題。這種大數(shù)據(jù)可視化實(shí)踐對(duì)中國(guó)的電力大數(shù)據(jù)分析展示乃至整個(gè)能源相關(guān)行業(yè)都具有巨大的參考價(jià)值。
6.3 開(kāi)源可視化工具
如果讀者已經(jīng)被以上可視化案例所吸引,并且愿意嘗試將企業(yè)數(shù)據(jù)進(jìn)行可視化,那么開(kāi)源的數(shù)據(jù)可視化編程語(yǔ)言和環(huán)境將會(huì)是不錯(cuò)的選擇。可視化領(lǐng)域中重要而常用的可視化編程語(yǔ)言和環(huán)境有Processing、Processing.js、R、D3、Impure、ParaView、Circos等,它們具備的一個(gè)共同特點(diǎn)就是為用戶提供了常見(jiàn)的專(zhuān)業(yè)可視化模版或圖形庫(kù),用戶可以通過(guò)簡(jiǎn)單調(diào)用即可很快實(shí)現(xiàn)可視化效果,此外,由于軟件的開(kāi)源優(yōu)勢(shì),專(zhuān)業(yè)用戶可以根據(jù)其需求,對(duì)圖形源代碼進(jìn)行定制修改。
在可見(jiàn)的未來(lái),大數(shù)據(jù)可視化機(jī)遇挑戰(zhàn)并存[11],大數(shù)據(jù)可視化將越來(lái)越廣泛地為各領(lǐng)域所使用,也將引發(fā)新一輪的投資熱潮,而構(gòu)建面向電子政務(wù)、電信、電力等特定行業(yè)大數(shù)據(jù)的可視分析工具是一個(gè)可以深入探索的重要發(fā)展方向。 (待續(xù))
參考文獻(xiàn)
[1] Deriving new business insights with big data[EB/OL].
http://www.ibm.com/developerworks/library/os-bigdata
[2] Big data landscape v2.0[EB/OL].
http://www.ongridventures.com/2012/10/23/the-big-data-landscape/
[3] 俞宏峰. 大規(guī)模科學(xué)可視化[J].中國(guó)計(jì)算機(jī)學(xué)會(huì)通訊,2012, 8(9): 29-37.
[4] STEELE J, ILIINSKY N. Beautiful visualization[M]. Sebastopol, CA,USA : O'Reilly Media, 2010.
[5] Urban Mobs[EB/OL]. http://www.urbanmobs.fr/en/
[6] Ville Vivante[EB/OL].http://www.villevivante.ch/
[7] LIVE Singapore[EB/OL].http://www.live-singapore.com.sg/
[8] 袁曉如,張昕,肖何等.可視化研究前沿及展望[J].科研信息化技術(shù)與應(yīng)用,2011, 2(4):3-13.
[9] PKUVIS微博可視分析工具[EB/OL].http://vis.pku.edu.cn/weibova/weiboevents/
[10] Space-time insight[EB/OL]. http://www.spacetimeinsight.com/
[11] 黃伯仲,沈漢威,克里斯托弗·約翰遜等.超大規(guī)模數(shù)據(jù)可視分析十大挑戰(zhàn)[J].中國(guó)計(jì)算機(jī)學(xué)會(huì)通訊,2012, 8(9): 38-43.