郭濤
一個采用模塊化設(shè)計的大數(shù)據(jù)平臺可以解決80%的大數(shù)據(jù)問題,而解決另外20%的問題就要靠大數(shù)據(jù)平臺廠商結(jié)合行業(yè)客戶的特殊需求進行定制化開發(fā)。中興通訊DAP 2.0大數(shù)據(jù)平臺就具備了這方面的能力,能夠為行業(yè)客戶帶來實實在在的價值。
大數(shù)據(jù)的本質(zhì)在于,可以提升人類活動的準(zhǔn)確性,減少傳統(tǒng)方式下的試錯成本,從而提升社會的整體效率。比如,現(xiàn)在熱門的精準(zhǔn)營銷就是通過大數(shù)據(jù)提高廣告的準(zhǔn)確性,減少對無效客戶的推送,以提高信息傳播的效率。中興通訊股份有限公司(以下簡稱中興通訊)中心研究院副總裁陳堅表示:“歸根結(jié)底,大數(shù)據(jù)通過提高人類活動的準(zhǔn)確性來提高整個社會的生產(chǎn)效率。”
平臺化、模塊化架構(gòu)更靈活
中興通訊在大數(shù)據(jù)方面已經(jīng)進行了多年研究,其研發(fā)的DAP大數(shù)據(jù)平臺在電信、金融、智慧城市、公安等行業(yè)廣受用戶好評。在近日舉行的第四屆大數(shù)據(jù)世界論壇(BDWF 2014)上,中興通訊的大數(shù)據(jù)平臺DAP 2.0榮獲了“最佳大數(shù)據(jù)平臺管理方案獎”。
中興通訊中心研究院總工王德政將DAP 2.0的特點歸納成三個方面。
第一,DAP 2.0采用貨架式架構(gòu)和企業(yè)總線ESB技術(shù),可以靈活地對各個組件模塊進行裁剪和拼裝,以滿足集成與被集成的要求。當(dāng)前,各個行業(yè)已有大量的生產(chǎn)系統(tǒng)在線運行,完全重構(gòu)這些系統(tǒng)無論是從經(jīng)濟成本還是時間成本上來衡量都是用戶無法承受的。因此,大數(shù)據(jù)系統(tǒng)必然要同時承擔(dān)集成與被集成兩種角色,即大數(shù)據(jù)系統(tǒng)既可以作為原有生產(chǎn)系統(tǒng)的一個子系統(tǒng)被集成,也可以作為主系統(tǒng)去集成原有的生產(chǎn)系統(tǒng)。DAP 2.0的貨架式架構(gòu)可以靈活適應(yīng)各類集成與被集成的應(yīng)用場景,在不影響生產(chǎn)系統(tǒng)穩(wěn)定性的前提下,與原有生產(chǎn)系統(tǒng)無縫集成。
第二,在數(shù)據(jù)分析和挖掘?qū)用妫珼AP 2.0具有智慧生成的特征,可以提高企業(yè)活動的準(zhǔn)確性。大數(shù)據(jù)系統(tǒng)是否具有智慧,從而替代人類專家,將是區(qū)分大數(shù)據(jù)系統(tǒng)與傳統(tǒng)IT系統(tǒng)的關(guān)鍵特征。一個無法生成智慧的系統(tǒng),無論數(shù)據(jù)量有多大,充其量也就是一個大型的傳統(tǒng)IT系統(tǒng),而不是大數(shù)據(jù)系統(tǒng)。DAP 2.0通過有針對性的挖掘算法改進,可以提出超越人類專家經(jīng)驗與直覺的智慧建議,從而提升人類活動的準(zhǔn)確性,提高社會生產(chǎn)力。
第三,DAP 2.0具備平臺的特性。DAP 2.0作為中興通訊公司級的大數(shù)據(jù)平臺,聚焦于數(shù)據(jù)的存儲、處理時效和挖掘算法,為上層應(yīng)用破解大數(shù)據(jù)應(yīng)用的技術(shù)難點與障礙,并可根據(jù)上層應(yīng)用的需求,快速進行定制開發(fā),在很短的時間周期內(nèi),以更低的研發(fā)成本推出新的大數(shù)據(jù)應(yīng)用。未來,DAP 2.0還將向第三方開放,以支撐第三方的大數(shù)據(jù)業(yè)務(wù)開發(fā)。
現(xiàn)在市場上有許多大數(shù)據(jù)產(chǎn)品,其中很多是開源軟件。因此有人認為,只要下載一個大數(shù)據(jù)開源軟件,自己編譯一下就可以用,無需開發(fā)專用的大數(shù)據(jù)平臺軟件。“其實,對大數(shù)據(jù)的初始認知與大數(shù)據(jù)的工程實踐之間有很大差距。大數(shù)據(jù)處理看上去似乎很容易,但如果涉及幾百臺設(shè)備的大數(shù)據(jù)真實環(huán)境,并不是每個企業(yè)都有能力自己完成大數(shù)據(jù)項目的實施。”陳堅告訴記者,“將相關(guān)的開源軟件、商用軟件和自己開發(fā)的軟件進行整合,特別是實現(xiàn)統(tǒng)一、高效的管理是對大數(shù)據(jù)廠商的一個最基本要求。另外,大數(shù)據(jù)平臺還要根據(jù)不同行業(yè)客戶的需求進行專門的優(yōu)化和改進,這也要求大數(shù)據(jù)廠商具備極強的技術(shù)能力。中興通訊在大數(shù)據(jù)方面投入了大量人力和物力,不僅可以實現(xiàn)對相關(guān)軟硬件的集成,而且可以針對不同行業(yè)的需求對大數(shù)據(jù)平臺進行優(yōu)化。”
王德政補充說:“DAP 2.0從技術(shù)架構(gòu)上保證了大數(shù)據(jù)項目實施的可靠、穩(wěn)定和高效。比如,DAP 2.0采用模塊化的架構(gòu),改動其中任意一個模塊并不會影響整個系統(tǒng)的功能和穩(wěn)定性。另外,我們可以針對不同行業(yè)的具體需求進行大數(shù)據(jù)平臺的定制,而這個具有行業(yè)特征的大數(shù)據(jù)平臺一旦在某個行業(yè)的一個用戶中成功實施,就可以在整個行業(yè)中復(fù)制和推廣。”
大數(shù)據(jù)平臺有明顯的行業(yè)特性。一個通用的大數(shù)據(jù)平臺并不能被行業(yè)用戶直接采用,而是要根據(jù)行業(yè)需求進行建模和算法優(yōu)化,才能發(fā)揮其應(yīng)有的作用。打個比方,如果一個通用的大數(shù)據(jù)平臺能夠滿足客戶80%的需求,那么另外20%的工作就是要結(jié)合客戶的具體需求進行二次開發(fā)和優(yōu)化。
大數(shù)據(jù)平臺水到渠成
大數(shù)據(jù)處理技術(shù),特別是云存儲與云計算技術(shù)的成熟與廣泛應(yīng)用,為大數(shù)據(jù)的存儲與處理提供了技術(shù)可能性。企業(yè)可以利用生產(chǎn)系統(tǒng)和管理系統(tǒng)中產(chǎn)生的大量數(shù)據(jù),對自己的生產(chǎn)活動進行更為準(zhǔn)確的預(yù)測與指導(dǎo),從而提高企業(yè)生產(chǎn)活動的準(zhǔn)確性。另一方面,企業(yè)還可以通過對數(shù)據(jù)價值的挖掘,創(chuàng)造出更多新型業(yè)務(wù)。
電信行業(yè)是大數(shù)據(jù)應(yīng)用最典型的一個行業(yè)。比如,電信運營商可以通過智能終端采集的大量數(shù)據(jù)了解網(wǎng)絡(luò)運行的狀況或判別網(wǎng)絡(luò)故障,以便及時進行優(yōu)化,從而改善客戶的應(yīng)用體驗。智慧城市是另一個大數(shù)據(jù)應(yīng)用的典型場景。智慧城市的其中一個職能就是將海量數(shù)據(jù)收集上來,以改進城市基礎(chǔ)設(shè)施,方便百姓生活。陳堅表示,大數(shù)據(jù)就是將以前只有少數(shù)專家才做的數(shù)據(jù)分析和挖掘,通過建模和算法更加高效、方便地實現(xiàn),讓廣大消費者受益。
中興通訊作為電信領(lǐng)域的專家,可以針對電信大數(shù)據(jù)進行專家級的建模。中興通訊的大數(shù)據(jù)平臺DAP 2.0可以利用云存儲與云計算等技術(shù),對海量的數(shù)據(jù)進行存儲、挖掘和分析,以幫助企業(yè)充分挖掘數(shù)據(jù)的價值。
陳堅表示,中興通訊進入大數(shù)據(jù)領(lǐng)域其實是水到渠成的事。10多年前,中興通訊做網(wǎng)管軟件其實就是在進行大數(shù)據(jù)的處理。之后,中興通訊開始了對云計算、云存儲技術(shù)的研究,并將不同時期的相關(guān)技術(shù)進行整合,包括Hadoop、實時分析技術(shù)等,才逐漸形成了今日的DAP大數(shù)據(jù)平臺。另外,DAP還融入了中興通訊對開源軟件的深刻理解,同時包含了中興通訊在工程實施方面的多年實踐經(jīng)驗。因此,陳堅認為,中興通訊的大數(shù)據(jù)平臺是一個技術(shù)的集大成者,也是技術(shù)自然演進的產(chǎn)物。
雖然中興通訊大數(shù)據(jù)平臺的產(chǎn)生與中興通訊在電信領(lǐng)域的技術(shù)積累和實踐經(jīng)驗密不可分,但是陳堅明確表示,DAP大數(shù)據(jù)平臺是一個通用的組件化的產(chǎn)品,各個層次與模塊之間是松耦合的關(guān)系,能夠廣泛應(yīng)用于不同的行業(yè)和應(yīng)用場景。
一個標(biāo)準(zhǔn)化的大數(shù)據(jù)系統(tǒng),通常包括三個層次:最底層是數(shù)據(jù)采集層,中間層是數(shù)據(jù)存儲、加工和挖掘?qū)樱钌蠈邮菙?shù)據(jù)建模與應(yīng)用層。對于大數(shù)據(jù)平臺來說,其聚焦點是數(shù)據(jù)存儲和分析挖掘,而對于大數(shù)據(jù)應(yīng)用來說,其聚焦點是數(shù)據(jù)采集與建模應(yīng)用。談到DAP大數(shù)據(jù)平臺未來的發(fā)展方向,陳堅概括說:“我們的重點將放在計算、存儲、分析和挖掘領(lǐng)域,目標(biāo)是讓數(shù)據(jù)挖掘更容易,分析更方便。另外,在數(shù)據(jù)采集層,我們希望實現(xiàn)更有效的數(shù)據(jù)接入,讓數(shù)據(jù)的交換和共享更容易。在應(yīng)用層,我們的策略是開放接口,與行業(yè)用戶一起建模,以便更好地挖掘行業(yè)數(shù)據(jù)。”
降低大數(shù)據(jù)的應(yīng)用門檻
云計算從概念的炒作到應(yīng)用落地,中間經(jīng)過了幾年時間。與云計算需要尋找適合的應(yīng)用切入點和商業(yè)模式不同,大數(shù)據(jù)的概念從提出到轉(zhuǎn)化為應(yīng)用的速度非常快。這是因為,數(shù)據(jù)處理和挖掘是行業(yè)用戶的必然需求,而以前只是因為工具的限制,抑制了行業(yè)用戶的需求。隨著大數(shù)據(jù)技術(shù)的成熟和工具的豐富,行業(yè)用戶的大數(shù)據(jù)需求一下子爆發(fā)出來。陳堅也認同此觀點:“大數(shù)據(jù)平臺可以提升數(shù)據(jù)處理和挖掘的效率,為用戶帶來實實在在的價值,最典型的例子就是精準(zhǔn)營銷。數(shù)據(jù)擁有者本來就具有大數(shù)據(jù)處理的沖動,這在智慧城市、公安等領(lǐng)域表現(xiàn)得十分明顯。”
目前國內(nèi)外的電信運營商,還有金融、智慧城市、公安等行業(yè)的客戶都已經(jīng)部署了中興通訊的大數(shù)據(jù)平臺。陳堅舉了一個電信行業(yè)的大數(shù)據(jù)案例。當(dāng)客戶對電信運營的服務(wù)質(zhì)量不滿意時,往往只有少數(shù)用戶會撥打客服電話投訴。而這些不滿意的客戶,很可能會在自己的親友中傳播大量的負面情緒。電信運營商如果通過客服系統(tǒng)主動、大面積撒網(wǎng)去消除這種負面影響,需要付出高昂的代價。而通過收集電信系統(tǒng)中的過程信令數(shù)據(jù),加以分析和挖掘,就可以發(fā)現(xiàn)客戶體驗最差的客戶群,并對這些特定客戶進行主動關(guān)懷,從而提高關(guān)懷行為的準(zhǔn)確性,以較低的代價,主動消除負面影響。
中興通訊除了可以提供大數(shù)據(jù)平臺軟件以外,還提供方便中小企業(yè)用戶使用的易擴展的大數(shù)據(jù)一體化解決方案。王德政表示,大數(shù)據(jù)的落地要考慮兩方面因素:一是技術(shù)可行性,二是經(jīng)濟可行性。從目前情況看,與大數(shù)據(jù)相關(guān)的技術(shù)問題已經(jīng)基本解決,而降低大數(shù)據(jù)應(yīng)用的門檻,讓大數(shù)據(jù)真正給客戶帶來商業(yè)價值是行業(yè)客戶在部署大數(shù)據(jù)時要著重考慮的問題。