何明智

在大數(shù)據(jù)時代下,大數(shù)據(jù)與小數(shù)據(jù)不是相互對立的關系,而是相互依托的統(tǒng)一體,兩者在各自層面發(fā)揮不同價值和作用。
當前,我國正經(jīng)歷向數(shù)字經(jīng)濟邁進的新歷史階段,數(shù)字要素驅動下的數(shù)字化理念和商業(yè)模式不斷革新,正促使我國企業(yè)積極布局數(shù)字化轉型戰(zhàn)略。但當下,我國多數(shù)企業(yè)對大數(shù)據(jù)應用深度不夠,數(shù)據(jù)資源潛力釋放不足,數(shù)據(jù)價值尚未充分挖掘,大數(shù)據(jù)作為新型生產(chǎn)要素的驅動作用并不明顯,相反,很多企業(yè)仍將以小數(shù)據(jù)視為企業(yè)最重要的數(shù)據(jù)資源。大數(shù)據(jù)時代,對企業(yè)而言,是大數(shù)據(jù)還是小數(shù)據(jù)更具價值?本文認為,在大數(shù)據(jù)時代下,大數(shù)據(jù)與小數(shù)據(jù)不是相互對立的關系,而是相互依托的統(tǒng)一體,兩者在各自層面發(fā)揮不同價值和作用。將大數(shù)據(jù)與小數(shù)據(jù)分析有機結合,促進大數(shù)據(jù)和小數(shù)據(jù)融合應用,充分挖掘數(shù)據(jù)資源的內(nèi)在價值,能有效解決企業(yè)數(shù)字化轉型遭遇的痛點問題。
大數(shù)據(jù)與小數(shù)據(jù)的基本區(qū)分
大數(shù)據(jù)(big data),又稱巨量數(shù)據(jù)集合,指無法在一定時間范圍內(nèi)用常規(guī)軟件工具進行捕捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。大數(shù)據(jù)具有“5V”特征,即大體量性(Volume)、多樣性(Variety)、高增長性(Velocity)、高價值(Value)和真實性(Veracity)。大數(shù)據(jù)本身并不產(chǎn)生價值,只有通過分析容量巨大、構成復雜的海量數(shù)據(jù)進而挖掘其中有用信息之后,大數(shù)據(jù)的價值才能得以展現(xiàn)。
小數(shù)據(jù)(small data),并非指小規(guī)模數(shù)據(jù),它是指以特定對象為中心、以回應特定需求為導向、以解決特定問題為目的,具有多源性、異質性、動態(tài)性、全息性的數(shù)據(jù)集以及相關的數(shù)據(jù)采集、處理、分析和人機交互的思維方式及數(shù)據(jù)處理方法。小數(shù)據(jù)是可用于支撐企業(yè)智能決策的高質量數(shù)據(jù),無需復雜算法、昂貴成本,任何企業(yè)都可以實現(xiàn)對小數(shù)據(jù)的分析應用。
大數(shù)據(jù)與小數(shù)據(jù)并非對立關系,而是統(tǒng)一體。小數(shù)據(jù)是大數(shù)據(jù)的一個側面,通過對小數(shù)據(jù)進行匯集、擴展和鏈接形成更大的數(shù)據(jù)集后,小數(shù)據(jù)將變得越來越趨近于大數(shù)據(jù),同時,小數(shù)據(jù)從中微觀層面深度挖掘信息的數(shù)據(jù)處理范式,能夠有效彌補大數(shù)據(jù)在應對特定場景、針對具體目標、滿足特殊需求方面的缺陷和不足。
大數(shù)據(jù)與小數(shù)據(jù)挖掘數(shù)據(jù)價值各有千秋
(一)大數(shù)據(jù)挖掘不特定數(shù)據(jù)的潛在價值,小數(shù)據(jù)釋放特定數(shù)據(jù)的顯性價值
從數(shù)據(jù)處理對象方面看,大數(shù)據(jù)有能力對海量非結構化數(shù)據(jù)和半結構化數(shù)據(jù)進行處理分析,對企業(yè)充分挖掘企業(yè)內(nèi)部管理數(shù)據(jù)及用戶數(shù)據(jù)的潛在價值具有重要意義。根據(jù)IDC報告,企業(yè)中80%的數(shù)據(jù)都是非結構化數(shù)據(jù),且每年都按指數(shù)增長60%,但目前這些數(shù)據(jù)尚處于沉睡狀態(tài),造成極大的數(shù)據(jù)資源浪費,大數(shù)據(jù)利用可視化工具分析非結構化數(shù)據(jù)能幫助企業(yè)快速地認知現(xiàn)狀、顯示趨勢并識別新問題。
小數(shù)據(jù)則是圍繞企業(yè)特定目標、瞄準特定問題而建立數(shù)據(jù)處理分析系統(tǒng),它一般處理具有高價值性、高精確性及動態(tài)性結構化數(shù)據(jù),對企業(yè)進行高效、精準的商業(yè)管理決策具有重要意義。例如,在個人穿戴智能傳感器應用場景下,小數(shù)據(jù)對特定個人的生理、活動、健康狀況等“自我量化數(shù)據(jù)”進行分析,通過挖掘用戶特定需求來提供個性化服務。
(二)大數(shù)據(jù)基于相關關系發(fā)現(xiàn)規(guī)律,小數(shù)據(jù)依托因果關系驗證規(guī)律
從數(shù)據(jù)分析邏輯方面看,大數(shù)據(jù)的核心特征和其革命性在于,僅僅基于海量數(shù)據(jù)之間的相關關系,便可發(fā)掘數(shù)據(jù)內(nèi)蘊藏的規(guī)律進而對未來進行預測,而無需認知規(guī)律背后的原因。這種通過數(shù)據(jù)發(fā)現(xiàn)問題的全新范式,完全不同于傳統(tǒng)上的邏輯推理和經(jīng)驗歸納方法,為人類認知開辟了新天地。在實際應用中,大數(shù)據(jù)能為企業(yè)提供智能化決策能力,提高運行效率和風險管理能力,實現(xiàn)精準營銷、預測性維護等大數(shù)據(jù)應用,比如美國沃爾瑪超市利用“啤酒+尿布”的相關性分析進而促使啤酒銷量大幅增加,便是大數(shù)據(jù)依靠相關關系的成功案例。隨著人工智能技術的發(fā)展,基于機器學習輔助決策的大數(shù)據(jù)應用價值將進一步凸顯。
小數(shù)據(jù)基于因果關系進行預測,是一種自上而下的論證和決策過程,通過數(shù)據(jù)分析為企業(yè)決策提供因果解釋的依據(jù)。基于大數(shù)據(jù)的相關性分析雖取代了直覺決策,但仍難以避免出現(xiàn)錯誤預測,其后的因果關系驗證過程對企業(yè)避免風險、正確決策仍然至關重要。例如,舊金山地區(qū)衛(wèi)生部門通過大數(shù)據(jù)分析發(fā)現(xiàn),艾滋病率會隨著同性戀人群肝病發(fā)病率上升而上升,但實際上,這種正相關性的大數(shù)據(jù)預測失敗了,通過小數(shù)據(jù)調(diào)查才發(fā)現(xiàn)背后的真相,同性戀群體反而更為注重避免交叉感染。
融合大數(shù)據(jù)與小數(shù)據(jù),助力企業(yè)破解數(shù)字化轉型難題
(一)大數(shù)據(jù)驅動企業(yè)轉型困境
大數(shù)據(jù)時代,企業(yè)力爭利用大數(shù)據(jù)推動數(shù)字化轉型,然而數(shù)字化轉型效果并不顯著。埃森哲研究顯示,目前,80%以上的中國企業(yè)尚未摸清數(shù)字化轉型的路徑,僅有4%的中國制造企業(yè)釋放了數(shù)據(jù)潛力,成功將數(shù)字化轉型投入轉化成為業(yè)務成果。大數(shù)據(jù)驅動企業(yè)數(shù)字化轉型依然面臨如下問題:
一是大數(shù)據(jù)分析處理存在性能瓶頸。企業(yè)面臨PB級甚至EB級數(shù)據(jù)的處理需求時,企業(yè)傳統(tǒng)架構在大數(shù)據(jù)應用過程中遭遇嚴重的性能瓶頸,難以對大數(shù)據(jù)進行高效分析處理,此外,算法、算力發(fā)展不足也限制了大數(shù)據(jù)的分析處理能力。二是企業(yè)大數(shù)據(jù)應用與實際業(yè)務需求間存在脫節(jié)。企業(yè)在大數(shù)據(jù)解決方案設計過程中,面臨技術與業(yè)務協(xié)同困難、產(chǎn)品供給與需求不匹配的現(xiàn)象,嚴重制約企業(yè)產(chǎn)品服務的數(shù)字化創(chuàng)新。據(jù)統(tǒng)計,僅有8%的企業(yè)能夠基于可采集用戶行為數(shù)據(jù)的智能產(chǎn)品終端,通過大數(shù)據(jù)分析提供創(chuàng)新服務。三是各企業(yè)間數(shù)字化協(xié)同發(fā)展水平不高。企業(yè)數(shù)據(jù)能力及業(yè)務需求的不同增加了企業(yè)間數(shù)字化協(xié)同發(fā)展的復雜度,大型龍頭企業(yè)、中小型企業(yè)、技術創(chuàng)新型企業(yè)對大數(shù)據(jù)應用的需求和投入差別巨大,企業(yè)數(shù)字化協(xié)同轉型的效果并不明顯。當前,大數(shù)據(jù)應用主要聚焦在阿里巴巴、騰訊、網(wǎng)易等大型互聯(lián)網(wǎng)企業(yè),中小企業(yè)由于擁有數(shù)據(jù)量小、大數(shù)據(jù)應用成本高等原因,處于大數(shù)據(jù)“弱勢”地位。
(二)推動大數(shù)據(jù)與小數(shù)據(jù)融合應用
大數(shù)據(jù)為企業(yè)數(shù)字化轉型帶來前所未有的機遇,但大數(shù)據(jù)尚處于發(fā)展的初級階段,只有與小數(shù)據(jù)融合發(fā)展,才能更好促進大數(shù)據(jù)應用落地。
一是“關聯(lián)+因果”,輔助企業(yè)數(shù)字化管理決策。企業(yè)內(nèi)部生成的數(shù)據(jù)正成為無處不在的戰(zhàn)略資產(chǎn),數(shù)據(jù)驅動管理決策時企業(yè)數(shù)字化轉型的關鍵之一。一方面,運用大數(shù)據(jù)驅動企業(yè)財務管理、人力資源管理等領域數(shù)字化,同時,構建企業(yè)內(nèi)部各職能部門的數(shù)據(jù)共享平臺、數(shù)據(jù)決策平臺,為企業(yè)決策構建決策基礎、提供初步?jīng)Q策方案;另一方面,小數(shù)據(jù)利用大數(shù)據(jù)預測結果進行迭代分析,并針對具體的決策目標提供定向性、精確性分析,確保企業(yè)高效做出合理性和一致性的決策。大數(shù)據(jù)和小數(shù)據(jù)相結合,將有效提升管理效益,促進決策效率。
二是“感知+需求”,實現(xiàn)個性化服務創(chuàng)新。提供新型數(shù)字化產(chǎn)品服務是企業(yè)數(shù)字化轉型的核心動能。一方面,利用大數(shù)據(jù)分析進行個性化精準營銷,對多維度數(shù)據(jù)信息的挖掘分析,精準定位用戶需求、行為偏好,為用戶提供個性化、智能化服務。另一方面,利用小數(shù)據(jù)為產(chǎn)品或服務進行市場精確定位,精準挖掘優(yōu)勢產(chǎn)品和潛力服務項目,深度提升用戶觸達率和用戶黏性,圍繞特定對象需求提供全方位、動態(tài)實時的個性化服務。
三是“平臺+價值”,促進數(shù)字化生態(tài)構建。發(fā)揮大企業(yè)的大數(shù)據(jù)技術能力及數(shù)據(jù)資源優(yōu)勢,面向中小企業(yè)打造數(shù)據(jù)管理應用、技術服務支撐等平臺,構建大中小企業(yè)數(shù)字化協(xié)同轉型生態(tài)系統(tǒng)圈,逐步形成大中小企業(yè)各具優(yōu)勢、競相創(chuàng)新、梯次發(fā)展的數(shù)字化產(chǎn)業(yè)格局,推動企業(yè)間大數(shù)據(jù)和小數(shù)據(jù)融通應用、產(chǎn)業(yè)鏈各環(huán)節(jié)良性互動、營造數(shù)據(jù)融合的生態(tài)環(huán)境。