趙連明

在即將到來的大數據“七年之癢”之際,在人類普遍都關注大數據的同時,是否還有必要關心小數據的問題及其開發價值呢?
1848年,詹姆斯·W·馬歇爾(James W. Marshal)在薩克拉門托山谷(Sacramento Valley)發現金塊后,美國迎來了19世紀歷史上影響最廣泛、意義最深刻的淘金熱浪潮。與19世紀40年代美國淘金者的情況一樣,隨著信息技術與實體經濟的深度融合,一場基于海量數據的大規模生產、分享、應用大數據的“黃金浪潮”已經再次拉開序幕,新一代的夢想家通過巨型海量的大數據提取有價值的商業見解。毫無疑問,大數據、云計算、物聯網、移動互聯網是繼“淘金浪潮”之后信息技術融合應用的新焦點和“黃金浪潮”,將引發各領域、各行業生產模式、商業模式、管理模式的變革和創新,將對經濟社會發展及人們的生活方式產生深刻影響。大數據能讓企業制定更好的決策,從而提高效率、節約成本、增加收入。但是,在即將到來的大數據“七年之癢”之際,在人類普遍都關注大數據的同時,是否還有必要關心小數據的問題及其開發價值呢?許多企業還沒有認識到小數據的好處,即便認識到了,也許還不知道如何利用。那么對于企業而言,是否該靜下來進行一些“冷思考”呢?
大數據相關政策解讀
自大數據元年至今,大數據市場在我國萌芽、發展并獲得了極大關注。無論是從中央還是地方層面來看,目前各個領域內的大數據體系已基本完善,并進入落地實施階段。自2013年大數據元年開始,經過一年多的發展,2014年,“大數據”一詞寫到了政府工作報告中,翻開了大數據政策環境的新篇章。2015年,大數據產業進入高速發展時期,2016年,數據產業進入成熟期,有望在“十三五”期間帶動市場規模萬億元之巨的IT服務業轉型,促進國民經濟其他領域的飛速發展。除了國家層面,我國各省市地區也如雨后春筍般地相繼出臺相關政策規劃,積極促進當地大數據產業發展。據不完全統計,近年來中央、地方陸續出臺了160多份大數據相關政策文件,8個國家大數據綜合試驗區以及11個國家工程實驗室相繼啟動建設,20個省級單位設立了大數據專門機構,大多數省份設立了大數據管理局……通過對中國大數據產業國家和地方層面的政策環境、大數據相關政策熱點等方面進行深入的解析,有助于全面把握大數據產業政策脈絡,及時了解中央及地方政府對大數據產業的扶持力度及方向。
大數據與小數據的內涵邏輯
在大數據興起之前,數據幾乎沒有“大數據”和“小數據”之分。從概念內涵上來講,大數據和小數據是相對統計的。小數據是描述并管理大數據的數據屬性的數據。無疑,大數據是由小數據構成的。關于大數據,就是要對海量的多源異構數據測度其不確定性,并挖掘、發現其中的有價值信息的過程,普遍被大家認可的是“4V”特征。而小數據與大數據的根本區別在于,小數據在以人為本的前提下,以個體(個人)為唯一對象進行全方位數據匯總,進行配套的收集、處理、分析,并對外交互。
世界上第一個注意到“小數據”的人是美國康奈爾大學計算機科學教授德波哈爾·艾斯汀,他通過對90歲高齡的父親臨去世前幾個月的觀察,發現父親在去世前幾個月內,雖然臨床特征上沒有表現出明顯異樣,但通過小數據的方式追蹤發現老人的脈動與之前相比發生了明顯變化。這種日常行為的小數據的關聯性分析,啟發了我們對“小數據”的重新認識和重視。此后,人們開始關注“小數據”,并發現小數據價值不菲,毫不遜色于大數據。
正因為小數據中蘊含著無數知識財富,所以我們必須認真加以研究。那么什么是小數據?它與大數據有什么關系?如何開展小數據研究?
小數據是以個體為中心的垂直和縱橫領域的數據,對個體數據全方位、全天候深入、精確地挖掘、利用;而大數據則側重于某領域的廣度,大范圍、大規模、全面地進行數據收集、處理、分析。“以小博大”(或者說“統籌大數據”)應該是小數據區別于或者是存在于大數據的價值所在,如何從大數據中挖掘出更深入、更有針對性、更有說服力的信息,除了大數據方法外(發現基本規律、基本關系和基本趨勢),更需要從小數據著手,觀察個體特征的變化,通過發現其形成原因、表現特征和產生的影響,能得到我們意想不到的結果。
小數據不僅是構成大數據的基礎,也提供了更精準、更細致、更有內涵的信息,從而有利于發現較為精準的因果關系。如果把大數據比喻為原油的話,那么小數據就是原油提煉出的石油,而且可以進行反復的提煉、不斷的加工,大數據中的小數據會更有價值、更精準。由此可知,小數據分析的因果關系決定著大數據分析的相關性。
基于企業視角下小數據如何“以小博大”撬動大數據?
近年來,大數據炒得如火如荼,大數據相關產業的爆發式增長掩蓋了人們對小數據價值的關注,并給人造成一種假象,認為大數據技術可以解決數據處理的一切問題。由于起先沒有建立完善的數據管理體系,小數據仍然沒有受到人們的重視,導致在大數據相關產業中普遍存在著數據存儲量大、數據質量不足的現象,無法實現真正意義上的大數據的價值特征,數據對大數據產業發展所具有的積極作用也沒有得到應有的發揮。很多企業、用戶都對大數據十分感興趣,但是真正成功應用大數據的案例,在企業當中似乎也并不多。對于大多數企業而言,傳統的小數據仍然是企業最重要的數據資源,那么現階段究竟是大數據更重要,還是小數據更有價值?
在企業層面,面對紛繁復雜的各類數據時,企業想要研究出轉變自身的有效措施,卻往往容易陷入需采用最新、最先進技術來支持復雜商業過程的困境,而小數據的合理利用可以幫助企業擺脫這種困境,高效利用其現有資源。客戶關系管理是小數據應用的首要選擇,不僅能幫助銷售人員完成銷售任務,而且能增加客戶的忠誠度和滿意度。通過對客戶關系管理數據的分析,企業能夠更好地理解客戶、與客戶建立良好的關系。
企業應在做好大數據的基礎上,提取出具有鮮明特征且有價值的小數據,獲取有價值的客戶信息,幫助降低運營成本、提高運行效率、及時調整企業定位和策略。數據科技時代,要充分利用數據資源,以“從大數據得到規律,用小數據去匹配個人”等方式來實現小數據和大數據的完美結合。
基于工業互聯網平臺建設的實證分析
工業互聯網平臺是基于大數據和人工智能等技術,將機器、數據、流程、人等因素融合創新,凝聚工業互聯網技術創新而形成的。工業互聯網平臺可以提供工業領域各行業的系統解決方案,為設備制造商、服務商、運營商實現產品創新、生產優化等效果,這就是以小數據集合撬動大數據的典型應用研究。
工業互聯網致力于構建開放、共享、合作、共贏的工業互聯網生態,結合自身在工業物聯網領域的行業積淀,聚合上下游產業合作伙伴和解決方案供應商能力,與合作伙伴合力打造端到端的工業物聯網產品,實現面向最終客戶的一站式價值輸出,打造中國本土的工業互聯網生態,真正意義上實現深度整合數據資源,實現大數據與小數據的深度融合。顯然,在大數據時代,小數據是不應該被忽略的,甚至是,如果給予足夠的支點,小數據足以“以小搏大”撬動大數據,如圖1所示。
在數據爆炸性增長的時代,對數據應用最大化的形式是對大小數據的完美結合。大數據不斷地幫助人類節約人力物力,使我們的生活實現自動化,工作實現精準化。但是由于大數據存在的數據庫的狹義理解,難以形成激發的功能,導致大數據不會激發深刻的見解,而且大數據分析也忽略了情感的存在,無法捕捉到人類重要的情感品質。這種情況下往往會產生很多能反映人們行為變化趨勢的小數據,如果單純依靠大數據而忽視小數據的應用,必定產生痛點。由此可以看出,大數據和小數據之間是耦合協調的“舞伴”。想要挖掘大數據中隱藏的真正價值,就要從小數據著手,精準研究小數據因果關系,來認識世界并改造世界。