

不要認為大數據還是一個傳說。每一天,我們所產生的數據都在為大數據服務提供素材,同時我們也不得不受到大數據的影響。
這一點在互聯網上最為明顯。打開微博,大數據會“猜你喜歡”什么樣的文章;電商購物,大數據會“為你推薦”你可能需要的商品;聊個QQ,加好友時大數據會告訴你,有一些“你可能感興趣的人”正在線上。甚至于,就是看一下新聞,大數據也會根據你的瀏覽記錄選擇推送什么樣的廣告。
大數據之所以能夠“緊逼盯人”般地捕捉到我們的好惡,是由于其獲取到了我們所創造的信息。這些信息包括了我們所發表的文章、瀏覽過的網站、加過的好友等,或有意或無意的,我們成為了大數據的樣本收集對象。
這種被電腦所操縱的場景,可能多少會讓人有些反感。不過,人類并非是被信息技術所監控的唯一對象。機器,正在成為與人類一樣的“難兄難弟”,受到信息技術的左右。來自分析調研機構IDC的研究報告認為,到2020年全球數據資料存儲量將達到40ZB。在這其中,大部分數據是由機器,包括機器傳感器以及與其他設備通信的智能設備所產生的。
機器,大數據的主要來源
這些由機器所產生的數據,包括了計算結果、設備運行狀況、溫度等多方面的信息。通過對這些數據的匯總、整理、分析,我們不僅可以從中了解產品生產過程中的各個環節,同時也可以了解到機器各部件的運行狀況。在工業和制造業領域,大數據正在幫助我們改進設計、制造和交付的流程。
目前,一些企業已經在利用大數據進行工業制造應用。在福特汽車的工廠里,幾乎所有的制造流水線上都安裝有各種傳感器,通過這些傳感器,福特汽車能夠收集到大量在汽車生產過程中的數據。目前,福特汽車已經有計劃,利用這些數據打造出一個完全建設在信息系統中的“虛擬工廠”。在這個虛擬工廠中,從設計、制造、組裝到包裝,所有的流程均由計算機進行模擬。從模擬場景中工程師可以隨時觀察流水線的運作過程,并對制造工藝、零件裝配等細節進行調整,利用海量數據探索最佳的生產工藝。最終,當虛擬工廠運轉正常后,會將整個模型“平移”到物理場景中,進行正式投產。
同時,在生產管理方面,福特汽車也在從大數據借力。其從中國、墨西哥、西班牙、德國、英國和美國6家裝配廠分別收集到了工人的人體工程學數據,由項目團隊進行匯總和處理,并打造出了兩個可用于人體工程學評估的標準虛擬人體模型。這些模型綜合反映了福特汽車全球工人的特征和結構,使得企業可以根據不同區域工人的工作能力,制定適合他們特質的工作要求,以提高生產率。同時,福特工程師還在嘗試將動態捕捉技術和人體建模軟件結合在一起,為全球各地區福特工廠的工人設計更加合理的工作流程。
不只是汽車,在零售業大數據也在發揮其用武之地。在零售領域,通過將ERP與來自POS(銷售終端)機的信息整合,供貨商可以及時得知超市的需求,調整送貨周期。如果再整合了天氣預報系統、車輛管理系統的話,信息系統通過數據分析,甚至可以根據天氣、車輛位置自動調整送貨周期。如今,這種被命名為需求信號儲存庫(Demand Signal Repository)的大數據分析系統已經開始被零售商所采用。
消化不良的“數據獵狗”
無論是制造業還是零售業,在整個工業生產和銷售過程中,數據來源基本可以被劃分為產品數據、運營數據、產業鏈數據以及外部數據四個不同的部分。
產品數據:產品數據中除了包含有其自身的特征和功能外,還有設計、制造、實驗等多個部分。
運營數據:其中涵蓋了管理、組織、市場、考核、薪酬等方面的內容。此外,與產品數據不同,運營數據中同時涵蓋了員工積極性、品牌知名度等抽象數據
產業鏈數據:上通供應商,下達消費者,產業鏈數據中包含了與產品供求關系相關的各類信息。除此之外,同運營數據類似,其也包括了消費者滿意度等抽象數據。
外部數據:這一部分的內容有法律法規、競爭對手分析等。
如此之多的數據來源,其內容很多是由機器和傳感器所反饋得來的。這對于管理者來說亦喜亦優。利好的一面在于,機器會嚴格執行命令,而不會松懈。而這一點卻恰恰成為了機器的不足:只會傻傻地收集信息,但是無法進行處理。
去粗取精的目的,將使得大數據分析可以在工業領域發揮自己的用武之地。不過大數據分析的能力還是遠遠趕不上數據的發展。這種能力包含了三個部分的內容:大數據分析速度、大數據分析的精細度,以及相關的專業知識。
在歐洲粒子物理研究中心內,鋪設著一個龐然大物——大型強子對撞機。其被深埋在100米深的環形隧道內,橫跨瑞士和法國邊境。根據統計,在開足馬力的情況下,大型強子對撞機所產生的數據流將達到每秒大約700兆字節,每年達到1.5萬億字節。2012年整年,這臺龐然大物共產生了大概30TB的數據。這些數據,都保存在歐洲核子研究中心的存儲系統內,并通過高性能計算系統對其進行夜以繼日的大數據分析。
盡管研究中心每天都要迎接大量的新數據,而且其已經對舊有數據進行了分析,但是他們依然不可能隨便丟掉任何一部分內容。研究中心的物理學家Pere對此表示說:“我們不能丟棄掉任何數據,否則數年后你面對新分析出來的數據時可能會突然意識到,‘天哪,幾年前我扔掉了我需要的東西。’”
福特汽車也面臨著這樣的困擾。盡管福特首席大數據分析師John Ginder將這家公司稱之為“數據獵狗(data hound)”,但是這只獵狗目前還沒辦法完全消化掉其尋覓來的所有食物。他認為,目前大數據分析工具并不成熟,可供企業使用的成熟大數據商業工具非常少。此外,相關的專業人才也比較缺乏。在John眼里,未來的“數據科學家”不是懂得如何書寫合乎規范的SQL查詢語句的人,而是知道如何提出正確問題的業務分析師。
需求執“智造時代”牛耳
來自國外媒體的調研認為,在這場大數據的洪流中,工業制造企業已經落后了。調研顯示,只有3%的企業將數據的訪問與分析進行了整合。甚至于,這些制造企業對自己的信心都不太足。有66%的受訪制造企業認為,自己在對數據的利用方面“水平一般”或者“水平較差”。
相比IT行業火熱的大數據之旅,制造業的這種現象并不偶然。一方面,工業企業對于信息系統的認知程度并不高,甚至認為這是兩個沒有交集的行業。除此之外,即使企業對大數據在業務流程改造、商業模式挖掘方面的作用有所認知,數據量增加、業務模式更迭、前期投入成本升高等IT化所帶來的壓力,也使得其很難在此進行大規模投入。
幸運的是,現代工業帶來了規模化、快速響應、高自動化的需求,這使得企業必須要尋求改變。來自GE(通用電氣)的觀點認為,在當今社會,單純從物理方面提升提高生產效率已經變得非常困難。因此,對流程進行改革成為了現代工業的一個非常重要的標志和人物。根據GE發布的報告估測,每提高1%的燃油效率,航空業每年能節省20億美元,而能源行業則能節省40億美元。
長沙中聯重工科技發展股份有限公司CIO王玉坤認為,大數據在工業領域的應用應該分步推進,首先要保證數據的數量和質量,企業里絕大部分的業務都要在系統中運行,減少人工參與;其次,讓企業決策者建立對數據的興趣,在了解和應用以后,自然就提出了需求。
如果今天領導想要了解過去3個月內某條生產線的狀況,你難道還要打開Excel表格查詢,甚至搬出以前記在紙上的生產日志逐條翻閱嗎?為什么不試試大數據?