“在沒有大數據之前,其實我們每天都在處理數據。”臺灣東吳大學數學系助理教授吳牧恩舉例,例如羊肉爐店老板每天要備貨多少量?鞋子工廠的生產線一個小時要生產多少雙鞋?臺北市長候選人的民調有幾個百分點?
1.基本邏輯推演
羊肉爐店每天要進貨多少白菜?
“你對于自己設定的目標,是要有一套邏輯推演的。有一定的了解,而不是從零開始,就像羊肉爐店老板或許無法精算9月與12月開店的備貨量有何差別,但他心中會有一個數字:每天最少要準備多少材料。”吳牧恩說。
2.把數據變成可處理的
白菜單位是一籃、10公斤,還是20顆?
大數據上手的第二步,就是開始搜集數據。如果歷史數據不齊全,就要從即刻開始搜集;如果歷史數據種類繁多,就要把數據變成有結構性、可處理的數據。像是羊肉爐店一天要進貨的白菜數量,單位是籃、公斤還是顆,都要統一成可處理的數據。
“搜集數據可能是多數人認為最大的進入門坎,但是數據卻藏在我們處理的大小事上。”吳牧恩說,如果有10年的數據,當然比3年的好,但只要有數據,就可以開始做分析。像對金融交易者來說,不只有長期股價走勢才是數據,就連上下五檔的掛單信息,也可以是數據。
3.設定想知道的問題
20℃雨天與15℃晴天,哪個營收高?
有了數據之后,你必須設定想知道的問題,到底是想要提高生產效率、增加獲利、提升客戶滿意度?還是要了解客戶想要的商品,再進一步去結合可能沒想過的數據?
“同樣一家羊肉爐店,在氣溫20℃的雨天與氣溫15℃的晴天,哪個環境狀況下的營收比較高?”天氣風險管理公司董事長彭啟明說,因為天氣是最容易取得的資料,也成為零售業進入大數據最常被拿來交叉分析的因子。
又例如最經典的尿布與啤酒的案例:妻子囑咐丈夫下班后到超市買尿布,賣場于是把啤酒擺在尿布旁,沒想到意外提高了啤酒的銷量。“如果羊肉爐店不只賣啤酒,同時也賣尿布呢?會不會有一樣的效果?這就是我們要用數據去驗證。”
用各式各樣的數據做了驗證后,我們才能得到數據的變化軌跡,進一步去得到有效的信息。“曾經有人將‘酸雨指標’與臺股走勢做交叉分析,結果還真的呈現部分相關,但到底是不是酸雨越酸、股民就不出門,干脆在家買股票,所以臺股才跟著大漲嗎?兩者的關聯是什么?至今仍不得而知。”吳牧恩說,大數據分析有一個特質,要得到的是結果(What),而不是要知道原因(Why)。
“如果你認同‘酸雨指標’跟臺股走勢有關,就可以跟著‘酸雨指標’來操盤,而不一定要從中知道兩者的關聯性。”吳牧恩說。
4.分析數據,得到有效信息
氣溫低、濕度越高,羊肉爐店的生意越好
獲得數據變化的軌跡后,最重要的自然是分析這個數據變化,從中得出有效的信息,再結合過去的歷史經驗,變成你的智慧。
羊肉爐店老板原本就知道氣溫越低生意自然越好,但在這個案例中,他會發現氣溫低、濕度越高,生意自然跟著好,吳牧恩解釋:“因為下雨會讓體感溫度更低,所以消費者就更想吃熱呼呼的食物。”
但不是濕度達到100%,羊肉爐店的生意也就跟著翻漲100%。彭啟明用雨傘公司的故事說明,連續下雨的第三天到七天的雨傘銷量最好,到了第八天,銷量就開始往下掉,因為該買雨傘的人都買了。回到羊肉爐的案例,當濕度達到100%,也可能會因為雨太大,客人就不愿意上門。
5.用數據來輔助決策
濕度60%、氣溫17℃,要多進貨三成!
“其實你每天在做的每個決定,都是一種預測,只要這個決定中含有不確定性,只要成功幾率不是100%,就是一種賭注。”吳牧恩說。
正因每個決策里都有不確定性,所以數據分析才會變得很重要。如何靠著數據分析,結合過去的管理經驗,讓營運效率更高、創造更多利潤,才能提升競爭力。
回到羊肉爐店的大數據冒險,這天臺北市的濕度60%、平均溫度17℃,要進貨多少白菜呢?吳牧恩用這個例子說明:“老板能用數據來輔助他的決策,而不只是憑經驗,就會得出今天要多進貨三成的白菜。”
相同的,不管是用在金融操作上,制造業的良率改善,或是零售業的供需備貨,都可以用類似的步驟來做決策。?笏(摘自臺灣《今周刊》)(編輯/袁紅)