趙一禧
現在大家都在說數據決策,但面對錯綜復雜的數據,能把數據運用于決策卻不是那么簡單。例如,汽車行業通常會有這樣的疑問,究竟下個月的車價會上漲還是下跌呢?
這是在汽車銷售過程中,大家發問得最多的問題之一,但也絕對是最難回答的問題之一。即使是經驗豐富的研究人員,手上擁有著一大堆的數據,也無法從錯綜復雜的數據中一窺究竟,甚至就算是廠家自己都未必知道自己的車下個月的成交價會怎樣變化。
面對這個切身的“不可能完成的任務”,威爾森通過大量的數據分析,發現存在一些方法可以對未來的價格走勢進行預判,其中一個就是用庫存判斷下個月的價格走勢。
庫存對經銷商來說就是資金,庫存越多則占用的資金就越多,而現金的流動性就越低,自然就會影響到經銷商的運營狀況,產生風險,因此,在庫存較大時,經銷商必然會想方設法盡快地清理庫存,讓庫存保持在一個合理的水平。
這時,價格就成為經銷商調節庫存的一個有效杠桿,這也為我們預測價格提供了可循之跡。
威爾森通過對數以億條的車型價格、庫存數據的研究發現:當庫存深度超過1.3時,庫存深度每增加0.1,月度價格則極有可能環比多降 0.7%。當然,(注:此結論來源于部分車型研究的一般結果,不同車型會有所差異。)透過數據迷霧,發現庫存與價格的關系,首先我們得對數據進行合理的加工。通常如果直接畫出某個車型的庫存與成交價的折線圖,往往看到的是這個樣子的(某中型轎車數據):
從圖1我們看出,成交價總體不斷下跌,庫存量則呈現不規則波動,兩者看上去幾乎毫不相關,甚至在局部存在一定的正相關,這樣根本不可能通過庫存來對價格作合理的預判。這主要是我們數據的“打開”方式不對,沒有掌握數據加工的方法是永遠無法發現其中的奧秘。
如何加工價格庫存數據
對于成交價數據,由于受型號權重變化影響,加權成交價并不是一個很好的反映價格變化趨勢的指標。那么該如何加工價格數據?
問題的答案取決于如何回答以下問題:如果某車型所有型號價格均下降2%,那該車型的價格是不是也應該降2%?計算車型價格降幅時是否應該考慮型號的權重?
看似簡單的問題,卻能引出不同的價格設計。威爾森在需求研發階段便設計出6種不同的算法,最后經過反復討論驗證,最后設計出MMI(MoM Market Value Index)——以市值為基礎的環比算法。該算法既能準確反映價格環比變化,又包含當前不同型號的權重信息。
而對于庫存,隨著銷量的季節波動,庫存絕對量也會相應波動,但這并不能很好地反映經銷商的庫存壓力。因此我們采用以下方式計算庫存深度:
這里有一個細節,就是使用上月末的庫存,而不是本月末的庫存,因為經銷商往往會根據上月末的庫存狀況來制定本月的銷售策略,因此采用上月末庫存來計算庫存深度更能反映經銷商的庫存壓力。
經過以上的加工后,我們看到的某車型庫存與價格的折線圖是這個樣子的:
從圖2可以明顯看出庫存深度與價格環比變化存在顯著的負相關,其相關性高達-0.64。另外再舉一個中型SUV的例子,如沒有經過數據的加工處理,庫存與價格的關系見圖3。
而經過處理后,庫存與價格的關系見圖4:
從圖中可以清晰看出,在庫存深度較高的2014年,價格顯著走低。
在正確的數據“打開”方式下,我們發現了庫存與價格的一般關系,也就找到了價格變化的其中一條“跡”。但是為了預測價格,我們還需建立庫存深度與價格的量化模型。
如何建立價格與庫存的量化模型
這里,首先簡單的假設價格與庫存深度的關系為簡單的線性模型關系:
價格環比 = 常數 + b * 庫存深度
然后通過回歸來擬合模型的參數,得到初步的回歸結果。一般的研究員可能到這里也就結束了,然而對于威爾森來說,這僅僅是建模的第一步。在進行參數估計后,我們得進入模型檢驗階段,至少有參數檢驗、擬合優度檢驗以及穩健性檢驗三個步驟。
從殘差中發現庫存壓力線
模型起初的R方(即擬合優度)并不高,經殘差分析,我們迅速定位了問題所在,新車上市期以及接近退市階段。
比如新車上市前兩個月屬于鋪貨期,此時庫存往往處于上升階段,但銷量卻極不穩定,價格的波動也較為隨機。如果將鋪貨期的數據與一般時期的數據混在一起計算,往往會對參數造成較大的干擾。
與此相對的則是接近某車型年款停售階段,此時庫存與銷量逐漸減小至零,這一階段的庫存深度指數往往會大幅波動,從而也會對參數的估計產生不良影響。
除了以上兩個異常時期外,通過分析殘差的趨勢變化,我們還發現庫存深度的不同水平,會對價格有不同的影響作用。
通過歸納總結,我們發現庫存會有一個壓力線,或者所謂的閾值,在閾值以下,價格相對穩定,反之則價格顯著下跌。基于這個發現,我們在回歸的時候對庫存深度進行分階段擬合。
以上文中型轎車為例,我們經過異常點的處理以及反復嘗試后,最終模型給出的結論如圖5:
價格環比值隨庫存深度的增加而下降;
在庫存深度達到1.3之前,價格環比值變化相對緩慢;
庫存深度為1.3時,價格環比下降約0.6%;
庫存深度在1.3以上每增加0.1,價格環比值下降0.7%。
我們找到了庫存深度與價格環比的顯著性關系,并給出了使用單一指標庫存深度對價格進行預測的基礎方法。
但成交價預測在不同的細分市場,不同的車型還會存在自己的特點,要做到準確地預測成交價,還需要根據實際情況做更多的數據挖掘,需要數據分析師以更全面的視角進行深入的研究與判斷。(本文作者為威爾森咨詢有限公司數據建模師)endprint