劉正源,王保魯,劉鳳坤
(1.中國紡織工業聯合會 品牌工作辦公室,北京 100020;2.北京服裝學院,北京 100029;3.中國紡織信息中心,北京 100025)
數字化時代的到來,改變了人們的生活習慣和消費方式。在這個時代里,每個個體每天會產生大量的數據,包括出行、用餐、購物、娛樂、快遞等日常行為的信息數據,加上物聯網技術的快速發展,人們每天都生活在一張巨大的數據網里,據國際數據公司(IDC)預測,到2025 年,全球數據量將增至175 ZB。
與此同時,消費環境也發生著深刻的變化。物質不斷豐富,產品兩極分化;新冠疫情加快了消費線上化趨勢;高利時代逐步轉向微利時代。面對競爭愈加激烈且多變的消費環境,運用科學的手段支撐決策、指導經營和預判方向尤為重要。2011 年,IDC 和麥肯錫研究院對大數據的潛力和關鍵技術等進行了分析,指出數據為企業帶來決策價值,將成為企業的關鍵競爭力。2015 年國務院頒布《促進大數據發展行動綱要》,2019 年十九屆四中全會更是將數據列為一種生產要素。由此可見,大數據的重要作用和戰略地位。
在紡織服裝企業中,一個有效的服裝供應鏈依賴于對高度波動的需求進行快速準確預測,企業可以運用數據分析,科學地在采購、研發、生產、銷售等各個環節產生的數據中探索發現問題、分析問題、尋找規律、判斷趨勢、預測未來,進而提高企業庫存、物流、產品、客戶等方面的管理效率和整體收益。本文主要介紹數據分析方法及其應用場景,并舉例說明數據分析在服裝企業經營預測中的實踐應用。
數據分析思維的本質是尋找事物之間的關系,兩個與多個事物之間可能存在相關關系、因果關系,或者具備一定的敏感性,數據分析就是通過科學的方法,在一堆看似雜亂無章的數據中,尋找出變量之間的聯系,探索業務背后的關聯和變化背后的原因,進而對想要分析的問題進行描述或預測。
需要注意的是,具有相關關系的變量之間并不一定存在因果關系;因果關系有很多種形式,可以是一因一果,多因一果,一因多果,多因多果。
數據分析方法可以按照定性分析和定量分析來劃分。根據分析問題的復雜性,通常情況下,分析一個問題,需要定量分析和定性分析相結合,如果數據條件比較好,可以以定量分析作為基礎,支撐定性分析做出最后的決策。
常用的定性分析方法有:經驗觀察法、訪談法、德爾菲法、頭腦風暴法等。
常用的定量分析方法有:機器學習算法,包括描述分析類的有降維、聚類、關聯規則等,預測分析類的有回歸分析、時間序列、邏輯回歸、決策樹、臨近算法、集成學習、支持向量機、樸素貝葉斯、神經網絡等;建模算法包括漏斗模型、卡諾模型、價格敏感測試模型、巴斯模型、對應分析法、協同過濾、對比測試等。
數據分析的應用場景非常廣泛,如戰略分析、經營分析和投資分析等。以經營分析為例,經營的主要目標是開源節流,開源表現在客戶管理、產品管理和營銷管理;節流主要指供應鏈,包括采購、生產和物流環節。以客戶管理和產品管理為例,例舉對應的分析方法如圖1所示。

圖1 客戶管理和產品管理分析方法舉例Fig.1 Examples of customer management and product management analysis methods
圖2示出數據分析的完整流程。根據此流程,本文以某紡織服裝上市公司年報披露的營業收入數據為例,采用時間序列的方法,預測未來收入情況。

圖2 數據分析流程Fig.2 Data analysis process
本文要用到的數據為某上市公司年報中的公開數據,屬于二手數據,直接到官網下載該公司近11年年度報告,查找并整理出近11年的各季度營業收入數值如表1所示。

表1 某上市公司近11年季度營業收入Tab.1 Quarterly operating income of a listed company in the past 11 years 億元
通常情況下,數據預處理是個較為復雜的過程,涉及到缺失值填充,異常值處理等步驟,本文使用的數據全部來自上市公司年報,數據整齊,因此無需處理。
常用模型有機器學習中的監督學習和非監督學習算法,以及一些應用較為廣泛的模型,如AARRR、RSM、PFM、KANO、漏斗模型等。本文案例是要預測收入,經典的預測模型有回歸分析和時間序列算法,其中,時間序列適用于有季節(時間)波動、有趨勢的事物預測,如銷售、金融、股票、基金、成本、血壓等。對于既有季節波動又有趨勢的數據,可以選擇時間序列分解預測法;對于只有季節周期波動的數據,可以選擇時間序列Winter指數平滑法;對于只有趨勢變化的數據,可以選擇時間序列Holt指數平滑法;對于變化比較平穩的數據,可以選擇時間序列簡單指數平滑法。
圖3示出該上市公司近11年季度營業收入變化。通過觀察,可發現明顯的季節周期波動和上升趨勢,所以本文案例選擇時間序列分解預測法進行分析。

圖3 某上市公司近11年季度營業收入折線圖Fig.3 Line chart of quarterly operating income of a listed company in the past 11 years
本文案例以時間序列分解預測乘法模型為例,進行預測,模型如下:
=×××
式中:為預測值;(Trend)為趨勢因素,(Cycle)為生命周期,(Season)為季節因素,(Inregular)為不確定因素。
本文案例目標是預測2021年4個季度的營業收入,假設經濟環境發展平穩,即暫不考慮不確定因素(如突發疫情影響),另外,生命周期通常情況下大于1年,所以也暫不考慮生命周期因素,通過對和的計算預測營業收入,即=×。
具體計算層面,常用的工具有Python、SPSS、Excel等,本文用相對基礎的Excel工具簡單列示基本原理和操作步驟。
基本原理:由于數據變化既有季節波動又有趨勢變化,需要將2種影響進行分解,分別計算出和。對于,采用回歸分析方法,即=+來計算;對于,因為一年4個季度,每個季度采集1次數據,即步長為4,所以要分別求出每個季度的季節因子、、、,具體步驟如下:
第1步:按照時間先后順序,將所有數據排成一列,并標記好季節序號和時間序號,共計44個數據;
第2步:通過4項移動平均消除季節波動影響,再進行2項移動平均對數據進行對稱處理,得到的40個數據(即)與原始數據前后劇中對齊,確保要求的季節因子與實際季度一一對應;
第3步:用對應的原始數據除以新得到的數據(即),得到對應的季節因子列;
第4步:用均值法修正每一年同一季度,得到4個季節因子值:0.97、1.60、0.96、0.91;
第5步:修正,使∑=4,得到修正后季節因子=088,=144,=086,=0.82;
第6步:用Excel進行回歸分析,求的趨勢方程,先用原始數據除以對應季節因子,得到沒有季節波動的一列新數據,作為值輸入區域,值輸入區域選擇時間序號(即1,2,…,44),然后選擇置信度95%,輸出結果如表2~4所示。

表2 回歸統計表Tab.2 Regression statistics table

表3 方差分析表Tab.3 Variance analysis table

表4 回歸參數表Tab.4 Regression parameter table
得到趨勢方程=+=2948+0106,代入時間序號(即1,2,…,48),得到新的趨勢數據列,共計48個數據;
第7步:將48個趨勢數據乘以對應季節因子,得到預測值,前44個數據做模型擬合檢驗備用,后4個數據即為2021年4個季度的預測數據,分別是6.68、6.42、6.98、11.61億元。截至2022年5月,該公司2021年4個季度實際營業收入分別為6.28、6.81、6.81、11.90億元,與預測值相對誤差分別為6.42%、5.77%、2.46%、2.45%,均小于10%,預測準確度相對較高,另外由于已知有新冠疫情影響,可根據實際情況參考以往災害影響數據,增加不確定因素的干擾,使預測更準確。
用均方根誤差來檢驗預測值同真值之間的偏差。偏差越小,模型擬合度越好,預測越準確,公式如下:

式中:為均方根誤差;為取樣點數目。
本文案例的均方根誤差是0.615,偏差小,模型擬合相對準確。
可視化的原則是圖優于表優于文,常用的圖有:柱線結合圖、條形、直方圖、餅圖、折線圖、散點圖、氣泡圖、雷達圖、熱力圖、桑吉圖等,本文用折線圖為例,展示預測結果如圖4所示。

圖4 某上市公司近11年季度營業收入實際值與預測值對比Fig.4 Comparison of actual and predicted value of quarterly operating income of a listed company in the past 11 years
在企業實際應用中,需要展示的數據通常是繁多復雜的,通常使用Tableau、WordArt、E-charts等工具制作數據看板等形式進行展示。
任何決策都需要有事先預測,預測的科學性決定預測的準確性,文章通過梳理常用的數據分析方法,得出紡織服裝行業作為強季節性影響行業,可以通過時間序列分析,得出相對準確的銷售預測,進而指導采購、生產等產業鏈前端決策行為,有利于減少庫存、提高資金使用率和周轉率,進而提升企業運營質效。
除此之外,紡織服裝產品具有周期短、單品多,且銷售情況受市場喜好影響明顯,這就要求產品研發提前預判和客戶運營精準分析,企業可根據自身產品和客戶的特點組合定制分析模型,開展數據分析工作。