凌立文,徐鎂淇,張學競
(1.華南農業大學數學與信息學院,廣東 廣州 510642;2.華南農業大學鄉村振興研究院,廣東 廣州 510642)
【研究意義】我國不僅是豬肉產量大國,還是豬肉消費大國。受非洲豬瘟疫情的影響,豬肉價格從2018 年底的23.24 元/kg 持續飛速增長,到2020 年2 月達58.89 元/kg,隨后保持高位震蕩。豬肉價格的異常波動給農業生產、民生福利的健康發展帶來負面影響,對豬肉價格波動影響因素的分析及預測具有重要而深遠的意義?!厩叭搜芯窟M展】豬肉價格波動受到內、外部多重因素的共同影響,綜合當前學者的研究成果,歸納出以下5 大類豬肉價格波動的影響因素:(1)生豬養殖加工產業鏈。飼料價格波動是造成豬肉價格波動的主要因素[1];仔豬市場供給減少致使仔豬價格不斷攀升,進而導致生豬價格上漲[2];豬肉產量、出欄肉豬量以及年末存欄量則與豬肉價格波動呈負相關性[3]。(2)替代品市場。豬肉常見的替代品為雞肉、牛肉和羊肉等。豬肉價格與雞肉、牛肉價格之間存在正相關性,且牛肉價格波動對豬肉價格波動的影響最大[3],雞肉價格波動對豬肉價格波動的影響存在一定滯后性[4]。(3)宏觀經濟環境。經濟增長、貨幣政策、資金市場等宏觀經濟因素對我國農產品市場的影響較為直接和顯著[5]。貨幣發行量(M2)短期內對豬肉價格波動影響較小,但長期能顯著影響豬肉價格波動[6]。居民消費價格指數(CPI)與豬肉價格具有顯著的協同效應,二者存在雙向的格蘭杰因果關系[7]。(4)突發性和隨機性事件。非洲豬瘟、新冠疫情和經濟政策的不確定性等因素都會影響豬肉價格的波動[8]。生豬疫病對豬肉價格波動具有明顯的時變特征和顯著的橫向溢出效應[9],直接影響當期豬肉需求量,間接影響當期豬肉供給量[10]。政策不確定性對農業企業的投資行為存在明顯的抑制效應,且高于對一般企業的影響[11]。(5)國際市場環境。近年來,豬肉進口趨勢逐漸增加,全球豬價對中國豬肉零售市場產生的沖擊和傳導溢出效應逐漸顯現[12],國際市場的豬肉價格波動對國內生豬產業鏈各環節均產生不同程度的影響[13]。
科學準確地預測豬肉價格的未來運行走勢,可為生豬產業從業人員和相關管理部門制定決策提供參考依據。經濟計量模型和人工智能模型是當前研究中廣泛使用的兩類模型。例如,蔡超敏等[14]提出EMD-SVM 模型對我國豬肉市場價格進行分解集成預測,通過對分解后的子序列進行集成,更好地把握豬肉市場價格的波動規律與趨勢。Zhang 等[15]將向量誤差修正模型(VECM)與考慮上下界協整關系的智能模型(Coin AIs)進行組合以預測豬肉價格的區間波動,通過合理的數據轉換,證明了區間預測比點預測精度更高;姜百臣等[16]使用集成經驗模態分解(EEMD)與引入遺傳算法(GA)的支持向量機(SVM)的組合預測模型對豬肉價格預測精度更高。
【本研究切入點】通過上述文獻梳理可知,影響豬肉價格波動的內、外部因素眾多,這些因素對豬肉價格波動的影響機制、影響程度尚缺乏系統性分析;此外,不同影響因素對豬肉價格波動預測的有效性,仍有待進一步研究。關聯規則是一種分析事物之間相互依存及影響機制的數據挖掘方法,已在零售、金融、互聯網等領域得到廣泛應用[17]。將其應用于豬肉價格波動影響因素分析,有利于識別眾多因素中的關鍵影響因素。【擬解決的關鍵問題】本研究將多維關聯規則應用于豬肉價格波動因素分析,通過梳理影響豬肉價格波動的5 大類16 種影響因素并獲取對應的研究數據,運用Apriori 算法分析各因素對豬肉價格波動的影響關系及程度,將挖掘得到的高相關影響因素作為預測模型的輸入變量,設計多組對比試驗,探討不同影響因素的組合對提高豬肉價格預測精度的有效性。
本研究選取2010 年1 月至2020 年10 月國內豬肉價格作為被解釋變量,共130 個樣本。從2010 年開始我國豬肉價格經歷了3 次顯著的周期性波動,在大周期波動的同時出現了若干次小的周期性波動(圖1)。由于非洲豬瘟疫情的流行,部分地區生豬產量和能繁殖的母豬產能出現顯著下降,造成生豬出欄存在季節性低位,導致豬肉價格由2018 年底的23.24 元/kg 持續飛速增長,到2020 年2 月增至58.89 元/kg,隨后保持高位震蕩。

圖1 國內豬肉價格趨勢Fig.1 Domestic pork price trend
1.2.1 多維關聯規則 關聯規則的支持度和置信度是衡量現有規則重要程度和可靠程度的兩個指標。支持度(X)是指事務集D中包含項目集數X的數量,置信度是指關聯規則在D中同時包含項集X和Y的事務數與包含項集X的事務數之比。如果關聯規則同時滿足最小支持度(Minsup)和最小置信度(MinConf)則稱為強關聯規則。為了避免偽關聯規則的影響,將提升度(Lift)的概念引入到關聯規則。計算公式如下:

提升度越大表明項集X對項集Y的影響程度越大。
1.2.2 支持向量回歸機 支持向量機(Support vector machine,SVM)是由前蘇聯學者Vapnik 基于結構化風險最小化原則而提出的一種機器學習模型,通過引入該方法,解決高維數據在低維空間線性不可分的問題。支持向量回歸機(Support vector regression,SVR)是支持向量機在回歸問題的應用,對于時間序列的預測表現出較好的學習能力[18],其具體原理如下:SVR 模型將處于低維度的輸入數據x,通過映射函數φ(x),轉化成高維特征空間,輸出值為f(x):

最優系數ω和偏置b的求解如下:

式中,yi為真實值,C為用于控制模型的經驗風險和校準項的權重,ε為決定損失函數的寬度,松弛變量分別代表數據到其ε邊界的垂直距離。引入Lagrange 乘子λi和λi*,將上述問題轉化為對偶問題:

鑒于徑向基函數(Radial basis function,RBF)在眾多時間序列研究中的有效性,本研究選擇其作為支持向量機的核函數,采用R 軟件的“e1071”包以實現SVR 模型,為確保結果的穩健性,取程序運行20 次的平均值作為SVR 的預測結果。
借鑒已有研究豬肉價格波動的文獻,本研究從生豬養殖加工產業鏈、替代品市場、宏觀經濟環境變化、突發性事件和國際市場5 個方面選取16 個經濟變量作為分析對象,構建豬肉價格多維數據模型。
2.1.1 生豬養殖加工產業鏈 生豬養殖加工產業鏈涉及種豬繁育、飼料加工、屠宰加工等環節,其中,玉米、豆粕、仔豬構成生豬養殖的主要成本[19],豬肉產量、出欄肉豬量和年末存欄量決定豬肉的供給數量,生豬價格則通過屠宰加工環節直接影響終端市場的豬肉價格[3]。因此,選取豬肉產量、出欄肉豬量、年末存欄量、玉米價格、豆粕價格、仔豬價格、生豬價格作為生豬養殖加工產業鏈因素對豬肉價格波動進行分析。
2.1.2 替代品市場 豬肉價格對牛羊肉消費比例的彈性值顯著為正,因此豬肉與牛羊肉之間存在一定的替代性[20],當豬肉價格達到極大值時,牛肉和雞肉價格同時達到最大值,兩種替代品的價格與豬肉價格的波動具有一致性[21],因此選取牛肉價格、雞肉價格和羊肉價格作為替代品市場的影響因素。
2.1.3 宏觀經濟環境 貨幣供應量(M2)的增加推動豬肉價格的上漲[6],在我國消費價格指數(CPI)中,豬肉在食品行業里所占比例較大,某種程度上來說中國的CPI 就是豬肉價格指數[22],因此采用M2 和畜肉類CPI(MCPI)代表我國宏觀經濟環境因素。
2.1.4 突發性和隨機性事件 采用由斯坦福大學和芝加哥大學聯合發布的經濟政策不確定性指數(EPU)作為度量隨機性因素的指標,其中食品安全事件、禽流感等因素會通過影響市場的情緒、價格預期等引起農產品價格波動[23];采用生豬疫病寬度指數綜合量化生豬疫病的嚴重程度,寬度指數小于0.2 代表正常水平,大于0.25 則表示生豬疫病嚴重[9]。
2.1.5 國際市場環境 凍豬肉期貨、活豬期貨及瘦肉豬期貨自1961 年以來陸續在美國芝加哥交易所(CME)上市,目前已成為衡量全球豬肉價格市場的一項重要指標;生豬養殖規模的擴大依靠大量的能源聚集和使用,原油價格對農產品價格存在顯著的均值溢出效應[24],國際原油價格的波動會在一定程度上影響中國經濟從而影響農產品價格,因此采用CME 瘦豬肉價格和WTI 原油價格作為度量國際市場環境的變量。
涉及生豬養殖加工產業鏈、替代品市場方面的數據來源于中國畜牧業信息網(www.caaa.cn),宏觀經濟環境方面的數據來源于國家統計局(www.stats.gov.cn),EPU 指數來源于EPU 指數數據庫(www.policyuncertainty.com),生豬疫病寬度指數來源于布瑞克農業數據庫,CME 瘦豬肉期貨價格來源于Wind 數據庫,WTI 原油價格來源于美國能源信息署(www.eia.gov)。以上數據的時間跨度為2010 年1 月至2020 年10 月,共130 個樣本。
除了豬肉產量、出欄豬肉、年末存欄量為年度數據,其余數據均為月度數據。為了將數據變換為同一時間尺度,采用Eviews 軟件中的二次插值法(Quadratic)將低頻數據轉換為高頻數據,即將上述年度數據轉換為月度數據。為了將數據的波動性體現在挖掘的關聯規則中,根據農業部的農產品價格波動幅度定義,將涉及到農產品價格的數據用月度波動幅度指數A衡量其波動幅度,即:

式中,Pt為當期價格,Pt-1為上一期價格。
根據農業農村部對于農產品價格波動幅度的定義,將農產品的價格劃分為如下價格波動區間:

為了便于數據挖掘,將所有屬性的原始數據轉化為布爾類型的二進制數據。計算出所有農產品價格的波動幅度指數,當波動幅度指數落入上述波動區間,則將該波動區間的屬性記為“1”,其他波動指數未落入的區間屬性記為“0”。而對于豬肉產量、出欄豬肉、年末存欄量、M2、MCPI、EPU 指數、WTI 原油價格等數據,由于目前缺乏完善的理論依據去界定上述指標的波動區間,因此將當期數據與上一期數據進行對比,數據不變或變大的屬性記為“1”,數據變小的屬性記為“0”,以此構造0-1 矩陣作為Apriori 算法的輸入矩陣。對于生豬疫病寬度指數,大于0.25的寬度指數代表生豬疫病嚴重,因此將大于0.25的寬度指數標記為“1”,小于0.25 的寬度指數標記為“0”。
2.3.1 參數設定與規則挖掘 為探究不同類型關聯規則對豬肉價格波動的影響,本研究設置兩種挖掘參數。首先,設定最小支持度為0.5、最小置信度為0.6、最小提升度為1,對豬肉價格與生豬養殖加工產業鏈、替代品市場、宏觀經濟環境變化、突發性事件和國際市場環境5 方面16 種因素進行規則的生成和篩選,得到6 條高頻、高相關的規則,按照置信度進行降序排列,具體的關聯規則及相關指標見表1。由表1 可知,在挖掘到6 種高頻高相關規則中,生豬疫病的寬度指數超過0.25(即表示生豬疫病嚴重)時,豬肉價格上漲的概率為100%,且對豬肉價格波動的影響程度為1.84,為6 種因素中影響程度最高者。其次,當生豬價格穩定波動時,豬肉價格穩定波動的概率為93%,影響程度為1.35;而當豬肉的替代品有牛肉和雞肉這兩種肉類的市場價格穩定波動時,豬肉價格穩定波動的概率為71%,對豬肉價格的影響程度均為1.03。

表1 高頻高相關規則Table 1 High frequency and high correlation rules
為了分析出現不太頻繁但相關性較高的關聯規則,降低最小支持度為0.3,置信度和提升度的限值不變,得到6 條低頻、高相關的規則,具體的規則和指標見表2。由表2 可知,雖然仔豬價格穩定波動致使豬肉價格穩定波動出現的頻次并不高,但兩者具有較強的關聯程度(82%),仔豬價格穩定波動對豬肉價格穩定波動的影響程度為1.18。在表2 挖掘到的6 條低頻高相關規則中,豬肉產量和出欄肉豬量對豬肉價格上漲的影響程度最大、為1.67。
為了分析出現不太頻繁但相關性較高的關聯規則,降低最小支持度為0.3,置信度和提升度的限值不變,得到6 條低頻、高相關的規則,具體的規則和指標見表2。由表2 可知,雖然仔豬價格穩定波動致使豬肉價格穩定波動出現的頻次并不高,但兩者具有較強的關聯程度(82%),仔豬價格穩定波動對豬肉價格穩定波動的影響程度為1.18。在表2 挖掘到的6 條低頻高相關規則中,豬肉產量和出欄肉豬量對豬肉價格上漲的影響程度最大,為1.67。

表2 低頻、高相關規則Table 2 Low frequency and high related rules
2.3.2 規則解讀(1)生豬養殖加工產業鏈對豬肉價格波動的影響。規則2、6、7 表示生豬養殖的成本屬性對豬肉價格波動的影響,當生豬價格穩定波動時,豬肉價格穩定波動的概率為93%;當仔豬價格穩定波動時,豬肉價格穩定波動的概率82%;當玉米價格穩定波動時,豬肉價格穩定波動的概率為67%。根據置信度和提升度的指標,相較于仔豬價格和玉米價格,生豬價格穩定波動對于豬肉價格穩定波動的影響程度更高。規則11、12 代表生豬養殖的供給屬性對豬肉價格的影響,當豬肉產量下降時,有67%的可能性引起豬肉價格上漲;當出欄豬肉數量下降時,有67%的可能性引起豬肉價格上漲。對比表2 所有規則的提升度,可知供給方面的因素對豬肉價格的影響程度最大,均為1.67。
(2)替代品市場對豬肉價格波動的影響。當牛肉價格穩定波動時,豬肉價格穩定波動的概率為71%;當雞肉價格穩定波動時,豬肉價格穩定波動的概率也為71%。兩者對于豬肉價格的影響程度同等重要,均為1.03。
(3)宏觀經濟環境對豬肉價格波動的影響。當MCPI 上漲時,即畜肉類消費品通貨膨脹時,豬肉價格上漲的概率為72%;當M2 上漲時,豬肉價格上漲的概率為70%。對比兩者的提升度,MCPI 與M2 均與豬肉價格呈正相關,且MCPI 對于豬肉價格的影響程度(1.04)大于M2 對于豬肉價格的影響程度(1.02)。
(4)突發性因素對豬肉價格波動的影響。當疫病寬度指數大于0.25 即生豬疫病嚴重時,豬肉價格上漲的概率為100%;當EPU 指數上漲時,有78%的可能性引起豬肉價格上漲。疫病寬度指數、EPU 指數的變化與豬肉價格波動呈正相關,且疫病寬度指數在所有因素中對豬肉價格波動的影響程度最高(1.84)。
(5)國際市場對豬肉價格波動的影響。當WTI 原油價格上漲時,有70%的可能性引起我國豬肉價格上漲,WTI 原油價格變化與我國豬肉價格波動呈正相關性。
為了探究不同多維關聯規則篩選得到的輸入變量對于豬肉價格預測性能的影響,分別將6 種高頻、高相關影響因素,6 種低頻、高相關影響因素,12 種運用多維關聯規則挖掘的強相關影響因素以及16 種未使用多維關聯規則挖掘的數據作為SVR 模型的輸入變量,構建4 種對比實驗方案:
方案1:預測模型的輸入變量為6 種高頻高相關影響因素,即生豬疫病、生豬價格、牛肉價格、雞肉價格、M2 和玉米價格;
方案2:預測模型的輸入變量為6 種低頻高相關影響因素,即仔豬價格、EPU 指數、MCPI、WTI 原油價格、豬肉產量、出欄肉豬量;
方案3:預測模型的輸入變量為上述12 種高相關影響因素,即方案1 和方案2 的總和;
方案4:未使用多維關聯規則進行變量篩選,預測模型的輸入變量為原始的16 種豬肉價格波動影響因素,即生豬疫病、仔豬價格、生豬價格、EPU 指數、牛肉價格、MCPI、雞肉價格、WTI 原油價格、M2、豬肉產量、玉米價格、出欄肉豬量、豆粕價格、年末存欄量、羊肉價格、CME 瘦豬肉期貨價格。
采用80 ∶20 的方式劃分訓練集和測試集,其中前80%的數據作為模型的訓練樣本,后20%的數據作為驗證樣本。使用SVR 模型對4 種方案的輸入變量進行提前多步的預測建模,探討多維關聯規則對預測建模的有效性。具體實驗步驟如下:
步驟1:將4 種方案作為SVR 模型的輸入變量,對數據做歸一化處理;
步驟2:劃分訓練集和測試集,用訓練集數據訓練SVR 模型,通過網格尋優法篩選回歸模型的最佳參數cost 和gamma;
步驟3:預測驗證集的數據,將結果做反歸一化的處理,并與真實值做對比,計算每一種方案的RMSE 值和MAPE 值;
步驟4:構建提前1 步、3 步和6 步的預測步長,找出不同預測步長下的最佳預測方案。
在評價模型效果時,通常采用兩個指標作為評價模型的預測性能,分別是均方根誤差(Root mean Squared Error,簡稱RMSE)和平均相對誤差絕對值(Mean Absolute Percent Error,簡稱MAPE)。計算公式如下:

式中,yt為t時刻的真實值,為t時刻的預測值,n為預測值的個數。為衡量最優模型相較于基準模型的預測精度提升效果,設計改進率指標,計算公式如下:

根據3.2 的實驗步驟和流程,運用SVR 對豬肉價格進行提前多步預測的結果見表3 和表4。綜合表3 和表4 中不同實驗方案的預測結果,得到以下兩個發現。
3.4.1 基于多維關聯規則的變量篩選方案的有效性 方案1~方案3 均為使用變量篩選的預測建模結果,方案4 為沒有使用變量篩選方案的基準模型,直接選用原始16 個影響因素進行預測建模。由表3 可知,對于短、中期預測而言(即提前1步和3 步),方案1 和方案3 優于方案4,說明基于多維關聯規則進行變量篩選,可在一定程度上提高豬肉價格的預測精度;然而,方案2 的表現并未優于方案4,說明只考慮低頻高相關因素不足以全面把握豬肉價格波動的影響機理,導致預測效果欠佳。至于長期預測(即提前6 步),只有方案3 優于方案4,說明對于跨度較長的預測任務,需要考慮更全面的影響因素,方能取得理想的預測結果。
3.4.2 最優預測方案 由表3 可知,對于不同的預測步長,方案3 均表現出理想的預測精度,證明該方案的有效性及穩健性,因此將方案3 定義為本實驗的最優預測方案,該方案包含6 個高頻高相關以及6 個低頻高相關影響因素,可見,高相關影響因素是確保豬肉價格預測精度的關鍵因素。由表4 可知,進一步呈現的最優方案相較于基準方案的改進率,證實最優預測方案能顯著提升短、中期的預測精度。綜上,運用基于多維關聯規則的變量篩選策略,不僅可以挖掘出影響豬肉價格波動的關鍵因素,還能通過減少模型的解釋變量個數,減輕預測建模的數據收集工作量。

表3 SVR 模型預測的結果Table 3 Results of SVR model prediction

表4 多維關聯規則篩選變量的最優方案的改進率Table 4 Improvement rate of the optimal scheme for screening variables by multidimensional association rules
本研究運用多維關聯規則對豬肉價格波動的影響因素進行定量分析,基于生豬養殖加工產業鏈、替代品市場、宏觀經濟環境變化、突發性事件和國際市場環境等5 個分析維度,挖掘豬肉價格波動的高相關影響因素作為預測模型的輸入變量,得到以下結論:(1)從多維關聯規則的挖掘結果可知,與豬肉價格波動關聯程度最高的前3 位因素是生豬疫病、生豬價格、仔豬價格,置信度分別為1.00、0.93 和0.82;從高相關項集的提升度可知,對豬肉價格波動影響程度最大的前3 位因素是生豬疫病、豬肉產量和出欄豬肉量,提升度分別為1.84、1.67 和1.67。(2)將基于多維關聯規則挖掘得到的豬肉價格波動高相關影響因素作為預測模型的輸入變量,進行提前多步預測建模。結果表明,包含12 種影響因素即生豬疫病、生豬價格、牛肉價格、雞肉價格、M2、玉米價格、仔豬價格、EPU 指數、MCPI、WTI 原油價格、豬肉產量和出欄肉豬量的建模方案預測精度最高。(3)相較于不進行變量篩選的基準模型,最優模型在3 個步長中的平均預測精度改進率分別為29.11%(RMSE)和16.00%(MAPE)??梢?,基于多維關聯規則的變量篩選策略不僅有助于找出豬肉價格波動的關鍵影響因素,而且對于提高模型預測精度具有顯著效果。
4.2.1 完善豬肉價格波動預警機制 農業生產管理部門應立足于高相關影響因素對豬肉價格波動進行更有針對性的監管。對生產端(如:玉米、生豬、仔豬、豬肉產量、出欄肉豬量)、替代品(如:雞肉、牛肉價格)、宏觀經濟環境(如:M2、MCPI)、突發性事件(如:EPU 指數、生豬疫病寬度指數)、國際環境(如:WTI 原油價格、國際市場豬肉價格)等關鍵影響因素進行實時監測分析,構建豬肉價格波動指數與預警區間,針對不同級別的警情提前制定應對預案,確保生豬市場的健康平穩運行。
4.2.2 提高動物疫病風險防范意識 生豬疫病是與豬肉價格波動關聯程度和影響程度最高的決定性因素。因此,政府相關部門應提高動物疫病的風險防范意識。就外部而言,建立國家邊境動物防疫安全屏障,健全邊境疫病監測制度和突發疫病應急處置機制,完善入境豬肉產品的檢驗檢疫及風險評估辦法。就內部而言,提升動物疫病監測預警能力,建立從國家到地方的多級動物疫病預防控制中心,完善動物疫病應急預案,提高相關人員的知識技能及裝備水平,確保及時阻斷疫病傳播擴散鏈條。
4.2.3 加強農業信息化建設 促進農業經濟的發展,須堅持以信息技術引領農業的發展。中央一號文件提出,大力發展農業大數據,加快建立現代化養殖體系,保障生豬基礎產能,健全生豬產業平穩有序發展的長效機制。當前,散戶養殖方式在我國占比接近50%。由于信息獲取手段的局限性,散戶無法及時獲取全面的市場信息,一定程度上導致其養殖計劃制定的盲目性,進而增加其遭遇價格風險的可能性。因此,相關管理部門應盡快建立農業大數據平臺,完善農業信息基礎設施建設,促進生產、市場信息的透明公開,提高農戶的信息決策能力,保障市場的平穩運行。
4.2.4 構建全鏈條視角下的生豬價格調控機制 目前,我國的生豬價格調控預案主要以豬糧比作為預警指標。由于過于重視供給端的成本變動,相關調控政策的出臺在一定程度上導致供應的急劇上升或下降,加劇了豬肉價格波動的風險。為確保豬肉市場的健康平穩運行,建議構建涵蓋供給端和市場端的全鏈條風險評價體系,綜合生產成本變動以及市場價格波動研判市場風險,依據市場整體風險等級確定調控機制,有效保障豬肉市場多方參與主體的利益,規避其可能面臨的生產經營決策風險。