趙先枝, 陳軍林
(1. 內蒙古煤炭地質勘查(集團)一五三有限公司,內蒙古 呼和浩特 010010;2. 中國地質大學(北京) 地球科學與資源學院,北京 100083))
煤炭發熱量是評價煤質的關鍵指標,對于煤炭利用、煤炭價值評估等非常重要[1]。精確的煤炭發熱量數據需要通過實驗測試得到,但煤炭發熱量的實驗測定在當前技術條件下較繁瑣、耗時且昂貴[2]。在對煤炭發熱量精度要求不高的情況下,通常通過建立數學模型,利用測試相對廉價且容易獲取的指標來預測煤炭發熱量。在煤炭發熱量預測方面,前人提出了線性回歸[3-4]、BP神經網絡[5]、支持向量回歸[6-7]等方法。其中實際應用最廣泛的是線性回歸,該方法模型簡單、計算快速,但存在以下問題:對于非線性數據擬合能力欠佳,難以表達較為復雜的自變量和因變量關系;需要數據服從特定的分布假設;對異常值敏感。
分位數回歸是Roger Koenker和Gilbert Bassett于1978年提出的一種回歸分析方法[8],經過不斷發展形成了線性分位數回歸、神經網絡分位數回歸、分位數回歸森林等方法。分位數回歸具有如下優點:不需要對數據做任何的分布假定;具有對異常點不敏感的特征;模型比較穩健;能夠給出比傳統回歸分析更豐富的預測結果;可用來研究自變量與因變量之間的關系。目前關于分位數回歸在煤炭發熱量預測方面的應用研究較少。本文采用線性分位數回歸和分位數回歸森林2種分位數回歸分析方法對煤炭發熱量進行預測,分析各預測變量對結果變量的影響,并與傳統線性回歸方法進行對比,分析不同回歸分析方法在煤炭發熱量預測中的效果。……