


[摘 要]文章以湖南省2010—2019年地方財政收入經濟指標數據為樣本數據,通過Lasso特征選擇影響財政收入的關鍵因素,再建立單個屬性的灰色預測模型,對已被Lasso特征篩選出的2020年各解釋變量的值進行預測,最后通過支持向量回歸預測模型得出2020年湖南省財政收入。
[關鍵詞] 財政收入;Lasso特征選擇;灰色預測模型;支持向量回歸預測
[DOI]10.13939/j.cnki.zgsc.2021.29.040
財政收入是政府為滿足支出需要,并依據相關的權利原則,通過國家財政集中的一定數量的貨幣或實物資產收入。財政收入直接決定可用財力,能充分發揮財政支持經濟建設的職能作用,還能保證基層政治穩定、社會安定以及改革發展的需要。因此,對于財政收入方面的研究極具意義,故本文以湖南省為例對影響該省財政收入的因素進行分析并進行相關預測。
從現有的文獻來看,大多采用傳統的統計方法,而本文先通過Lasso方法進行特征選擇,再基于灰色預測模型預測解釋變量的值,最后結合支持向量機回歸預測模型進行預測。上述分析與預測步驟均于Python軟件下進行代碼實現。
1 模型建立
1.1 Lasso變量選擇模型
Lasso回歸方法通過構建一個懲罰函數得到一個精煉的函數,以縮小特征集的思想,將特征的系數進行壓縮并使某些回歸系數變成0,用來進行模型的改進與選擇。Lasso參數估計定義如下[1]:
2.2 Lasso變量篩選
本文基于Python軟件編制的程序對影響湖南省財政收入的變量進行篩選,結果如表1所示。
2.3.2 構建支持向量機回歸預測組合模型
對上述影響湖南省財政收入的變量建立支持向量機預測模型,并結合所構建的灰色預測模型所得的影響因素值對財政收入進行預測,所得的結果經整理后如表3所示。
從運行結果可以得知,2020年湖南省財政收入的預測值為5285.784154億元。同時繪制2010—2019年財政收入真實值與預測值的線形圖,如圖1所示。
從圖1中可以看到模型擬合效果良好,財政收入的真實值與預測值十分貼近,誤差較小。
3 結論
利用Lasso回歸方法識別影響財政收入的重要影響因素分別為在崗職工工資總額、城鎮居民人均可支配收入、常住人口、全社會固定資產投資額、第三產業與第二產業產值比、居民消費水平。同時根據支持向量回歸預測各年財政收入的結果與真實值的誤差較小,可以認為基于Lasso變量篩選后,建立的灰色預測模型和支持向量回歸預測模型是有意義的,預測結果也是較為精準的。
參考文獻:
[1]李航.統計學習方法[M].2版.北京:清華大學出版社,2019.
[2]鄧華麗,張良均.綜合灰色及回歸模型的地方財政收入預測法[J].中國管理信息化,2016,19(5):145-148.
[3]徐子卿.貴州省財政收入影響因素分析及預測[J].農村經濟與科技,2019,30(6):158-159.
[作者簡介]秦權(1998—),男,湖南永州人,廣西師范大學數學與統計學院,在讀碩士研究生,研究方向:應用統計。