王繼龍
(華北電力大學經濟與管理學院,北京 102206)
作為財政、預算部門判斷財政支出產出和效果的重要工作內容,財政支出項目績效評價可以有效地提高財政資金的使用效益。公共投資項目績效評價起源于1993 年美國頒布的《政府績效與結果法案》(The Government Performance and Results Act of 1993),該法標志著美國財政支出項目績效評價工作正式開始,并逐步在西方發達世界得到廣泛應用。2011 年,我國財政部印發《財政支出績效評價管理暫行辦法》 (財預〔2011〕285號),標志著我國財政支出項目績效評價工作步入全面發展階段。
目前,我國主要行業、主要省區市基本完成財政支出項目績效評價指標體系的建立[1-4],并在近幾年的財政支出項目績效評價工作中逐步展開試點、推廣應用工作。在實際財政支出項目績效評價工作中,由于主管部門需要評價的項目較多,在評價時需要投入專家成本較高、耗費時間較長,尚未做到經濟有效地對全部項目的績效評價,而是采用對一部分項目進行評價、以該部分項目評價結果代表所有項目評價結果,這樣就導致了評價的不全面性、不公平性,并為人為規避某些財政支出項目績效評價創造了可能。
本文提出一種基于優化相關向量機(Relevance Vector Machine,RVM)[5]的財政支出項目績效評價方法。RVM 是在支持向量機 (Support Vector Machine,SVM)基礎上發展起來的一種新的機器學習方法,在負荷和功率預測[6-7]、缺陷檢測[8-9]、圖像識別[10-11]等領域展開了應用研究并取得了一定成果。本文在現有評價方法基礎上,以完成專家評價的項目作為RVM 訓練樣本,充分利用RVM 預測精度高、泛化能力強、較小樣本空間即可滿足訓練要求等優點,在對樣本項目應用RVM 進行訓練、學習之后對全部項目進行評價,避免了現有項目績效評價方法專家成本高、評價時間長等不足,實現了全部項目的無偏差績效評價,評價過程更為客觀和公正,尤其適用于財政支出項目績效評價主管部門需要對大批項目進行評價的情況。
RVM 主要理論基礎包括貝葉斯理論、馬爾科夫性質、自相關判斷理論 (Automatic Relevance Determinatiaon,ARD)和最大似然等。與人工神經網絡 (Artificial Neural Networks,ANN)等智能預測方法相比,RVM 方法具有更強的非線性映射能力,對樣本數據的依賴性相對較小,具有更強的泛化能力。與SVM 相比,RVM 具有更好的稀疏性,極大地減少了核函數的計算量,核函數可以任意使用且不用滿足Mercer 條件。
RVM 假設權值參數ω 是受超參數α 控制的高斯(Gaussian)先驗概率分布,在貝葉斯框架下通過機器學習,并利用ARD 對不相關的點進行刪減以獲得稀疏化模型。非零權值的基函數所對應的樣本向量稱為“相關向量”,體現了數據中最核心的特征。
RVM 回歸預測模型可以描述為[5]

式中,φ(x)=(φ1(x),φ2(x),…,φN(x))T(N 為樣本數)為基函數;μ 為均值向量;y*為預測均值。
由式(1)可知,新樣本x*的預測值均值為y(x*,μ)。若給定新的輸入值x,則其相應的輸出概率分布服從Gaussian 分布,相應的預測值為y*。
GA 等參數優化方法常用來根據具體問題優化具體參數,以確定預測模型參數最優[12-13]。GA 是一種基于自然選擇和遺傳規律的啟發式、并行的全局搜索最優方法,其主要源自于自然界的選擇和進化理論,常用來解決目標函數的多參數優化問題。GA 通常包含參數初始化、選擇、交叉和變異等步驟。應用GA 解決現實問題時,最重要的是選擇好適應度函數。
主成分分析 (Principal Component Analysis,PCA)常用來對高維數據進行降維處理,以有效降低數據維度,提取數據的主成分,從而簡化計算過程,提高計算速度。PCA 的基本思想是將具有一定相關性的原始數據,通過線性組合變換成一組新的、維度更低的幾個相互獨立或互相無關的變量來代替原始數據。PCA 主要通過對原始數據的協方差矩陣進行特征分解,求出主成分以及對應權值。
基于遺傳優化相關向量機的財政支出項目績效評價模型(以下簡稱“GA_RVM 模型”)保留現有財政支出項目績效評價方法中的專家評價部分,應用該部分項目的專家評價結果作為RVM 訓練樣本,通過RVM 訓練、優化,學習后輸出最佳RVM 預測模型,應用該RVM 最佳預測模型對其他樣本 (測試項目)進行測試,即可得到全部項目的綜合評價結果。同時考慮到專家評價樣本項目集較小,對評價指標體系進行主成分分析降維處理、在RVM 訓練和優化時采用K-折 (K-fold)交叉驗證,以提高訓練的有效性和模型的擬合性。GA_RVM 模型建模流程見圖1。

圖1 GA_RVM 模型建模流程
績效評價工作小組接受評價委托任務后,首先需要根據評價任務和評價項目特點,確定需要采用的績效評價指標體系。在評價指標體系中,三級指標是細化的、可執行的具體指標,績效評價工作小組根據確定的評價指標體系及三級指標開展具體的評價工作。績效評價指標體系的三級指標見表1。

表1 評價指標體系三級指標
績效評價工作小組根據三級指標及相應的評分標準對各項目基礎數據、現場資料等進行收集和審核,并對其進行打分,組成各項目最原始的基礎數據信息。
在財政支出項目績效評價的三級指標體系中,評價指標通常包括極大型指標、極小型指標、中間型指標和區間型指標。GA_RVM 模型將上述指標統一轉化為極大型指標。
在進行財政支出項目績效評價過程中,各指標由于各自量綱和量級的不同而存在著不可公度性,為綜合評價的比較帶來不便。因此,為了消除各指標量量綱不同及其數值數量級間的差別所帶來的影響,需要對指標做無量綱化處理。指標的無量綱化,也稱指標的標準化,通過數學變換的方式來消除原始指標量綱的影響。
常用的線性化處理方法有標準化處理法、線性比例處理法以及歸一化處理法。在實際研究應用中,根據不同的研究目標選用不同的方法。GA_RVM 模型采用線性比例法進行指標的無量綱化處理,數學表達式為


評價指標的無量綱化處理通過數學變換來消除不同指標之間由于量綱的不同帶來的不利影響,以更真實地反映實際情況,排除由于不同指標、不同量綱,以及不同數值數量級之間的差異性帶來的不利影響,避免不合理現象,提高財政支出項目績效評價的可行性和合理性。
績效評價專家小組針對樣本項目,根據績效評價工作小組提供的樣本項目基礎數據,現場資料等,以及根據專家評審會上項目單位的現場答辯情況,各專家對項目的綜合了解情況,并對樣本項目績效評價情況進行綜合打分,得到每個樣本項目的評價得分。
樣本項目的績效評價工作小組評價打分結果、專家評價得分結果一一對應即組成RVM 的訓練樣本空間??冃гu價專家小組評價得分結果與績效評價工作小組評價打分結果函數關系式如下

式中,S = [S1,S2,…,SN] 表示各項目績效評價專家小組的評價得分;I= [I1,I2,…,IN]表示每一個項目細化評價指標的績效評價工作小組評價打分;e = [e1,e2,…,eN]表示各項目訓練、測試過程中的誤差;N 為項目數;n 為細化的評價指標數。
其他項目的績效評價工作小組評價打分結果即組成RVM 測試樣本空間的輸入部分,其輸出需要應用學習后的RVM 模型進行測試后得出。樣本空間劃分及指標得分、綜合評價得分見表2。
考慮到完成專家評價的樣本項目一般來說容量較小,且三級評價指標一般來說在十幾個左右,為有效提高模型學習和泛化能力,應用PCA對績效評價工作小組評價打分結果進行降維處理。

?
RVM 對訓練樣本空間進行學習,以績效評價工作小組評價打分結果作為模型輸入、績效評價專家小組評價得分作為輸出進行模型的學習??紤]到樣本空間較少,GA_RVM 模型應用K-fold交叉驗證。經過RVM 訓練,輸出最佳RVM 預測模型。
2.5.1 RVM 核函數的選擇
RVM 核函數的選擇由于不受Mercer 條件的約束,所以理論上可以使用任何核函數。在理論研究和實際應用中,經常選用徑向基 (Radial Basis Function,RBF)核函數、線性核函數和多項式核函數等。RBF 擬合性強,具有較強的學習能力,適用于高、低維以及大、小樣本等多種情況。在理論研究和實際應用中,RBF 常被選為RVM 的核函數,其數學表達式如下

式中,x 為輸入向量;x1為訓練集中第i 維輸入向量;σ2為核函數的寬度。
2.5.2 RBF 核參數的GA 優化
RBF 核參數的σ2值對預測結果有較大的影響,本文應用GA 算法獲取最佳預測模型中RBF核參數σ2的最優值。
GA_ RVM 模型選用絕對平均百分比誤差(Mean Absolute Percentage Error,MAPE)作為評價標準,記為IMAPE,其計算公式如下

RVM 根據訓練樣本空間K-fold 交叉驗證劃分的驗證集IMAPE進行GA 優化。利用優化得到的最佳RVM 模型對測試樣本進行測試。將測試樣本的績效評價工作小組打分結果輸入最佳RVM模型,即可得到測試樣本的測試得分,從而完成其他項目的評價,輸出測試得分。
RVM 通過對訓練樣本空間,即樣本項目的學習,識別出相應變化規律,并通過K-fold 交叉驗證避免了樣本項目較少的不足,保證了預測模型的最佳,確保了各項目測試得分的準確性。
財政支出項目績效評價績效級別分為四級,項目評價合計得分90 分(含)以上的為優秀,75 (含) ~90 分的為良好,60 (含) ~75 分的為一般,60 分以下的為較差。這樣,就可以根據各項目績效評價得分落入的評價區間,判斷財政資金投入的效益和效果。
本文以某年度某部門主管的30 個項目為例進行財政支出項目績效評價分析。其評價指標體系見表3。

表3 財政支出項目績效三級評價指標體系
PCA 各成分累計貢獻率閥值取為0.98。
GA 種群規模100,終止代數20,交叉率0.8,變異率0.05,適應度函數為IMAPE。
為便于進行RVM 測試項目測試得分的對比,組織7 位專家(技術、經濟專家各2 人,業務專家3 人)對全部項目進行評價。同時,選取15個項目作為樣本項目,進行RVM 訓練、優化,輸出最佳RVM 預測模型,應用最佳RVM 預測模型對其他15 個項目進行了測試。
RVM 訓 練IMAPE為0.66%,測 試IMAPE為3.02%,其訓練結果、測試結果見圖2。由圖2可知,GA_RVM 模型訓練、測試結果良好,專家評價得分和 RVM 測試得分基本吻合,GA_RVM模型以較少的訓練樣本 (15 個項目)實現了對全部項目評價規律的識別,測試準確度良好。但可以看出,測試項目測試得分和專家評價得分有一定出入,導致RVM 測試績效級別和專家評價績效級別存在一定出入,并且存在個別項目的績效級別不一致(如:績效級別邊界點的測試項目2),但總體上應用GA_RVM 模型展開財政支出項目績效評價具有較高的準確性。

圖2 GA_RVM 模型訓練、測試結果圖
本文提出一種基于優化相關向量機的財政支出項目績效評價方法,與現有財政支出項目績效評價方法相比:
(1)GA_RVM 模型在幾乎不增加專家評價成本的基礎上實現所有項目的績效評價,且評價準確性與專家評價結果基本吻合,可以減少大量人力、財力,產生較為顯著的經濟效益,并提高評價效率。
(2)將現有評價方法中的專家資源集中投放在樣本項目的評價中,可以提高評價的準確性、公平性和客觀性。
(3)GA_RVM 模型特別適用于同類項目較多時的財政支出項目績效評價。
[1] 胡景男. 北京地區高等教育財政支出績效評價研究[D].北京:北京化工大學,2011.
[2] 鄭海寧. 成本-效益分析法在農業財政支出績效評價中的應用研究[D]. 保定:河北農業大學,2013.
[3] 梁宏亮,黃欣涔. 基于AHP 模型的災害救援重建財政支出績效評價研究[J] . 當代教育理論與實踐,2012 (8):171-174.
[4] 周普. 水利財政支出績效評價分析[J]. 中國水利水電科學研究院學報,2012,10 (1):73-76,80.
[5] Tipping M E. Sparse Bayesian learning and the relevance vector machine [J] . The Journal of Machine Learning Research,2001 (1):211-244.
[6] 段青,趙建國,馬艷. 優化組合核函數相關向量機電力負荷預測模型[J]. 電機與控制學報,2010,14 (6):33-38.
[7] BAO Yan,WANG Hui,WANG Beining. Short-term wind power prediction using differential EMD and relevance vector machine[J]. Neural Computing and Applications,2014,25 (2):283-289.
[8] ZHU Fengyu,WANG Qi,SHEN Zhengguang. APSO-RVM for fault detection of liquid rocket engines test-bed [J]. Information Technology Journal,2012,11 (10):1496-1501.
[9] Tran V T,Yang B S,Gu F,et al. Thermal image enhancement using bi-dimensional empirical mode decomposition in combination with relevance vector machine for rotating machinery fault diagnosis [J]. Mechanical Systems and Signal Processing,2013,38 (2):601-614.
[10] 趙春暉,齊濱,張燚. 基于改進型相關向量機的高光譜圖像分類[J]. 光學學報,2012,32 (8):264-269.
[11] 張昱,謝小鵬. 基于遺傳相關向量機的圖像分類技術[J]. 計算機仿真,2011,28 (5):283-286.
[12] Barszcz T,Bielecka M,Bielecki A,et al.Wind speed modelling using Weierstrass function fitted by a genetic algorithm [J].Journal of Wind Engineering and Industrial Aerodynamics,2012,109 (6):68-78.
[13] Liu Da,Niu Dongxiao,Wang Hui,et al. Short-term wind speed forecasting using wavelet transform and support vector machines optimized by genetic algorithm [J] . Renewable Energy,2014,62 (2):592-597.