摘要在商業銀行效率影響因素研究中引入基于高維投影思想的非參數方法——偏最小二乘方法,并在建模過程中彌補了已有研究未控制時間趨勢和宏觀經濟變量而導致模型不顯著和變量符號反常的不足.結果表明:針對本文少樣本、自變量存在嚴重共線性的情況,偏最小二乘法提取的3個成分解釋力達到0.984 173,并具有良好的預測性能.財務指標等內生變量對不同產權銀行的效率影響是有明顯差異的,而產權結構、宏觀經濟等外生變量的影響是無差異的.
關鍵詞偏最小二乘估計;多重共線性;商業銀行效率;影響因素;時間趨勢
1引言
目前,商業銀行效率的影響因素分析已成為商業銀行效率研究的重要方向之一.國內關于這方面的研究較多,回歸分析方法大多采用普通最小二乘參數估計法、面板數據的固定效應模型和Tobit模型回歸方法.鄭錄軍等采用25家商業銀行的橫截面數據使用最小二乘法對我國商業銀行效率的影響因素進行了分析,其在建模過程中進行了多次試驗最終確定了4個模型\[1\].張弛使用簡單的最小二乘回歸方法,選擇資本充足率和產權結構兩個因素對商業銀行效率的影響因素進行并分析認為資本充足率對銀行效率并無直接影響,而產權結構與銀行效率顯著相關\[2\].趙永樂、王均坦則在變量選取過程中進行了相關分析,將相關性較大的指標分離然后分別建立四個模型,最后使用最小二乘法進行回歸\[3\].刑芙偉利用商業銀行效率值具有截斷性,使用14家商業銀行2001~2007的面板數據,選擇采用Tobit模型進行回歸,R2系數在0.6~0.7之間\[4\].胡東利用Powell提出的對稱修剪最小二乘法分析效率值的影響因素以及影響程度.在潛變量模型中誤差項是對稱分布,由于刪失,使得因變量為不對稱分布,STLS重新修剪來恢復斷尾分布的對稱性,使最小二乘法將產生一致估計量\[5\].周四軍等認為影響商業銀行效率的包括宏觀、中觀和微觀因素,由于宏觀環境和行業因素對銀行效率的影響十分復雜且難以量化,因此,在給定的宏觀環境和行業條件下以2005年的樣本數據從微觀角度對中國商業銀行效率進行多元同歸分析\[6\].周四軍、安普帥等為消除原始變量之間的多重共線性, 運用主成分分析方法對原始變量進行變換, 得到盈利性因子和流動性及安全性因子作為解釋變量,并建立Panel Data固定效應模型對國內13 家主要商業銀行1999到2008年的效率影響因素進行實證分析\[7\].
已有研究在商業銀行效率的影響因素分析方面已經取得了許多成果和經驗,但還存在不足之處.1)變量選擇問題.首先,變量之間存在著多重共線性.盡管作者采用逐步回歸或者分開建模的方法來剔除相關性大的變量,還有通過主成分方法來提取信息,但這樣做既不利于保留有效信息而且也不能完全避免多重共線性,且這種方法較為繁瑣.其次,未納入控制變量.雖然從定性上分析了宏觀、行業等變量的影響,但在計量模型中未控制宏觀經濟變量和時間趨勢,導致模型結果不顯著以及變量符號反常.
2)樣本量問題.采用普通最小二乘法,由于樣本量太少,十幾家銀行的橫截面樣本數據,相對于其選定的7~9個自變量來說,容易受異常點干擾, 影響模型估計精度,多數模型的R2系數均在0.4~0.5之間也印證了這一點.將面板數據當作截面數據使用,強行進行Tobit回歸.而使用Tobit模型需要樣本量足夠大,經過計算機模擬,一般要多于50個樣本得到的結果才能在數量級上靠得住.
3)理論假設問題.普通最小二乘法、對稱修剪最小二乘法、Tobit方法和固定效應模型的假設條件過于苛刻.普通最小二乘法和對稱修剪最小二乘法需要滿足高斯假
設.Tobit方法在錯誤地假設似然函數的參數時,系數估計并不具有一致性,即使誤差項的密度函數設定正確,其異方差性也會同樣引起結果的不一致;同時DEA 是非參數方法,而Tobit模型是參數方法, 兩者在邏輯上也存在出入.面板固定效應模型的應用前提是各獨立研究的結果趨于一致,一致性檢驗無顯著性差異.但是隨著時間的推移,各個自變量對商業銀行效率的影響和方向必然會發生變化.在存在上述問題的情況下,分析結果與實際情況會發生重大偏差.鑒于此,本文嘗試采用偏最小二乘方法對商業銀行效率的影響因素問題進行分析.偏最小二乘回歸(Partial Least Square)是一種新型的多元統計數據分析方法,它較好的解決了上述問題.目前國內很少有使用這種方法對商業銀行效率的影響因素進行研究的文獻.
2數學原理及變量選擇
2.1數學原理
1983年由H Wood和C Albano等提出了偏最小二乘估計方法.假設有p個解釋變量k個樣本, 則自變量集為x , 因變量y ,利用偏最小二乘回歸, 提取因子t、u , 其中為t為x的線性組合.要求t盡可能多地反映x的信息, u盡可能多地反映y的信息.若是單一因變量, 則u為因變量y標準化后的變量,且t和u相關程度最大.再分別利用x對t和y對t做回歸,若回歸方程結果滿意, 則運算停止, 否則繼續提取主成分.而對于如何確定所提取的主成分個數, 在偏最小二乘回歸中使用殘差平方和Press來度量.Press是利用真實值與擬合值之間誤差的平方和來度量預測的精度, 當press值最小時, 停止主成分的提取, 此時所提取的主成分可以充分地反映總體的信息, 模型的擬合效果最好\[8\].此外,x中提取的t1,t2,…,tn和y中提取的u1,u2,…,un是彼此獨立且相互正交的.比如,t1和u1正交,t2和u2正交.這就保證了成分之間相互不干擾,解決了變量共線性的問題.
經濟數學第 30卷第1期
周四軍等:基于PLS估計的我國商業銀行效率影響因素研究
2.2數據來源及變量選擇
由于銀行業會計口徑在2005年發生較為重大的變動,考慮樣本的代表性和數據可得性.本文數據均來源于13家商業銀行2005~2011年的年報和2004~2011年的中國金融年鑒.變量選取考慮以下三個方面:第一,突出偏最小二乘法處理多重共線性問題的優勢.就上述影響因素而言,大多數變量之間
都存在著嚴重的多重貢獻性.第二,選擇與商業銀行效率密切相關的變量.第三,完善現有研究建模沒有控制時間趨勢和宏觀變量的不足,沒有控制宏觀變量和時間趨勢,將面板數據作截面數據進行回歸將會導致和已有研究一樣的錯誤.因此.本文選取4個財務指標,資產負債率、資產增長率、資產凈利率、非利息收入比,分別放映安全性、發展能力、盈利能力和資產配置情況;兩個規模指標,年末總資產和營業機構數;還有一個與商業銀行效率密切相關的產權結構指標.樣本啞變量和年度啞變量的乘積以及經濟增長率作為控制變量.
3實證分析
偏最小二乘模型不是選用全部的成分進行回歸, 而是采用截尾的方式選擇代表性成分,模型2中,M為控制變量的系數,代表一系列樣本啞變量與年份的乘積的系數,其主要作用是控制時間趨勢,對效率的貢獻沒有經濟含義,而且M值不唯一.為方便起見,未進行羅列.因此, 采用控制時間趨勢的模型2 的三個主成分進行PLS回歸建模.對原始數據進行標準化后建立商業銀行效率影響因素PLS回歸模型.
3.1模型1與模型2的比較
從模型1與模型2的比較(見表1)來看,在未考慮時間趨勢的情況下,模型1僅t1的交叉有效性值大于5%下的值0.097.且其解釋力也只達到0.568 753.而模型2 t1, t2, t3,的交叉有效性值均大于5%下的值0.097.而且提取的3個成分達到0.984173的精度.從變量符號來看,模型1與模型2中非國有和國有產權結構的影響方向完全相反.模型2中非國有產權對效率的影響為正,國有產權對效率的影響為負,與絕大多數研究保持了一致,實踐來看股份制改革一直是我國國有銀行改革的方向.同時模型2的解釋力大大高于模型1也使得這一結論更為可靠合理,因此認為模型2優于模型1.
3.2模型2的變量系數效應分析
從模型2的變量系數來看,資產負債率,資產增長率,資產凈利率,非利息收入比,非國有產權,年末總資產對效率值的影響為正,而國有產權,網點數量,經濟增長率對效率值的影響為負.資產負債率,資產增長率,資產凈利率,非利息收入比等都是反映財務指標的變量,這說明良好的財務指標水平對于銀行效率是正向的.而國有產權一直是困擾國有商業銀行提高效率的重要因素,網點數量過多對于效率起到了反作用,原因可能是網點需要投入大量的人力、物力,從而大大增加了管理、運營成本,而隨著科技的發展,物理網點的功能逐步被網上銀行、手機銀行等網上服務功能代替,從而物理網點的成本劣勢大大凸顯出來.經濟增長率對銀行效率的影響為負,原因可能是在經濟發展過熱時,銀行的風險管理意識不足,收入增加的幅度小于增加的風險損失幅度.而在經濟遇冷時,銀行會保守經營,注意控制經營成本和風險損失,同時國家出臺的刺激政策需要銀行提供大量的資金支持,所以對銀行而言,經濟增長并不意味著效率提升.
4偏最小二乘回歸輔助技術圖形分析
4.1各變量對效率值的貢獻度大小
VIP變量投影重要性指標表示自變量Xj在解釋因變量集合Y時的作用程度.由原理可知,自變量對因變量的解釋力是通過t成分來傳遞的.如果ti成分對因變量的解釋力強,并且自變量對ti成分起到了很大的作用,那么可以認為解釋變量對因變量的解釋貢獻度大.如果使用m 個成分t1, t2,…tm進行分析, 從圖1中可以直觀的看出,對商業銀行效率影響從大到小依次為網點數,產權結構,資產增長率,資產負債率,年末總資產,經濟增長率,非利息收入和資產凈利率.
4.3樣本的分布情況
T1/T2橢圓圖是在T1/T2平面圖基礎上繪制的, 每一個樣本點i在這個圖上的坐標是( t1(i), t2(i)),從而觀察樣本點在高維空間的分布特征和相似結構, 而在T1/T2 橢圓圖上可以發現樣本集合中的特異點.T1/T2表示出樣本的分布情況.由圖3來看,樣本的分布呈現左右分離的特點,且不存在特異點.從T1和T2代表的含義而言,T1主成分表示的是財務指標等內部因素,T2主成分表示的是制度、經濟增長等外生因素.橫坐標為正(即處于第一和第四象限)的是股份制商業銀行,橫坐標為負(即處于第二和第三象限)的是國有商業銀行.這說明財務指標對股份制商業銀行與國有商業銀行的效率的影響是有差異的.T2主成分代表的外生的因素對股份制商業銀行與國有商業銀行的效率的分離作用不明顯,說明外部因素是對整個銀行業起作用的.
4.4模型預測
為了考察回歸模型的預測能力, 將實際的效率值與模型擬合值相比較, 并繪制折線圖. 如圖4所示,虛線代表實際觀測值,實線代表模型擬合值.結果表明所構建的回歸模型擬合效果非常好,實際值與擬合值的形態基本一致,模型基于歷史數據具有較強的預測功能.
5結論與啟示
5.1在控制時間趨勢的情況下,PLS估計結果
精度高
首先,在國內銀行樣本數量有限,影響因素變量存在嚴重共線性時,PLS方法能有效地剔除了冗余信息的影響,信息提取效率較高,而且PLS成分對因變量的解釋力很高,提取的3個成分達到0.984 173的精度.提取的主成分也具有明顯的經濟含義,T1代表了財務因素對銀行效率的影響,T2代表了產權制度、經濟增長率的外部因素對銀行效率的影響,體現了模型的科學性.其次,彌補了已有研究在建立影響因素模型時未考慮時間因素和控制宏觀經濟變量導致的模型不顯著和變量系數符號反常的不足,選取年份與樣本啞變量的乘積和經濟增長率作為時間趨勢和宏觀控制變量,從而排除了年度和樣本自身的時間趨勢影響,同時避免了遺漏宏觀經濟變量,大大提升了模型的解釋力.
5.2模型符號和貢獻率基本符合基本理論,也
很好的解釋了現實問題
VIP圖表明商業銀行效率影響因素從大到小依次為網點數,產權結構,資產增長率,資產負債率,年末總資產,經濟增長率,非利息收入和資產凈利率;模型2的系數符號表明,資產負債率,資產增長率,資產凈利率,非利息收入比等反映財務的指標變量對于銀行效率是正向的.而國有產權、網點數量和經濟增長率對銀行效率的影響為負;國有產權對效率的影響為負,因此國有商業銀行要加快建立現代商業銀行治理結構.機構數量的影響效應為負且幅度很大.而目前國內商業銀行存在著盲目擴張的傾向,對效率的提高沒有起到應有的作用,反而是增加了企業的成本負擔.經濟增長率對銀行效率的影響為負.在經濟發展過熱時,銀行要加強風險管理意識,注意控制經營成本和風險損失;
輔助分析技術包括樣本點的分布分析、預測分析等對于深入挖掘數據信息,簡化數據結構,提高模型估計精度及改進提供了支持.T1/U1圖則表明了模型呈對角線性擬合,擬合度很高;樣本點的分布分析(T1/T2圖)表明財務結構對國有銀行和股份制商業銀行的效率影響是有明顯差異的,而制度性、宏觀經濟等外部因素的影響是無差異的;預測分析中實際值與擬合值的形態幾乎一致說明了模型具有很高的預測能力.
參考文獻
[1]鄭錄軍,曹廷求.我國商業銀行效率及其影響因素的實證分析\[J\].金融研究:2005(1):91-101
\[2\]張弛.國際資本引入對商業銀行效率的影響的實證研究\[J\].技術經濟:2007,26(5):67-72
\[3\]趙永樂,王均坦.商業銀行效率、影響因素及其能力模型的解釋結果\[J\].金融研究:2008(3):58-69
\[4\]刑芙偉.我國商業銀行經營效率及其影響因素的實證研究\[J\].武漢金融:2009(10):51-54
\[5\]胡東,蒲勇健,中國商業銀行效率實證研究與影響因素分析\[J\].工業工程.2010,13(5):53-57
\[6\]周四軍,謝艷兵.中國商業銀行效率的影響因素分析\[J\].統計與決策:2008(1):134-136
\[7\]周四軍,安普帥,陳芳蓉,等.基于Panel Data模型的我國商業銀行效率研究\[J\].財經理論與實踐:2011,32(4):15-19
\[8\]孫楊,許承明和夏銳.研發資金投入渠道的差異對科技創新的影響分析——基于偏最小二乘法的實證研究\[J\].金融研究:2009(9):165-174