謝振中
(邵陽學院理學與信息科學系,湖南邵陽 422000)
單指數模型是著名經濟學家威廉.夏普于1963年提出的投資組合模型[1],有關該投資組合模型的傳統的統計研究和應用取得了很多研究成果,許多國內學者將國外已有的研究成果應用于國內市場進行實證分析,力求對最優資產組合的選擇起到指導作用[2][3]。作為投資組合理論中經典的投資組合模型,它是以證券收益率歷史數據為基礎來度量它們的期望收益和風險的。在現實中,歷史收益率數據中往往存在著一些因重大利好或重大利空消息導致的超高或超低收益率,所以當我們用證券的收益率歷史數據來估計它們的期望收益和風險時,以此為基礎構建的投資組合在長期中就會偏離其實際的投資價值,從而影響到投資組合的決策。具體來說,單指數投資組合模型在進行回歸分析時,經典普通的最小二乘法通過極小化殘差平方和求得各個回歸系數對殘差的大小非常敏感,而離群值的存在將直接導致回歸殘差的異常,進而會影響到回歸系數的估計結果,并最終影響投資組合的選擇。為了得到單指數模型中長期穩定的關系結構,本文將Huber的穩健回歸方法[4]應用到該投資組合模型,作為對傳統統計方法的一種補充,并結合我國證券市場的特點,對A股市場進行了實證分析,降低了收益率歷史數據中離群值等非正常因素對投資組合決策的影響,得到了證券投資組合的有效前沿。
考察一個含有n種資產的投資組合

將它的收益率記為Rp,第i種資產的收益率記為Ri,xi表示投資第i種資產所占總投資的比例,收益率Ri是一個隨機變量,它的期望收益率記作ui,σij表示資產i與資產j收益率的協方差,那么有

相應地投資組合P的預期收益率up和方差σ2p就分別表示為

其中u為期望收益率向量,X為權重向量,∑為各資產收益率的協方差矩陣。
威廉.夏普認為,當市場股價指數上升時,市場中大量的股票價格隨之走高;相反當市場指數下滑時,大量股票價格也趨于下跌。雖然某些股票較其它股票上升或下跌的幅度要大些,但總地來說都呈現同一趨勢的變動。基于這一理論假設,任意證券的收益率與該證券所在市場的某種具有代表性的指數呈線性關系,即

這就是夏普單指數模型,其中Rm表示證券市場指數收益率,為一隨機變量,αi表示證券收益率中獨立于證券市場指數的部分,βi表示反映Rm的變化對Ri的影響,ei表示誤差項,均值為零,即E(ei)=0分別記市場指數收益率Rm和誤差項ei的標 準差σm,σei,則由基本假設有cov(ei,ej)=0,說明股票同時系統變動的主要原因是隨市場共同變動,不受市場之外的其它原因影響而協同變動,這是單指數模型的核心假設。另外我們還能得到cov(ei,Rm)=0,這說明殘差是證券實際收益率與預期收益率的差額,是獨立于市場指數的隨機變量,與整個市場的運行狀況無關。根據這些假設條件可推導出單指數模型下證券的期望收益、方差和協方差。證券的期望收益為E(Ri)=E(αi)+βiE(Rm),方差為協方差為將證券的期望收益、方差和協方差代入(1)
式,得到投資組合的期望收益和方差:

這樣,單指數模型(2)的投資組合問題可以通過下述規劃模型(3)求解:

其中X為權重向量,r為投資組合P的預期收益率。并且有

規劃模型(3)的經濟意義是在市場存在賣空限制條件下,投資者通過一次性滿倉操作,使得所構建的投資組合確保收益達到或超過投資者的預期時,所面臨的風險最小。如果一個投資組合能在保證一定收益下追求風險的最小化,那么該投資組合被認為是有效的,一個理性的投資者會在投資組合的有效前沿上構建投資組合。
傳統的統計方法對所研究問題的數據服從正態分布的假定有較強的依賴性,當真正的數據并不是或并不完全是服從正態分布時,如果還按照傳統的統計方法來描述我們所研究的問題,就必定會產生偏差,甚至有時這種偏差非常大。研究者對很多數據分布形態的研究表明,正態分布只是一種理論上的分布,實際數據的分布形式偏離正態分布的假定是經常和普遍的,而這種偏離可能會對傳統的統計方法的穩健性產生致命的影響,甚至會得出錯誤的結論,減輕或是避免這種情況的發生就要用到穩健的統計方法。
在建立單指數模型時,如果誤差項不服從正態分布,最小二乘法估計的結果就會嚴重脫離事實,估計的精度也很差,而當樣本數據含有離群值數據時,OLS估計(即普通最小二乘法估計)出的殘差就不會是正態分布,而往往是偏尾的,其修補的措施并不應該是草率地剔除掉,因為這些離群值數據并不是任何執行錯誤所致,而是固有的數據變異性的結果,簡單地剔除它們,會導致重要的隱藏信息的丟失。當然在回歸分析中也不應該與正常數據一樣對待,它們出現的概率或頻率畢竟很小,合理的做法是采用穩健回歸,以消除OLS估計對異常數據的易受影響性,去穩健估計回歸模型中的參數。
最常見的穩健回歸方法是由Huber在1964年提出的M估計,對于線性模型:

對應的樣本模型為:

當ρ(ei)=e2i時,則M估計就是OLS估計,即M估計可以看成是OLS估計的擴展。
記ψ=ρ′為函數ρ(t)的導數,則目標函數對參數β求偏導數,并令偏導數等于0,就會得到關于參數的k個方程:

定義權重函數w(e)=ψ(e)/e,記wi=w(ei),這時上述方程可以寫為:

(1)選擇初始估計值β(0),例如將LS估計的結果作為初始值;
(2)按此初始值進行迭代,在迭代的第t步,都計算一下上次迭代的殘差和相應的權重
(4)重復第2步和第3步,直到估計的參數趨于一致,迭代結束。
選擇適當的目標函數ρ和權重函數w(e),讓導致殘差異常的離群值點的權重變小,殘差小的樣本數據權重增大,從而減少離群值點對回歸分析的影響,實現穩健回歸的目的。
穩健回歸主要有Huber估計和Bisquare估計兩種方法,本文選擇Huber估計方法進行實證分析,其目標函數和權重函數如表1:

表1
在Huber估計中,k稱為閥值,k值越小,消弱離群值的影響范圍越廣,離群值的權重越小,這種穩健估計量都對服從正態分布的誤差影響小,對不服從正態分布的誤差影響大。當k值確定以后,估計的殘差越大,它的權重就越小,適當的選擇k值,就能保證對離群值影響的處理,例如,在Huber估計中k=1.345。通過比較可以看出,最小二乘法對所有樣本的權重都是1;Huber估計對殘差接近0的樣本權重是1,殘差絕對值大于k值的樣本,離k值越遠,權重越小。它們的權重函數圖像如圖1所示:

圖1 權重函數圖像的比較
單指數模型在求解過程中需要進行回歸分析,而經典普通的最小二乘法回歸時通過極小化殘差平方和求得各個回歸系數,而這個過程本身就使得回歸系數的大小對殘差的大小非常敏感,而離群值的存在將直接導致回歸殘差的異常,進而會影響到回歸系數的估計結果,并最終影響投資組合的選擇。因此必須將穩健統計的思想和方法融入到該投資組合模型中,利用穩健回歸的方法進行穩健回歸分析[5],根據歷史收益率數據來估計模型中參數αi、βi和σei的值,并在此基礎上求解投資組合規劃模型。
3.2.1 樣本股票的選取
在選取樣本股票時,為了使樣本股票具有代表性,盡量從不同行業和不同地區進行選取。相對于大盤股而言,小盤股更容易受政策消息面等因素的影響,從而使股價在短期內呈現大起大落的態勢,具體表現為收益率序列中存在一些異常數據。從長期來看,在一定程度上會對投資者投資組合的選擇產生誤導。基于以上考慮,從滬市中小盤板塊中選取10只股票作為投資組合的研究對象,詳見表2??紤]到配股、送紅股等因素對股票價格的影響,我們利用大智慧軟件的自動復權功能,下載這10只股票復權后的周收盤價,計算出它們的周收益率,得到十只股票的歷史收益率序列(表略)。

表2 樣本股票
3.2.2 樣本區間的選取
樣本區間選擇2010年1月1日年至2011年12月31日,之所以把樣本區間定義兩年,主要考慮到期間人民幣存款利率、存款準備金等進行了多次調整、通貨膨脹以及國際局勢如美債危機、歐債危機等因素的影響,使得歷史收益率數據中存在一些離群值,利用這期間的歷史數據來估計參數并構建投資組合模型對現實操作具有一定的指導意義。
基于以上穩健回歸方法,根據歷史收益率數據,估計出單指數模型中的參數,進而求解其投資組合模型,得到它的有效前沿,對比分析OLS、Huber兩種不同估計方法對最終結果的影響。首先以樣本期間中上證綜指周收益率為解釋變量,依次以10只樣本股票的周收益率為被解釋變量,對單指數模型中參數αi、βi分別通過OLS估計方法和Huber穩健估計方法進行估計,并估計出相應的誤差項標準差σei,本步驟必須使用迭代法對方法求解,其計算過程通過迭代軟件V1.0實現,計算結果如表3所示:
從表3可以看出,Huber估計方法得出的σei都要明顯小于OLS方法估計得出的σei,因而可以認為穩健回歸方法的擬合效果要明顯好于OLS方法。這是由于穩健回歸方法在估計過程中對數據中離群值賦予較小的權重,從而減少了離群值對回歸結果的影響。

表5 OLS方法得到的協方差矩陣∑
下面根據估計出來的參數αi、βi和σei的值以及通過上證綜指收益率數據計算出E(Rm)=0.005243和σ2m=0.002325來構建投資組合模型中的期望收益率向量u和各資產收益率的協方差矩陣∑,相應結果見表4—表6:

表6 Huber方法得到的協方差矩陣∑
將上述計算結果帶入到單指數投資組合規劃模型(3)中,通過非線性規劃求解得到投資組合的有效前沿,其規劃求解通過Matlab6.5軟件來實現,見圖2,圖中縱軸表示投資組合的預期收益率,橫軸表示投資組合的標準差,它衡量著投資組合的風險。虛線表示用OLS方法估計得到的投資組合的有效前沿,實線表示用Huber方法估計得到的投資組合的有效前沿。

圖2 投資組合有效前沿
從圖2可以發現,利用Huber方法最終得到的投資組合有效前沿比用OLS方法得到的投資組合有效前沿向左上方移動了一定的幅度,這一結果正好與穩健回歸方法中Huber估計的權重函數是一致的,相比較而言,Huber方法的權重隨殘差ei絕對值的不斷增加,權重函數不斷趨于0,因此,當數據中存在一些離群值的時候,Huber方法對于離群值的修正作用得到了有效的體現,即在相同的預期收益率下,由Huber穩健估計方法得到的最優投資組合的風險要小于傳統OLS統計方法得到的最優投資組合的風險。
從實證分析我們可以看到,將穩健回歸方法引入到夏普單指數投資組合模型,通過穩健回歸先估計出單指數模型中的參數αi、βi的值,再構建期望收益向量和協方差矩陣,建立規劃模型,能從一定程度上降低由于短期行情帶來的超高或超低收益率歷史數據等離群值對投資組合有效前沿帶來的影響,從而使我們構建的投資組合在長期中能體現其真正的投資價值,達到預期收益相同而風險最小的目的,說明穩健統計方法與投資組合理論相結合的可行性,這對長期投資者的股票組合投資決策具有現實指導意義。
[1]威廉,夏普.資產組合理論與資本市場[M].北京:機械工業出版社,2001.
[2]熊和平.投資組合協方差矩陣的性質與最優組合的選擇[J].中國管理科學,2002,(10).
[3]田兵,陳曉紅.基金投資中的單指數模型[J].中南工業大學學報,2001,(4).
[4]P.J.Huber.Robust Estimation of a Location Parameter[J].Annals of Mathematical Statistics,1964,(35).
[5]滕素珍.穩健回歸分析[J].大連理工大學學報,1991,(6).