張寧 趙亮



摘 要:針對信息披露質量評價中常用的主成分分析方法,本文指出了其計算依賴于樣本協(xié)方差矩陣,而協(xié)方差矩陣的估計容易受到異常值的影響。針對該問題,本文提出了將“穩(wěn)健協(xié)方差方法”引入到信息披露質量評估中,并對2015年部分上市公司的信息披露質量進行了綜合分析和對比,展示了新方法的穩(wěn)健性。
關鍵詞:主成分分析;穩(wěn)健協(xié)方差;上市公司信息披露;信息披露質量
中圖分類號: F830.33 文獻標識碼: A 文章編號:1674-2265(2015)12-0003-06
一、 引言
信息披露是上市公司所必須履行的義務,在當前審核制逐步轉向注冊制的過程中,它變得更加重要:大量投資者依靠披露的信息進行投資決策;監(jiān)管部門依靠披露的信息來行動;關聯(lián)企業(yè)依靠披露的信息來進行交易。那么這些上市公司的披露行為是否符合規(guī)范?公司之間披露行為有無差異?披露是否符合證監(jiān)會相關辦法中的各項要求?披露的信息是否具備完整性、有效性、真實性?這一系列問題的回答,都需要對信息披露質量進行系統(tǒng)的、客觀的、量化的研究。
針對該問題,歐美資本市場的研究相對成熟,這得益于相關監(jiān)管政策的穩(wěn)定和連續(xù);而國內的學者也對大陸資本市場的信息披露進行了多角度的研究:學者們最早是關注 “信息披露”與其他經(jīng)濟要素的關系,通過已經(jīng)公布信息披露的評價數(shù)據(jù)(這些數(shù)據(jù)大多數(shù)來自于監(jiān)管機構或者證券交易所),用計量的方法來分析,例如汪煒、蔣高峰(2004)研究了信息披露與資本成本的關系,曾穎、陸正飛(2006)研究了信息披露與股權融資成本的關系,其他一些學者研究信息披露質量與市場流動性、公司財務狀況的關系等;后續(xù)一些學者提出了信息披露的評價方法,這些方法大多基于主成分分析,通過主成分分析獲得主成分,然后將結果用于計量研究。
本文主要關注信息披露質量的評價和度量問題,即通過何種手段能夠將一家公司的信息披露質量進行客觀評價,最后給出了相應的分數(shù),使投資者和監(jiān)管者對披露質量有一個直觀的認識。
任何對信息披露質量進行評價的方法都不能脫離法律法規(guī),上市公司信息披露所遵循的法律法規(guī)包括如下幾類:
第一類是《中華人民共和國證券法》(以下稱《證券法》),該法于1998年12月29日經(jīng)第九屆全國人民代表大會常務委員會第六次會議通過,并于2004年8月28 日、2005年10 月27日、2013 年6 月29日進行了修訂。《證券法》在第三章第三節(jié)中對“持續(xù)信息公開”進行了詳細規(guī)定,包括發(fā)行人、上市公司、IPO、中期報告、年度報告、重大事項等,這些是上市公司所必須承擔的法律義務。
第二類是中國證監(jiān)會發(fā)布的《上市公司信息披露管理辦法》以及細化的內容與格式要求,包括:《公開發(fā)行證券的公司信息披露內容與格式準則第2號—年度報告的內容與格式》,《公開發(fā)行證券的公司信息披露內容與格式準則第3號—半年度報告的內容與格式》和《公開發(fā)行證券的公司信息披露編報規(guī)則第13號—季度報告內容與格式特別規(guī)定》,這些辦法和規(guī)定詳細規(guī)定了上市公司信息披露所遵循的細節(jié)要求,這是信息披露質量評估的重要依據(jù)。
第三類是上海證券交易所和深圳證券交易所發(fā)布的披露要求,主要是進一步完善證監(jiān)會的相關辦法和規(guī)定。
筆者從2012年開始,用主成分分析和熵模型進行保險公司信息披露質量評估,并在一定程度上回答了“信息披露質量如何”這個核心問題。但當我們使用同樣的方法來研究上市公司信息披露質量時,發(fā)現(xiàn)了一些問題,其中最核心的就是方法的穩(wěn)定性(魯棒性),而該問題的產生有兩方面原因:第一是因為上市公司的數(shù)量龐大,且體量(無論是總資產還是盈利等)的方差變化大;第二是資本市場的迅速發(fā)展產生很多在某些指標上存在“異常”(明顯與其他公司不同)的上市企業(yè)。這兩個原因都導致信息披露的單項指標與整體相比產生很大的差異。
評價方法來源于統(tǒng)計學。從數(shù)學角度看,任何一種統(tǒng)計評價方法都是多維指標空間到一維空間的映射,例如信用評價、信息披露質量評價、競爭力評價等。不同的評價方法可能導致樣本(例如本文的上市公司)在得分方面有所不同,那么具體哪種方法更有效?理論上,我們自然要求這種評價的“數(shù)學映射”具有連續(xù)性,即在樣本數(shù)量發(fā)生小比例變化的時候,其映射的結果應該不會發(fā)生大的偏差,即最終得分不會發(fā)生太大變化。著名評級公司穆迪在使用KMV模型(基于默頓1974年的文章)進行信用評價時,最早注意到了這點,通過異常反饋訪談來保證最后的結果穩(wěn)健性。
事實上我們在研究過程中已經(jīng)注意到,在很多評價方法中,直接使用主成分分析所帶來的一些問題,最直接的就是導致公司歷年排名的劇烈波動,而通常情況下,一家公司經(jīng)營穩(wěn)健,其所要評價的方面應該在相鄰年度之間有一定的穩(wěn)定性,具體可以參考表7我們所模擬做的試驗。
之所以出現(xiàn)此現(xiàn)象,是因為主成分分析方法的核心依賴于協(xié)方差矩陣的計算,數(shù)學上已經(jīng)證明,協(xié)方差矩陣對異常值的變化非常敏感,這就導致結果會產生較大的波動。這樣的波動使得結果的評價不穩(wěn)定,即當加入一個新樣本的時候,很有可能相互之間的位置會發(fā)生變化,最終的得分結果與實際信息披露質量產生偏差。
同時,因為每年的樣本變化,使得時間角度的比較變得困難,相同的公司因為不同年份里其他公司的數(shù)據(jù)異常會得到差異較大的分數(shù),無法真實地反映公司信息披露質量的變化情況。從總體上看,也使得公司平均的信息披露質量依賴于每年參與評價的樣本數(shù)量和數(shù)值。
為了能夠真實地反映信息披露質量的變化情況,我們必須尋找一種穩(wěn)定的評價方法,使其對異常數(shù)據(jù)和樣本變化不敏感,這就是我們進行本研究的核心。本文第二部分介紹了穩(wěn)健協(xié)方差的方法和原理,第三部分介紹了穩(wěn)健的評價過程,第四部分以實證的方式給出了方法應用結果以及該方法的穩(wěn)健性說明,第五部分給出了相應的結論。
二、基于穩(wěn)健協(xié)方差的評價方法
(一)主成分分析的問題
主成分分析是常用的評價方法之一,除了作為主要的評價框架外,它還可以用來輔助其他方法發(fā)現(xiàn)關鍵的影響指標。具體來說,設對某一事物的研究涉及p個指標,分別用[X1,X2,…,Xp]表示,他們組成隨機向量[X=X1,X2,…,Xp],設其均值為[μ],協(xié)方差矩陣[Σ],主成分分析即尋找新的綜合變量Y,它為原來指標的線性組合:
[Y1=μ11X1+…+u1pXp…Yp=up1X1+…+uppXp]
這樣線性變化存在無數(shù)可能,主成分分析從Y的統(tǒng)計特性出發(fā),要求[Yi]方差盡可能大,并相互獨立,由此得到一個理想的變化,對變換后的綜合指標,按方差進行排序得到[Y1,Y2,…,Yp],由于按照方差貢獻度排列,只需要很少的綜合指標就可以達到總體方差的90%左右,這樣研究該事物就只需要關心有限個綜合指標。
從原理上主成分分析是一個適合用于評價的方法,但是具體計算的時候需要使用樣本來計算所需要的線性變化,獲得主成分,一個簡單的過程是:先計算樣本的協(xié)方差,然后由協(xié)方差計算特征值和對應的特征向量,按照特征值排列,對應的特征向量就給出了對應主成分所需要的線性變化。這其中最關鍵的就是樣本協(xié)方差的計算。
在數(shù)學領域,很早就有學者發(fā)現(xiàn)了樣本協(xié)方差和樣本均值的計算對異常值非常敏感,部分學者還對其敏感程度進行了數(shù)學分析。
為了直觀說明這一點,我們用兩組數(shù)據(jù)做一個試驗,該兩組樣本數(shù)據(jù)為二維正態(tài)分布隨機生成,均值為1,方差為1,相關系數(shù)為0.6(協(xié)方差也為0.6),接下來隨機為每組改變一定數(shù)量的樣本值,改變后的數(shù)值為原來的2倍,結果如表1:
表1:協(xié)方差計算對異常值的敏感性說明
[改變數(shù)值的數(shù)量\&樣本值變化(增加)百分比\&協(xié)方差變化百分比\&1\&100%\&103%\&2\&100%\&137%\&5\&100%\&216%\&10\&100%\&732%\&]
正是因為協(xié)方差計算對異常值非常敏感,則當用于評估的樣本中出現(xiàn)差異較大的個體的時候將會導致協(xié)方差發(fā)生巨大變化,從而也導致基于協(xié)方差估計的主成分提取產生較大變化,最終會使得公司的評估結果產生較大偏移。更重要的是,使得不同年份之間的比較無法客觀進行,而變成依賴于不同年份的樣本選擇,這是基于主成分分析的評估方法都必須要解決的問題。
(二)穩(wěn)健協(xié)方差估計
協(xié)方差的敏感性問題,大體有兩種解決途徑,一種是盧梭(Rousseeuw)提出的最小協(xié)方差矩陣估計(MCD, Minimum Covariance Determinant),該方法直接有效,后續(xù)發(fā)展了許多加快效率的辦法;另外一種是基于投影追蹤(Projection pursuit),針對指標維數(shù)超過樣本數(shù)量以及稀疏矩陣的情形。
考慮到我們所面對問題的初始指標為217個,低于公司樣本數(shù)量(700家搜集數(shù)據(jù)的公司),且整體上由于數(shù)據(jù)采集并非依賴于機器統(tǒng)計,并未出現(xiàn)稀疏矩陣,且計算量在可以接受范圍,我們選擇了MCD方法,從兩種方法對比中,實際上MCD方法更穩(wěn)定一些,這是由于信息披露質量的所有指標側重點較分散,在進行投影追蹤時選擇一個合適的超平面其實并不容易做到。
MCD的一個問題是計算量較大,但實際上對上市公司信息披露質量來說,這是可以忽略不計的,在普通計算機上也可以在半小時內完成,而借助快速MCD算法(FAST-MCD),該時間可以大大縮短。從這個角度來說我們認為經(jīng)濟管理以及金融中可以充分利用該方法以獲得穩(wěn)健的協(xié)方差估計。
MCD方法實際上是利用迭代思想,不斷計算離群點和中心的馬氏距離,最終找到一個穩(wěn)定的中心群點,形成所需要的協(xié)方差估計,具體過程為:
第一步,考慮一個矩陣[Xn×p],從中隨機抽取h個樣本(對于選擇的600家公司,我們選取h=512),計算這些樣本的均值和協(xié)方差矩陣,作為初始值,記為[T1,S1]。
第二步,計算全部n個樣本到第1個初始中心[T1,S1]的馬氏距離,并選取出其中最小的h個樣本點:
[d1i=xi-T1S-11(xi-T1)]
第三步,由上述新的h個樣本形成新的均值和協(xié)方差矩陣[T2,S2],然后重復第一步和第二步的過程。
迭代終止:當[DetSm=Det(Sm-1)],此時再通過最后的協(xié)方差矩陣進行加權計算得到穩(wěn)健的協(xié)方差估計,盧梭(1984)給出了迭代收斂的證明過程。
該過程有明顯的幾何意義,即不斷尋找包含h個樣本的超橢球體,使其到樣本中心距離最短,這樣橢球體之外的點就是例外點(Outlier),這些例外點可以用于經(jīng)濟金融的進一步研究使用。
為了說明其穩(wěn)健性,我們對表1試驗的數(shù)據(jù)應用穩(wěn)健協(xié)方差估計,結果如表2所示,可以看到,其協(xié)方差非常穩(wěn)健,大幅度降低了異常值的干擾。
表2:穩(wěn)健協(xié)方差估計的結果
[改變數(shù)值的數(shù)量\&樣本值變化(增加)百分比\&協(xié)方差變化百分比\&1\&100%\&0.3%\&2\&100%\&1.6%\&5\&100%\&7.9%\&10\&100%\&12%\&]
(三)穩(wěn)健信息披露評估方法
任何基于指標的評價方法都面臨一個核心問題,即指標的選取。盡管通過專家方式、管理經(jīng)驗以及文獻建議等,可以確定很多指標,但顯然把所有指標都考慮進排序本身有很多困難,例如權重就無法確定。如果通過主觀方式來確定權重,則又會遭到質疑,畢竟缺少量化的支持和內在關系的驗證。
一個較好的方式就是通過主成分分析將初始指標進行篩選,選取那些真正能夠“衡量”的指標,除了減少運算量外,還自動提供了一種直接的量化權重,即主成分中的“方差貢獻率”。
在我們的評估方法中,我們用穩(wěn)健協(xié)方差的估計來獲得信息披露的關鍵影響指標,然后利用信息論中的“熵模型”獲得最終的評估方法。
三、評估方法與過程
評估過程包括兩個步驟:第一個步驟是用穩(wěn)健主成分提取關鍵性指標,第二個步驟是用熵模型進行評估。
(一)用穩(wěn)健主成分分析進行指標選取
指標選取基于《證券法》、《管理辦法》以及三個報告的內容與格式要求,具體分為如下幾類:基礎信息類,包括1個sheet,含有12個指標;該類主要記錄公司的基礎信息以及經(jīng)過大數(shù)據(jù)抓取的信息。
臨時報告類,包括2個sheet,含有17個指標及1個股價信息表;這里記錄上市公司披露的臨時報告的度量指標,并包括基于股價數(shù)據(jù)進行的統(tǒng)計指標(例如市場理解時間)。
年報信息類,包括9個sheet,每個sheet含9到67個指標不等,對上市公司的年度進行度量的指標。
半年報信息類, 8個sheet,每個sheet含9到67個指標不等,對上市公司的年度進行度量的指標。
季度信息類,第一季度與第三季度類,每類3個sheet,每個sheet從9到21個指標不等,對上市公司的年度進行度量的指標。
表3給出了前三類的指標與分指標(完整的度量表略)。
我們通過穩(wěn)健主成分,提取了如下一些指標,各類指標所涵蓋的方差貢獻率如表4所示。
表4:各類選取指標的方差貢獻率
[指標類\&數(shù)量\&貢獻率\&基礎信息類\&5\&90.2%\&臨時報告類\&7\&91.3%\&年度報告類\&18\&90.6%\&半年報告類\&9\&90.2%\&季度報告類\&8\&92.3%\&]
盡管該指標選取結果仍然較多,但已經(jīng)比采取固定指標方式的數(shù)量少很多,這是下一步進行熵模型的計算基礎。
(二)用熵模型進行質量評估
設X為離散隨機變量,取值范圍為[x1,x2,…,xn] ,概率質量函數(shù)為[pxi,i=1,…,n],則該隨機變量的信息熵H(X)定義為:
[HX=E-ln Px=i=0n-p(xi)ln p(xi)]
為了應用熵概念進行評價,需要逐步進行指標的熵化,并計算各家公司對應的加權熵和,具體如下:
第一步:根據(jù)初始矩陣,計算第j項指標中,第i家公司所占有的比重,公式如下:
[pij=tijitij]
第二步:計算第j項指標的熵值,公式如下:
[Ej=-ipij×ln (pij)]
第三步:計算第j項指標的權重,公式如下:
[ωj=Ej∑Ej]
第四步:根據(jù)權重,計算每個公司的信息披露總體質量,用k表示:
[ki=jωjpij]
四、結果穩(wěn)健性說明
我們搜集的數(shù)據(jù)包括700家公司樣本。為了說明方法的穩(wěn)健性,我們以600家公司為基本樣本,從中隨機抽取30家公司,作為錨定樣本,這30家公司在總體公司的排名如表5所示。
表5:30個隨機抽取的公司分數(shù)和排名
[公司名稱\&分數(shù)\&排名\&湖北博盈投資股份有限公司\&89.50427\&57\&佛山市國星光電股份有限公司\&87.84584\&90\&廣東金萊特電器股份有限公司\&85.81667\&112\&南方黑芝麻集團股份有限公司\&84.99278\&132\&北京順鑫農業(yè)股份有限公司\&84.83816\&145\&中航地產股份有限公司\&84.30506\&198\&東北電氣發(fā)展股份有限公司\&84.21528\&212\&永輝超市股份有限公司\&84.09538\&243\&袁隆平農業(yè)高科技股份有限公司 \&83.33567\&252\&惠州中京電子科技股份有限公司\&83.13057\&260\&青島雙星股份有限公司\&82.89865\&271\&山東恒邦冶煉股份有限公司\&82.54368\&278\&廣東蓉勝超微線材股份有限公司\&81.594\&301\&重慶桐君閣股份有限公司\&81.12774\&309\&吉林亞泰(集團)股份有限公司\&81.05343\&328\&保定天威保變電氣股份有限公司\&80.28648\&345\&國藥集團一致藥業(yè)股份有限公司\&79.72621\&361\&浙江步森服飾股份有限公司\&79.26323\&380\&國電南瑞科技股份有限公司\&78.67234\&393\&西安通源石油科技股份有限公司\&74.17404\&412\&羅頓發(fā)展股份有限公司\&73.58232\&423\&招商證券股份有限公司\&73.4736\&443\&山東博匯紙業(yè)股份有限公司\&70.79694\&457\&永清環(huán)保股份有限公司\&67.03822\&469\&湖南博云新材料股份有限公司\&66.96247\&480\&廣西五洲交通股份有限公司\&66.44988\&492\&北京賽迪傳媒投資股份有限公司\&65.43008\&501\&吉林成城集團股份有限公司\&65.25448\&521\&北京銀行股份有限公司\&62.27281\&559\&中國民生銀行股份有限公司\&55.16279\&589\&]
如果針對600家樣本,使用傳統(tǒng)的主成分分析方法,所提取的主成分如下:
表6:傳統(tǒng)主成分的主成分數(shù)量及方差貢獻率
[指標類\&數(shù)量\&貢獻率\&基礎信息類\&7\&89.6%\&臨時報告類\&9\&90.6%\&年度報告類\&20\&91.0%\&半年報告類\&8\&88.7%\&季度報告類\&9\&91.8%\&]
與穩(wěn)健協(xié)方差方法的主成分分析比較,可以發(fā)現(xiàn),所提取的指標相對要多一些,這是由于普通主成分的協(xié)方差矩陣計算受到多樣本的干擾,需要更多指標才能覆蓋目標方差。
我們對上述基礎樣本分別做“減少10家”、“減少50家”、“增加10家”、“增加50家”的操作,然后看錨定的30家公司分數(shù)有何變化。結果如表7所示。
從表7可以看到,在傳統(tǒng)方法下,10家樣本的增加和減少,已經(jīng)引起了數(shù)值一定幅度的變化,而當增加或減小50家樣本時,得分出現(xiàn)劇烈變化,相對位置也出現(xiàn)較大幅度調整,并不具備評價所要求的穩(wěn)健性。
作為對比,我們來看一下新的穩(wěn)健評價方法的實證結果。首先我們對剩余的570家公司,隨機去除10家、50家、100家公司,然后再看其分數(shù)變化。具體如表7所示。
從表7可以清晰地看到,去除公司導致整體分數(shù)有所增加,但總體保持穩(wěn)健:當去除10家公司時,幾乎對得分沒有影響,非常微小,更不會影響公司排名;而當去除50家公司時,公司的得分出現(xiàn)小幅度變化,但仍然能夠保持穩(wěn)健;即使當去除100家公司時,盡管分數(shù)出現(xiàn)了較大變化(如中國民生銀行從55.16變化到57),但仍然能夠保持相對排名。該結果充分說明對于公司減少的情況,我們的方法能夠保持穩(wěn)健,符合評價方法的固有要求。
接下來對600家公司樣本,分別增加10家、50家、100家公司,然后再看其分數(shù)變化。結果如表7所示。從表7可以看到,增加公司數(shù)量導致大部分公司分數(shù)下降,但總體保持穩(wěn)健:當去除10家公司時,雖然比減少公司數(shù)量導致的變化大,但仍然非常微小,也不會影響公司排名;去除50家公司時,公司的得分出現(xiàn)小幅度變化,依然能夠保持穩(wěn)健;當去除100家公司時,部分公司分數(shù)出現(xiàn)了較大變化,但綜觀全局,仍然能夠保持相對位置。該結果也說明對于公司增加的情況,我們的方法也能夠保持穩(wěn)健。
五、結論與說明
傳統(tǒng)的信息披露質量評估方法存在著依賴樣本、受異常值影響以及無法縱向比較的問題,而我們基于最小協(xié)方差矩陣的穩(wěn)健方法能夠很好地避免異常干擾,通過該方法所提取的主成分在應用中保持穩(wěn)健。
具體來說,無論是公司數(shù)量增加(13%以內),還是公司數(shù)量減小(13%以內),該穩(wěn)健方法都能夠保持分數(shù)較小幅度變化,保持相應的相對位置,這對于信息披露質量評估以及其他評價方法都具有重要的參考意義。
參考文獻:
[1]Grubel R.A,1988.Minimal characterization of the covariance matrix,Metrika,35.
[2]Li G,Chen Z.1982. Projection-pursuit approach to robust dispersion matrix and principle components:primary theory and montecarlo,Journal of American statistical association,80.
[3]Peter J. Rousseuw.1984. Least median of squares regression,Journal of the American Statistical Association,79.
[4]汪煒,蔣高峰.信息披露、透明度與資本成本[J].經(jīng)濟研究,2004,(7).
[5]曾穎,陸正飛.信息披露與股權融資成本[J].經(jīng)濟研究,2006,(2).
[6]呂惠聰.大股東控制、審計監(jiān)督與信息披露質量—來自深圳上市公司的經(jīng)驗證據(jù)[J].經(jīng)濟管理,2006,(22).
[7]陳千里.信息披露質量與市場流動性[J].南方經(jīng)濟,2007,(10).
[8]王斌,梁欣欣.公司治理、財務狀況與信息披露質量—來自深交所的經(jīng)驗證據(jù)[J].會計研究,2008,(3).
[9]張程睿.公司信息披露質量對投資者交易行為的影響—基于對深圳上市公司的經(jīng)驗分析[J].南方經(jīng)濟,2008,(4).
[10]王茜.信息披露質量與公司業(yè)績的關系研究[J].財經(jīng)理論與實踐,2008,(5).
[11]張寧.保險公司2013年度信息披露質量評估研究[J].保險研究,2013,(7).
(責任編輯 耿 欣;校對 CX,GX)