劉洪玉,楊振鵬
(清華大學 房地產研究所,北京 100084)
2011年新年伊始,房地產稅改革成為人們熱議的話題。在“十二五”規劃建議中,將“加快財稅體制改革”放到了重要位置上,并明確提出“研究推進房地產稅改革”。重慶、上海決定自2011年1月28日開始對部分個人住房征收房產稅,開創了我國住房制度改革以來向個人擁有住房征收財產稅的先河,是我國房地產稅改革歷程中的重要進展。在這樣的背景下,房地產計稅價值評估問題得到越來越多的關注。不少學者提出,由于房地產稅應以財產的評估價值作為計稅依據,因此住房價格的評估技術是房地產稅具體實施過程中的關鍵問題之一[1]。
在以往的文獻中,計算機輔助批量評估法(CAMA)常被認為是在數據充足情況下行之有效的實用方法[2][3][4],其中,又以多元回歸分析(MRA)最為常用。例如,紀益成、傅傳銳(2005)使用EViews軟件的線性回歸功能,給出了一個對30套住房進行批量評估的范例[5];喬治敏等(2009)采用SPSS軟件多元線性回歸模型對北京4個城區400多套住房的批量評估進行實證研究[6];龔科等(2010)使用MATLAB軟件和LS-SVMLAB工具包,以最小二乘支持向量機的方法進行了小規模的實驗[7]。
本文采用方法與以往文獻的主要區別,在于利用主體變量代替小區層次的特征變量引入多元回歸模型。這一方法既可以減少收集住宅小區層次屬性信息的工作量,還能在一定程度上改善模型的評估效果,在未來的實踐中具有較好的推廣價值。
住房特征價格理論與房價的多元回歸分析(簡稱MRA)經常有著密切的聯系,不過特征價格理論是一種解釋房價形成機制的經濟學模型,而MRA是一種統計分析方法。住房特征價格理論(或稱Hedonic理論)假設住房由一組特征組成,人們對每一個特征都會具有一定的支付意愿,因此每一個特征實際上都有對應的隱含價格,而人們為購買一套房屋支付的總價,就是這些隱含的“特征價格”的總和[9]。
舉例來說,假設在某個市場中,住房包括m個關鍵的特征,用X1、X2、…、Xm表示某套住房包含每個特征的量,C1、C2、…、Cm分別是這些特征的“單價”(即特征價格)。那么住房價格HP應當為:

在式(1)中,μ是一個隨機干擾項,它反映了房屋交易價格還會受到其它不確定因素的影響。
由于特征是不能單獨交易的,因此特征價格C1~Cm都是隱含的屬性。不過房屋交易價格HP和特征X1~Xm的取值是能直接觀測到的,因此,當觀測到足夠多的交易樣本后,就可以通過MRA方法反求HP關于X1~Xm的回歸表達式。

圖1 MRA法批量評估的流程
1.2.1 流程
將MRA方法用于住房價格批量評估,一般包括以下步驟。
在進行批量評估之前,首先需要收集足夠數量的住房可比交易案例,將這些可比案例的價格和房屋信息整理成標準格式的數據庫。同時,還需要整理待評估住房的特征信息,按照同樣的格式錄入數據庫。完成數據整理后,即可運用多元回歸分析求取房價關于住房特征的回歸表達式。最后,依據回歸表達式和需要評估住房的特征數據,完成房屋價格評估值的計算。
1.2.2 常用的房屋特征
常用的房屋特征可分為區位屬性、鄰里屬性和物理屬性3大類。區位屬性是房屋所在區位的性質,如交通可達性(是否靠近地鐵、到市區距離等)、周邊配套設施齊全程度、自然環境條件等。鄰里屬性是更細區域的性質,結合我國居住社區的特點,可理解為小區(樓盤)或街道的屬性,如物業管理水平、容積率、綠化率、車位數量等。物理屬性即房屋自身的特征,如房齡、樓層(建筑的總層數以及房屋所在層)、朝向、建筑面積、臥室數量等等。
1.2.3 回歸模型的設定
應用MRA方法,要求因變量和自變量都是實數數值。對于因變量,通常選用的是房屋總價或單價的自然對數。對于反映房屋特征的自變量,其構造方法則有一定技巧。
有一部分房屋特征本身可以被量化(如建筑面積等),這類特征可以直接作為自變量引入模型,或者將它們的Box-Cox變換形式引入模型。
還有一些房屋特征只可能有若干種固定的取值(后文簡稱字典型變量),如所在行政區、土地等級、產權性質等,這類房屋特征通常要以虛變量組的形式引入回歸模型。以“所在行政區”為例,假設所有考察樣本來自4個行政區——城東區、城西區、城南區、城北區,那么只需要“是否屬于城東區”、“是否屬于城西區”和“是否屬于城南區”3個虛變量就可以確定一套房屋所在的行政區。每個虛變量都是在條件成立的時候取值為1,不成立的時候取值為0。這樣,就可以用實值變量組代替字典型變量。
最后,模型中一般還包括常數項。計量模型如式(2)所示。

其中,HPi是樣本i的房價,X1i~Xmi是依據樣本 i的房屋特征轉化的自變量組。
主體變量是反映房屋是否屬于某個特定小區的虛變量。如果考察范圍內有N個小區,依次是小區1、小區2、…小區N,那么可以用N-1個虛變量P1~PN-1確定房屋所屬的小區。

在多元回歸分析中,將主體變量P1至PN-1引入回歸模型,就可以得到每個小區的主體變量系數,即該小區的價格調整系數。
傳統MRA方法使用小區層面的特征變量(如綠化率、容積率等)反映房屋所在小區的屬性。在評估過程中,這種模型需要根據小區屬性的取值進行價格調整。引入主體變量的MRA則采用了更為直接的思路,對每個小區單獨設置一個調整系數。在評估中,只需要知道房屋屬于哪一個小區以及該小區的調整系數,就可以計算評估價格,而不需要知道這個小區的屬性。圖2顯示了這種思路和傳統MRA評估的區別。

圖2 引入主體變量的MRA評估過程與傳統過程的差異
在非MRA的批量評估中,一般會采用更直接的方式處理小區因素對價格的影響。例如在基于“市場比較法”的評估中,會選取同一個小區(或周邊檔次相近的小區)的房屋交易作為可比案例。耐人尋味的是,在基于MRA的批量評估中,已有文獻往往放棄直接設立小區調整系數的方法,而是間接地在模型中引入小區屬性[6][7]。本文后續部分將討論是否可以通過引入主體變量,使MRA評估也能直接地反映小區因素對價格的影響。
在小區數目眾多的情況下,向回歸模型中加入主體變量,會大幅增加自變量的數目。這對于MRA模型的影響主要體現在以下三個方面。
2.3.1 自變量意外線性相關
當模型中引入了多組虛變量,有可能意外地出現自變量完全線性相關的情況。例如,在引入主體變量的同時還引入了“所在環線位置”的特征,各小區“所在環線位置”如表1所設定。

表1 造成自變量線性相關的示例
在MRA模型中,設定P1~P6共6個主體變量,用于標記房屋所在的小區。用兩個虛變量R1、R2代替“所在環線位置”這個字典型特征——R1表示房屋處于二環以內、R2表示房屋處于二環至三環之間。
不難推導出,對于任何房屋樣本,下列關系永遠成立:

由于R1、R2可以被主體變量線性表出,因此不能將它們加入到回歸模型中。更一般地,任何小區層面上的特征變量都不應與主體變量同時出現。
2.3.2 多重共線性
即便消除了完全線性相關的自變量,多重共線性問題仍有可能存在。特別是在使用新房數據時,應注意主體變量和由交易時點轉化而來的月份虛變量往往高度相關。這是因為新房的銷售期往往較為集中,已知一條樣本所屬的小區,就能基本確定它的交易時點大致在某幾個月份之間。雖然單純的多重共線性問題不會影響系數估計量和評估結果的無偏性,但是模型給出評估值的置信區間會更大,對于使用者而言,只能更保守地看待評估結果。因此,對新房進行批量評估時,需謹慎使用主體變量。
2.3.3 模型自由度降低
在樣本量不足的情況下,引入較多主體變量會降低模型的自由度。因此,在使用主體變量時必須注意樣本量是否顯著多于自變量的數目。
本文通過實地調研采集了403條二手房出售數據。樣本分布在北京市4個居住項目較密集的地區,分別是豐臺區的青塔地區、光彩路地區,石景山區的魯谷地區,以及位于豐臺、海淀、石景山交界處的玉泉路地區。選擇上述地段的原因之一是,作者對這些區域有一定的了解,容易分辨房源信息的真實性。403套房源來自于46個住宅小區,建筑年代從80年代到2010年不等。其中兩個小區按經濟適用住房管理(交易過戶時補交3%土地出讓金),其余小區均可作為商品住房交易。
數據主要通過經紀機構門店采集,時間從2011年3月上旬開始至4月初結束。其中價格信息為各經紀機構信息系統中的業主真實報價,標的房屋均經過經紀人實地踏勘并拍照,具有較好的真實性。此外,數據還由經紀人進行一輪篩選,去除根據其經驗認定不可能在一個月內售出的高報價樣本,以及采取了明顯低報價策略的樣本。
反映房屋特征的變量包括以下幾項。在小區層面上,作者收集了小區建筑年代、所屬行政區、環線位置、容積率、綠化率、物業服務費率等數據,以及“是否按經濟適用住房管理”、“1公里內是否有地鐵站”等2項虛變量。對于房屋的物理屬性,數據集包含建筑面積、所在樓層、建筑總層數、朝向、臥室數量等5個變量。
在研究中,將樣本分為“建模樣本”和“評估樣本”兩個部分①對每一條樣本生成一個0-1之間的隨機數,如果數值大于0.25,則設定該樣本為“建模樣本”,否則為“評估樣本”。抽樣后確定了302條“建模樣本”和101條“評估樣本”。。首先,使用“建模樣本”進行回歸計算,生成批量評估模型;然后利用模型對“評估樣本”的價格進行評估,并與實際價格比較,從而對評估效果進行評價。
傳統MRA模型引入小區層面的特征變量,模型初始自變量列表如表2所示。
本文利用清華大學開發的批量評估軟件CFMA完成回歸計算。CFMA內置的算法采用OLS回歸,自變量首先全部引入,之后按t-統計量絕對值由小到大排序,逐一進行多余變量檢驗,刪除多余變量。最終保留了24個自變量,回歸結果如表3所示。
模型的擬合優度達0.952。隨機擾動項的方差為9.55%,由于被解釋變量是房價的對數,據此可以推算,評估價格的1倍標準誤差區間是(-9.10%,+10.02%)。對參與建模的302個樣本而言,平均絕對預測誤差(MAPE)為6.71%。上述數據說明,使用該模型進行評估,誤差水平在10%左右,具有一定的實用性。

表2 傳統MRA批量評估模型初始自變量列表

表3 傳統MRA批量評估模型回歸結果
回歸模型自變量的系數還可以揭示影響房價的因素。從表3中可以看到,房屋建筑面積、小區容積率對房價的影響最為顯著,且影響程度呈二次變化規律。其他顯著水平達到5%的影響因素還有:物業費率與房價正向相關;一居室的價格水平低于其他戶型;東北朝向房屋價格低于默認戶型(南北通透);3環~4環之間小區的價格更高;海淀區(只包含玉泉路的兩個小區)價格偏低;建筑年代為“2010年”的小區價格最高,“2005年”次之,其他更早年代的小區價格更低。
得到評估模型后,用其余沒有參與建模的101個樣本檢驗評估效果。每個樣本的實際價格記為Si,評估價格記為Ai,評估價格與實際價格之比記為ARi。采用下述國際評估師協會(IAAO)建議的評價標準衡量評估效果。

表4 傳統MRA模型評估效果
平均AR和中位數AR衡量評估的準確程度。IAAO在1999年的《Standard on Ratio Studies》中要求評估比率在0.9~1.1之間。價格相關差PRD衡量按價格加權平均的評估比率,與簡單平均的評估比率是否一致。如果PRD低于0.98,說明評估模型將明顯高估高價住房、低估低價住房(激進);如果PRD高于1.03,說明出現相反的情況(保守)。離散系數COD衡量評估誤差的分布,它與MAPE類似,區別在于COD衡量相對于AR中位數的偏差。如果AR的中位數恰好是1,COD與MAPE將完全一致。

表5 各小區編號和樣本量
從表4可以看到,傳統MRA模型的評估效果滿足IAAO提出的標準。
3.3 引入主體變量的MRA模型
將樣本覆蓋的46個居住小區編為1~46號,各小區樣本量如表5所示。

表6 引入主體變量的MRA批量評估模型初始自變量列表
選取樣本量最大的小區(彩虹城)作為默認小區,對其余45個小區設置主體變量。由于引入了主體變量,不再引入小區層次的特征,初始自變量列表如表6所示。
同樣,使用CFMA批量評估軟件完成變量篩選和回歸計算,最終保留了46個自變量?;貧w結果如表7所示。
可以看到,使用主體變量的MRA模型比使用小區屬性的模型具有更高的擬合優度。同時,赤池信息量準則(AIC)統計量也得到減小,說明增加的自變量帶來了有用的信息。評估價格的1倍標準誤差區間縮小為(-8.48%,9.26%),樣本內預測的平均絕對誤差(MAPE)降低至5.51%。
應用這一模型,對其余樣本進行評估,效果如表8所示。
從表8中可以看到,引入主體變量的模型在評估的準確度和一致性上都有一定提升。但是,評估誤差超過±10%的案例數增加了1例。
綜合考慮上述實證研究結果,可以發現:引入主體變量的MRA模型在不使用小區層面特征信息的情況下,評估效果能夠等同于甚至超過使用小區信息的傳統模型。
本文設計了一種基于主體變量的房價批量評估模型。該方法與傳統多元回歸分析(MRA)模型的主要區別在于,使用小區虛變量(主體變量)代替所有小區層面的特征變量。本文進行這一調整背后的原因是,傳統MRA模型通過小區的各項屬性間接確定該小區的價格調整系數,本文認為直接從回歸中獲取小區價格調整系數更能有效地利用信息。
使用引入主體變量的MRA模型,不但能夠減少收集小區屬性信息的工作量,評估效果也并未降低。實證研究顯示,引入主體變量的模型在大多數統計量和評價指標上優于傳統MRA模型。

表7 引入主體變量的MRA批量評估模型回歸結果

表8 引入主體變量的MRA模型評估效果與傳統模型的對比
本文研究成果對于在我國開展住房價格批量評估具有一定現實指導意義。特別是在數據收集方面,提示評估機構應當將工作重心放在采集價格信息和房屋的物理屬性上,而不必投入大量的人力、財力整理小區層次的信息,也沒有必要過分依賴地理信息系統。通過簡單地添加主體變量進入回歸模型,就可以獲得更好的評估效果。
[1]高云才.積極穩妥推進房地產稅改革[N].人民日報,2010-12-06(17版).
[2]任作風,廖俊平.計算機輔助批量評估法(CAMA)在物業稅估價中的應用[J].中國房地產估價師,2005,(1).
[3]紀益成,王誠軍,傅傳銳.國外AVM技術在批量評估中的應用[J].中國資產評估,2006,(3).
[4]劉洪玉.計算機輔助批量評估:國際經驗與我國的應用前景[J].中國房地產估價與經紀,2007,(6).
[5]紀益成,傅傳銳.批量評估:從價稅的稅基評估方法[J].中國資產評估,2005,(11).
[6]喬志敏,李德峰,鄒文軍,周戰強.基于財產稅征收的不動產價值評估——對北京市4個內城區的實證分析[J].城市發展研究,2009,(3).
[7]龔科,肖智,李丹.基于支持向量機的物業稅稅基批量評估[J].涉外稅務,2010,(5).
[8]John D.Benjamin,Randall S.Guttery,C.F.Sir?mans.Mass Appraisal:An Introduction to Multiple Regression Analysis for Real Estate Valuation[J].Journal of Real Estate Practice and Education,2004,(7).
[9]S.Rosen.Hedonic Prices and Implicit Markets:Product Differentiation in Pure Competition[J].The Journal of Political Economy,1974,82(1).