999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于PCA的SVM模型的海南省主要城市商品住宅價格預測

2019-06-11 08:00:54彭博韜彭禮燁賈奕輝
科學與財富 2019年9期

彭博韜 彭禮燁 賈奕輝

摘要:近期,國家出臺針對海南的經濟利好政策,建立了海南自貿區與自貿港,海南省主要城市的經濟也隨之提升,房價也迅速提高。海南省政府隨即出臺了相應房價調控政策。房價是民生的重要指標,本文通過搜集過往數據并仔細研究相關背景,建立基于主成分分析的支持向量機模型,對海南房價問題進行分析,及未來短期價格的預測。

關鍵詞:主成分分析,支持向量機,商品住宅價格預測

隨著國家對海南省出臺的一系列相關促進其經濟發展的重大利好政策,海南省的經濟不斷提升,海南省的旅游業迅速發展,海南省的房價也不斷攀升。

1影響海南省房價的指標分析

本文選取了影響海南省(主要為海口、三亞市)房地產價格的11個指標,如表1.所示,結合在海南省相關網站以及年鑒上搜集到這11個指標的歷史數據,對這11個指標兩兩進行相關性分析。由于這11個指標的歷史數據分布不明,故本文采用Spearman相關分析方法來得出指標之間的相關程度。SPSS提供了Spearman分析功能,通過其輸出的相關性表并結合相關程度對應表即得出指標之間的相關程度。

1.1 相關性分析

Spearman相關檢驗法是從量變量x與y是否具有同步性(例如同時增加)來檢驗量變量之間是否存在相關性[1]。對于n對觀察數據(xi,yi)(i=1,2,...,n),按照每個變量的n個數據的大小次序,分別由小到大編上等級(秩次),對重復數據取平均等級,再檢驗兩個變量的等級或秩之間是否相關[1]。

設Ri和Qi分別表示xi和yi的秩次,則Spearman秩相關系數定義為:

當相同秩次較多時,計算校正的秩相關系數應該采用下式:

式中, mx和my的計算公式,均為 ? ? ? ? ? ? ? 。在計算mx時, mi為變量x的相同秩次數;在計算my時,mi為變量y的相同秩次數。

SPSS輸出的相關性表中,Sig. (雙尾)值小于0.01說明兩個指標之間時相關的,結合參照相關程度對應表可得11項指標數據之間的相關程度結果如表2. 所示.

結果顯示,進一步得出房價與所選指標之間都有較強的相關性。

1.2 主成分分析法降維

為了防止指標維度過高致使在高維空間出現維度災難的情況,我們采用PCA(Principal Components analysis,主成分分析法)對指標進行合理降維,使較少指標能表現出豐富的數據信息,并且能夠較好地處理數據之間的冗雜信息。

基于眾多影響海南省商品住宅價格的變量及其取值,從中提取出比較全面地反映海南省房價水平的若干個公共因素Cj和系數nij,其中Cj表示基于若干影響海南省商品住宅價格指標變量抽象化的公共因子,而nij反映了公共因子對影響海南省房價水平的指標變量的影響能力。

對于一個包含n個變量的影響海南省房價指標數據集,現在需要抽象化出能夠充分反映這n個變量內涵的若干個公共因子,則可以進行以下假設:

首先,假設n個指標變量依次為X1、X2、……、Xm,其最終的公共因子為 C1、C2、……,即Cj,那么對于第i個變量Xj,可以表示全體預設公共因子Cj共同作用的結果。即可以描述為如式(1)所示的方程[1]:

其中,Xi是指影響海南省房價指標數據集中的第i 個變量,Ei則是數據集中指標的數值與計算值(即期望值)的差。Cj是未知的公共屬性,而nij是針對變量Xj在第j個公共因素Cj上的系數。這個公共因素的系數nij反映了此公共屬性對變量Xi的影響力,稱為因素載荷。

對于數據集中的每個待分析變量Xi,都能獲得一個形如式(1)的方程式。因此,對于整個影響海南省房價指標數據集,就能獲得一個關于公共因子系數的矩陣。利用這個公共因子矩陣,可以分析各個公共因子對所有影響海南省房價指e標變量的總貢獻,找到貢獻量比較大的公共因子,用它們來描述海南省房價水平的絕大多數性質。

2 基于PCA的SVM模型的建立與求解

2.1模型的建立

支持向量機方法(Support Vector Machine)是基于統計學習理論中的結構風險最小化和VC維理論的一種機器學習方法,由于SVM具有很好的處理小樣本的能力,并且能夠有效降低過擬合的程度,處理非線性問題,其預測效果在國際上引發了極大關注[1]。

SVM回歸實際上是一種先行約束的凸二次規劃優化的求解問題,基于Mercer核展開定理,通過非線性映射ψ,把控件樣本數據映射到高維空間G中,在高維空間G中引入不敏感損失函數,定義最優線性回歸超平面,把尋找最優線性回歸超平面的算法歸結為求解一個凸約束條件下的凸二次規劃問題,因此所得解為全局唯一最優解[1]。

設定樣本數據 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ,其中yi為期望值,n為樣本量。SVM用y=g(x)=(ω·φ(x)+b)來估計函數,其中φ(x)是輸入空間到高維特征空間的非線性映射, ω,b是系數。回歸支持向量機(SVR)的原始最優化問題是:

在支持向量的訓練過程中,尤其是非線性可分的情況下,樣本內積的計算是一項非常耗費時力的工作。使用核函數可以將非線性可分的樣本數據在高維空間內轉化為線性可分。本文模型使用的核函數如下:

核函數的選擇對于SVM的性能具有很大的作用,考慮到樣本數和提取出的樣本數個數,本文選取如上的高斯核函數,這是一種泛化能力強的,常用核函數。

2.2 模型的結果與檢驗

核函數的選擇對于SVM的性能具有很大的作用,考慮到樣本數和提取出的樣本數個為了測試所建立數學模型的預測能力,我們需要對模型進行數據集上的預測能力檢驗,即將數據集分為訓練集與測試集,為了簡化方法,我們采用傳統的留出法進行檢驗。

由于所搜集的數據量較小,我們隨機的將61個樣本劃分為約為9:1,即用6個樣本進行模型的測試。

得到訓練的預測結果和真實房價對比情況,如下所示:

其中,藍色的數據集1為真實房價,而紅色的數據集2為預測值。

3結論與分析

由模型結果及檢驗可知,所建立的數學模型在預測結果上接近于真實值,具有較好的預測能力與穩定性,很好地預測了房屋的價格變化。

參考文獻:

[1]李 航,統計學習方法,北京:清華大學出版社,2012年

主站蜘蛛池模板: 永久毛片在线播| 在线观看国产网址你懂的| 免费国产在线精品一区 | 一级高清毛片免费a级高清毛片| 国产精品成人AⅤ在线一二三四 | 毛片免费视频| 久久99国产综合精品女同| 亚洲欧美自拍视频| 中国国产高清免费AV片| 亚洲无码高清一区二区| 99这里精品| 91尤物国产尤物福利在线| 国产主播在线观看| 夜精品a一区二区三区| www欧美在线观看| 国产欧美日韩精品第二区| 中文成人无码国产亚洲| 在线欧美国产| 天天干伊人| 欧美在线综合视频| 亚洲一级毛片免费看| 国产在线视频自拍| 77777亚洲午夜久久多人| 色成人亚洲| 亚洲天堂自拍| 毛片网站观看| 亚欧成人无码AV在线播放| 在线播放国产一区| 人人91人人澡人人妻人人爽| 久久国产乱子| 2021国产乱人伦在线播放| 欧美a在线视频| 日韩中文精品亚洲第三区| 亚洲精品片911| 国产精品香蕉在线| 国产一区在线视频观看| 在线精品欧美日韩| 成人国产一区二区三区| 免费观看国产小粉嫩喷水| 啦啦啦网站在线观看a毛片| 亚洲成人在线免费| 欧美高清国产| 免费无码AV片在线观看国产| 一级毛片免费高清视频| 日本黄色a视频| 日本成人在线不卡视频| 99热这里只有精品国产99| 91精品视频网站| 国产成人a毛片在线| 国产一级二级在线观看| 国产aⅴ无码专区亚洲av综合网| 精品久久人人爽人人玩人人妻| 波多野结衣在线se| 在线欧美一区| 欧美啪啪一区| 伊人久久大香线蕉影院| 久久中文字幕2021精品| 精品国产aⅴ一区二区三区| 天天色综合4| 日本日韩欧美| 人妻熟妇日韩AV在线播放| 欧美日韩激情在线| 天堂岛国av无码免费无禁网站| 58av国产精品| 高清不卡一区二区三区香蕉| 亚洲成人高清无码| 亚洲精品视频免费观看| 国产美女91视频| 日韩一级二级三级| 一本无码在线观看| 好吊妞欧美视频免费| 国产凹凸视频在线观看| 蜜桃视频一区二区| 全午夜免费一级毛片| 人妻精品久久久无码区色视| 孕妇高潮太爽了在线观看免费| 久久精品无码国产一区二区三区 | 亚洲精品国产乱码不卡| 欧美成人综合在线| 国产成人91精品| 国产在线无码av完整版在线观看| 天堂久久久久久中文字幕|