





收稿日期:2023-12-19
DOI:10.19850/j.cnki.2096-4706.2024.05.022
摘" 要:探究房價趨勢是一個高度復(fù)雜且充滿非線性特征的研究難題。針對目前二手房價預(yù)測精度低的問題,文章提出了基于PSO-LSTM的區(qū)域二手房價預(yù)測方法。粒子群算法通過對LSTM模型進(jìn)行優(yōu)化,找到最優(yōu)的參數(shù)組帶入PSO-LSTM模型中,進(jìn)而得到更符合實際情況的預(yù)測結(jié)果。文章通過湖南省株洲市天元區(qū)的二手房價時間序列數(shù)據(jù)集對PSO-LSTM模型進(jìn)行訓(xùn)練,并與LSTM神經(jīng)網(wǎng)絡(luò)模型進(jìn)行了對照分析。實驗結(jié)果顯示,PSO-LSTM模型對于區(qū)域二手房價的預(yù)測精度更優(yōu)。
關(guān)鍵詞:區(qū)域二手房價預(yù)測;時間序列;PSO-LSTM模型;LSTM
中圖分類號:TP18" " 文獻(xiàn)標(biāo)識碼:A" " 文章編號:2096-4706(2024)05-0102-05
Research on Regional Second-hand Housing Price Prediction Method Based on PSO-LSTM
ZHOU Changyu, LI Changyun
(Hunan University of Technology, Zhuzhou" 412007, China)
Abstract: Exploring the trend of housing prices is a highly complex and full of nonlinear features research challenge. Aiming at the current problem of low accuracy of second-hand housing price prediction, this paper proposes a regional second-hand housing price prediction method based on PSO-LSTM. The Particle Swarm Optimization optimizes the LSTM model to find the optimal parameter group and incorporate it into the PSO-LSTM model, and then get the prediction results that are more in line with the actual situation. In this paper, the PSO-LSTM model is trained by the time series dataset of second-hand housing price in Tianyuan District, Zhuzhou City, Hunan Province, and the PSO-LSTM model is analyzed against the LSTM neural network model. The experimental results show that the PSO-LSTM model has better prediction accuracy for regional second-hand housing prices.
Keywords: regional second-hand housing price prediction; time series; PSO-LSTM model; LSTM
0" 引" 言
在當(dāng)今數(shù)字化時代,房地產(chǎn)市場一直以來都是全球經(jīng)濟(jì)的一個關(guān)鍵組成部分。二手房價的波動不僅影響著個人和家庭的財務(wù)狀況,還對全球金融市場和城市規(guī)劃產(chǎn)生深刻的影響。對于政府、投資者、開發(fā)商和一般居民而言,準(zhǔn)確預(yù)測二手房價變得愈加重要。二手房價的準(zhǔn)確預(yù)測有助于投資者做出明智的決策,賣家可以更好地定價房產(chǎn),政府能夠更好地規(guī)劃城市發(fā)展,金融機構(gòu)則可以更有效地管理風(fēng)險。然而,房價波動受到眾多復(fù)雜因素的影響,這使得預(yù)測二手房價變得復(fù)雜而具有挑戰(zhàn)性。
對于預(yù)測模型,早期的學(xué)者多采用的自回歸模型來進(jìn)行預(yù)測,如AR、ARMA、ARIMA[1]等,但因二手房價影響因素復(fù)雜,波動也比較大,故預(yù)測的模型不能很好地將二手房價的趨勢反映出來。而隨著互聯(lián)網(wǎng)時代的發(fā)展,科學(xué)的預(yù)測方法也越來越多樣化。目前,常用的預(yù)測方法多是時間序列預(yù)測方法。其通過時間將數(shù)據(jù)進(jìn)行排序,再通過數(shù)據(jù)之間的變化關(guān)系進(jìn)行自主學(xué)習(xí)。其中長短時記憶模型[2](Long Short-Term Memory, LSTM)在時間序列數(shù)據(jù)分析中嶄露頭角,已經(jīng)廣泛應(yīng)用于眾多領(lǐng)域。蔡兆暉[3]等引入LSTM神經(jīng)網(wǎng)絡(luò),對大宗商品時序數(shù)列進(jìn)行自適應(yīng)最優(yōu)項數(shù)分解,顯著改善了大宗商品價格預(yù)測的準(zhǔn)確性。許鈺林[4]等采用深度LSTM模型,對玉米和大豆期貨價格進(jìn)行預(yù)測,提升了單個農(nóng)產(chǎn)品期貨模型的預(yù)測性能,為農(nóng)產(chǎn)品領(lǐng)域提供了高精度的預(yù)測模型。程先龍[5]等使用LSTM組合模型對我國西南某風(fēng)電場的實測數(shù)據(jù)進(jìn)行預(yù)測,有效提高了風(fēng)電功率預(yù)測精度。方雪清[6]等使用LSTM的短期組合預(yù)測模型,對廣州市江南農(nóng)副產(chǎn)品市場的富士蘋果日價格進(jìn)行分析預(yù)測,證明了LSTM的短期組合預(yù)測模型對農(nóng)產(chǎn)品價格的短期預(yù)測具有一定的優(yōu)勢。高華睿[7]等通過LSTM的組合模型,對高速公路的交通流進(jìn)行短時預(yù)測,模型的精度和泛化能力高,為高速公路短時交通流預(yù)測提供一種新的參考思路。上述表明LSTM[8]神經(jīng)網(wǎng)絡(luò)在時間序列數(shù)據(jù)預(yù)測的優(yōu)越能力,能夠有效捕捉時間序列中的依賴關(guān)系,并且能夠很好地處理傳統(tǒng)網(wǎng)絡(luò)模型的梯度爆炸等問題。但是參數(shù)的選擇對LSTM神經(jīng)網(wǎng)絡(luò)模型具有很大的影響,參數(shù)取值不當(dāng)會導(dǎo)致模型欠擬合或者過度擬合,進(jìn)而導(dǎo)致預(yù)測精度的不準(zhǔn)確。
本文針對上述問題,提出了基于PSO-LSTM的區(qū)域二手房價預(yù)測方法。通過獲取湖南省株洲市某區(qū)2015年4月至2022年12月售房網(wǎng)站的二手房價數(shù)據(jù),對該數(shù)據(jù)進(jìn)行預(yù)處理,構(gòu)建LSTM神經(jīng)網(wǎng)絡(luò)模型,通過粒子群算法[9]對LSTM模型的參數(shù)進(jìn)行全局搜索最優(yōu)和優(yōu)化,以實現(xiàn)預(yù)測精度的提高。運用該模型進(jìn)行區(qū)域二手房價的預(yù)測,并與LSTM模型進(jìn)行預(yù)測評估指標(biāo)的比對分析,進(jìn)而獲得預(yù)測區(qū)域二手房價的優(yōu)化模型。
1" 研究方法
1.1" LSTM原理
LSTM是對RNN的改進(jìn),成功應(yīng)對了梯度消失和梯度爆炸問題,尤其在時間序列數(shù)據(jù)處理中具有顯著優(yōu)勢,圖1為LSTM模型結(jié)構(gòu)圖。LSTM單元的組成[10]包括遺忘門、輸入門、輸出門和細(xì)胞狀態(tài)。遺忘門、輸入門和輸出門是神經(jīng)網(wǎng)絡(luò)中的關(guān)鍵元素,它們各自擔(dān)負(fù)著不同的責(zé)任,以確保網(wǎng)絡(luò)能夠高效地處理信息。遺忘門負(fù)責(zé)過濾當(dāng)前單元的記憶,決定丟棄哪些信息以適應(yīng)新的輸入。輸入門則負(fù)責(zé)控制新信息的引入,以更新當(dāng)前單元的狀態(tài)。最后,輸出門則掌握著當(dāng)前單元輸出哪些特征信息的控制權(quán),以使網(wǎng)絡(luò)的輸出與任務(wù)需求相匹配。這三個門協(xié)同工作,使神經(jīng)網(wǎng)絡(luò)能夠在不同時間步驟中有效地管理信息流,從而提高模型的性能和適用性。它們是深度學(xué)習(xí)中的關(guān)鍵組件,有助于實現(xiàn)更好的序列建模、自然語言處理、語音識別等任務(wù)。這種門控機制的使用使得神經(jīng)網(wǎng)絡(luò)能夠更好地處理時序數(shù)據(jù)和長期依賴關(guān)系,為各種應(yīng)用領(lǐng)域帶來了顯著的改進(jìn)。通過組合三門等門控單元以實現(xiàn)信息的安全和當(dāng)前狀態(tài)的更新。LSTM能夠?qū)⒃紩r間步長的有效信息傳遞到后續(xù)時間步長,從而克服了短時記憶的問題,改進(jìn)了傳統(tǒng)RNN的限制。因此將復(fù)雜的時序序列數(shù)據(jù)通過LSTM進(jìn)行大量訓(xùn)練,其能夠更好地分辨數(shù)據(jù)的保留或刪除。LSTM神經(jīng)網(wǎng)絡(luò)的性能受超參數(shù)的影響,通過調(diào)整超參數(shù),以實現(xiàn)模型的穩(wěn)定收斂并獲得可靠的實驗結(jié)果。
1.2" 粒子群算法
粒子群優(yōu)化算法(Particle Swarm Optimization, PSO),是由Kennedy和Russell Eberhart于1995年提出的一種改進(jìn)的全局尋優(yōu)的算法[11],起源于對大自然中的鳥群或魚群等生物群體覓食行為的研究。把每只鳥看作是一個粒子,其在空間范圍內(nèi)不停運動,每個粒子擁有適應(yīng)自身的速度和位置,空間中的粒子通過追搜尋最佳位置,不斷跟蹤和保存空間內(nèi)最優(yōu)粒子位置,從而得到全局最優(yōu)解的過程實現(xiàn)。PSO算法式子如下:
(1)
式中: 中的t為t時刻個體最優(yōu)位置解,gBest j(t)中的t為t時刻全局最優(yōu)位置解, 為t時刻的第j個控制變量的第i個粒子的位置,C1和C2為學(xué)習(xí)因子,r1和r2為(0~1)區(qū)間內(nèi)的隨機數(shù)。
(2)
式中: 為t時刻的第j個控制變量的第i個粒子的位置。
(3)
式中:w(t)為慣性權(quán)重因子。其可以調(diào)整尋優(yōu)算法中的搜索能力。
圖1" LSTM模型結(jié)構(gòu)圖
1.3" 預(yù)測性能評估公式
本文運用預(yù)測性能評估公式對模型的評估結(jié)果進(jìn)行測算和評價,主要通過RMSE和MAPE的數(shù)值來進(jìn)行預(yù)測評估。RMSE常用于度量回歸模型中預(yù)測值與實際值之間的偏離程度,其計算方式如式(4)所示:
(4)
其中Xi為區(qū)域二手房價預(yù)測實際值, 為區(qū)域二手房價預(yù)測值,n為樣本數(shù)量。
但在實際問題中,MAPE更適合處理極少數(shù)偏離程度極大的離群點,其計算方式如式(5)所示:
(5)
其中Yi為區(qū)域二手房價預(yù)測實際值, 為區(qū)域二手房價預(yù)測值,n為樣本數(shù)量。
2" PSO-LSTM優(yōu)化方法
2.1" 數(shù)據(jù)集選擇
本文中的二手房價數(shù)據(jù)選取湖南省株洲市某區(qū)二手房價時序數(shù)據(jù)集進(jìn)行預(yù)測實驗,該時間序列數(shù)據(jù)集從2015年4月到2022年12月共有154個樣本,部分?jǐn)?shù)據(jù)如圖2所示。
圖2" 湖南省株洲市某區(qū)二手房價時序數(shù)據(jù)集
2.2" PSO-LSTM優(yōu)化方法預(yù)測流程
LSTM神經(jīng)網(wǎng)絡(luò)雖然解決了時間序列數(shù)據(jù)的梯度爆炸和依賴問題,但是在面對大量的數(shù)據(jù)集時,在最優(yōu)參數(shù)的選擇上仍存在問題,不同的參數(shù)對于實驗結(jié)果存在很大的誤差。針對上述問題,本文通過采用PSO算法對LSTM神經(jīng)網(wǎng)絡(luò)進(jìn)行優(yōu)化,獲得組合模型PSO-LSTM對區(qū)域二手房價進(jìn)行預(yù)測,模型框架圖如圖3所示。
圖3" PSO-LSTM模型預(yù)測流程圖
具體預(yù)測步驟如下:
1)獲取湖南省株洲市某區(qū)二手房價原始數(shù)據(jù),并對數(shù)據(jù)進(jìn)行預(yù)處理。通過對原始數(shù)據(jù)采用X12方法并結(jié)合EViews軟件進(jìn)行季節(jié)性因素的消除,如圖4所示,再通過歸一化等方法處理;接著對新得到的時序數(shù)據(jù)集進(jìn)行劃分,將新的時序數(shù)據(jù)集分為訓(xùn)練集和測試集,將前81條數(shù)據(jù)作為訓(xùn)練集,后12條數(shù)據(jù)作為測試集。
圖4" EViews_X12方法圖
數(shù)據(jù)歸一化:本文通過最大最小標(biāo)準(zhǔn)化方法(Min-Max Normalization)進(jìn)行歸一化處理,將數(shù)據(jù)縮放到[0,1]的范圍內(nèi),使得原始數(shù)據(jù)得到一個標(biāo)準(zhǔn)且變化平滑的數(shù)據(jù)集,計算方式如式(6)所示:
(6)
將歸一化后的數(shù)據(jù)集分為訓(xùn)練集和驗證集,通過Adam算法更新模型的權(quán)重和偏差,經(jīng)過反復(fù)訓(xùn)練進(jìn)而調(diào)整模型的超參數(shù)。得到預(yù)測結(jié)果后,需將預(yù)測結(jié)果進(jìn)行反標(biāo)準(zhǔn)化處理,將縮放的預(yù)測值轉(zhuǎn)換回原始的房價范圍,從而與原始值進(jìn)行對比。
2)初始化LSTM模型,本文采用LSTM標(biāo)準(zhǔn)的三層模型結(jié)構(gòu):輸入層、LSTM層和輸出層。初始化各參數(shù)值,構(gòu)建LSTM神經(jīng)網(wǎng)絡(luò)模型,包括迭代數(shù)、批處理數(shù)、神經(jīng)元個數(shù)等參數(shù)。采用ReLU函數(shù)作為隱藏層的激活函數(shù),進(jìn)而應(yīng)用Adam優(yōu)化器對模型整體進(jìn)行優(yōu)化處理,使其具備更有效的調(diào)整學(xué)習(xí)率的能力。這有助于優(yōu)化模型訓(xùn)練過程,有效預(yù)防梯度爆炸問題的發(fā)生。
3)采用PSO算法對LSTM進(jìn)行參數(shù)優(yōu)化,粒子通過前一個粒子的最優(yōu)位置,不斷地進(jìn)行位置和速度的更替,而空間范圍內(nèi)所有的粒子又同步向最優(yōu)位置的粒子進(jìn)行追蹤,進(jìn)而不斷更新粒子的位置和速度,從而得到全局最優(yōu)位置,通過全局尋優(yōu)計算出最優(yōu)粒子,從而得到LSTM的最優(yōu)參數(shù),提高預(yù)測模型的準(zhǔn)確度。
4)將PSO得到的最優(yōu)參數(shù)帶入LSTM模型,其中迭代次數(shù)150,隱藏元120,學(xué)習(xí)率0.04。模型使用區(qū)域二手房價數(shù)據(jù)進(jìn)行學(xué)習(xí),通過LSTM神經(jīng)網(wǎng)絡(luò)深入分析時序數(shù)據(jù),挖掘其中的潛在趨勢以預(yù)測第1時間步的房價價格。在預(yù)測第2時間步時,通過調(diào)整滑動窗口,將第1時間步的預(yù)測房價價格加入訓(xùn)練集,以訓(xùn)練模型預(yù)測第2時間步的房價價格。隨后,循環(huán)此過程,預(yù)測至第n時間步后停止。對輸出的預(yù)測值進(jìn)行反歸一化的處理,得到最終的預(yù)測結(jié)果。
5)模型驗證輸出評價指標(biāo),采用RMSE和MAPE進(jìn)行預(yù)測評估。兩者評估值越小,代表PSO-LSTM模型的性能就越好。
2.3" 實驗環(huán)境
本文的實驗采用64位的Win 10系統(tǒng),處理器為AMD Ryzen 5 2500U with Radeon Vega Mobile Gfx,主頻2.00 GHz,內(nèi)存8 GB,在Python3環(huán)境下通過Jupyter Notebook實現(xiàn)全部實驗過程。
2.4" PSO-LSTM模型擬合效果分析
在時序預(yù)測領(lǐng)域中,由于傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)預(yù)測存在梯度爆炸、梯度消失等問題,從而導(dǎo)致訓(xùn)練難度大,而LSTM神經(jīng)網(wǎng)絡(luò)模型的出現(xiàn),改善了這一情況。因此,本文在模型的對比分析中采用LSTM模型與PSO-LSTM模型作為比對組,預(yù)測結(jié)果如圖5所示。
圖5" 各預(yù)測數(shù)據(jù)擬合圖
由圖可看出PSO-LSTM模型的模型擬合度比LSTM神經(jīng)網(wǎng)絡(luò)模型的模型擬合度更接近實際值。且在2022年5月份的轉(zhuǎn)折處,PSO-LSTM模型的值更貼近于實際值。LSTM模型的整體預(yù)測趨勢與實際值的整體趨勢有偏離,而PSO-LSTM模型的整體趨勢更優(yōu)于LSTM模型,更符合二手房價實際的趨勢走向,很好地提升了預(yù)測精度。
3" 實驗結(jié)果與分析
本文采用預(yù)測評估公式RMSE和MAPE來對模型的預(yù)測結(jié)果進(jìn)行計算并預(yù)測評估,在對PSO-LSTM和LSTM模型的預(yù)測數(shù)據(jù)進(jìn)行評估后得到的數(shù)據(jù)值,RMSE和MAPE的評估值越小,則代表模型的性能就越好。從預(yù)測訓(xùn)練結(jié)果對比表表1中可看到,PSO-LSTM模型的RMSE值為137.28,相較LSTM降低了19.5%;而PSO-LSTM模型的MAPE值僅為1.59,比LSTM模型降低了22.05%。由評估預(yù)測值證實了PSO-LSTM模型的預(yù)測效果要優(yōu)于LSTM模型。
表1" 模型預(yù)測訓(xùn)練結(jié)果對比
預(yù)測模型 類別 RMSE MAPE
LSTM 時間序列模型 170.54 2.04
PSO-LSTM 神經(jīng)網(wǎng)絡(luò) 137.28 1.59
由實驗結(jié)果證實了:通過PSO算法對LSTM模型進(jìn)行優(yōu)化可以很好地提升預(yù)測的精度,且優(yōu)化后的模型能更好地適應(yīng)大量的數(shù)據(jù)訓(xùn)練,使得預(yù)測的精度大大提升,對實際數(shù)據(jù)的曲線擬合效果好。相較LSTM神經(jīng)網(wǎng)絡(luò)模型,對真實數(shù)據(jù)的擬合效果更好,且預(yù)測評估也優(yōu)秀。從上述評估角度可得出,PSO-LSTM模型對于區(qū)域二手房價的預(yù)測有更好的預(yù)測精度,能夠給買家、金融業(yè)、房地產(chǎn)業(yè)等提供更為可靠和科學(xué)的二手房價預(yù)測。
4" 結(jié)" 論
為了提升區(qū)域二手房價的預(yù)測精度,消除影響因素,達(dá)到更好的擬合趨勢,本文提出了一種基于PSO-LSTM的區(qū)域二手房價預(yù)測方法,通過引入PSO算法對LSTM模型進(jìn)行優(yōu)化,從而實現(xiàn)預(yù)測精度的提升。通過與LSTM神經(jīng)網(wǎng)絡(luò)模型的實驗對比分析,PSO-LSTM模型預(yù)測方法能更好地對金融業(yè)、房地產(chǎn)業(yè)等產(chǎn)業(yè)進(jìn)行高精度的預(yù)測,提供了合理且科學(xué)的預(yù)測參考。本文對PSO-LSTM的預(yù)測方法相較LSTM模型取得了更好的效果,預(yù)測精度也有提升,但對于整體的預(yù)測來說,并不能達(dá)到理想的預(yù)期。后續(xù)擬嘗試新的算法結(jié)合本文中基于LSTM的區(qū)域二手房價預(yù)測方法進(jìn)行創(chuàng)新,通過多因素變量的分析,進(jìn)一步提升區(qū)域二手房價的預(yù)測精度。
參考文獻(xiàn):
[1] 王英偉,馬樹才.基于ARIMA和LSTM混合模型的時間序列預(yù)測 [J].計算機應(yīng)用與軟件,2021,38(2):291-298.
[2] 陳孝文,蘇攀,吳彬溶,等.基于改進(jìn)長短期記憶網(wǎng)絡(luò)的時間序列預(yù)測研究 [J].武漢理工大學(xué)學(xué)報:信息與管理工程版,2022,44(3):487-494+499.
[3] 蔡兆暉,曾凱,陳秋強.結(jié)合集合經(jīng)驗?zāi)B(tài)分解的LSTM神經(jīng)網(wǎng)絡(luò)在大宗商品價格預(yù)測應(yīng)用研究 [J].冶金經(jīng)濟(jì)與管理,2023(4):52-56.
[4] 許鈺林,康孟珍,王秀娟,等.基于深度學(xué)習(xí)的玉米和大豆期貨價格智能預(yù)測 [J].智慧農(nóng)業(yè):中英文,2022,4(4):156-163.
[5] 程先龍,保佑智,何度江,等.基于EMD-ELM-LSTM的短期風(fēng)電功率預(yù)測 [J].昆明理工大學(xué)學(xué)報:自然科學(xué)版,2023,48(6):78-87.
[6] 方雪清,吳春胤,俞守華,等.基于EEMD-LSTM的農(nóng)產(chǎn)品價格短期預(yù)測模型研究 [J].中國管理科學(xué),2021,29(11):68-77.
[7] 高華睿,郝龍,王明明,等.基于Att-Bi-LSTM的高速公路短時交通流預(yù)測研究 [J].武漢理工大學(xué)學(xué)報,2020,42(9):59-64.
[8] 于家斌,尚方方,王小藝,等.基于遺傳算法改進(jìn)的一階滯后濾波和長短期記憶網(wǎng)絡(luò)的藍(lán)藻水華預(yù)測方法 [J].計算機應(yīng)用,2018,38(7):2119-2123+2135.
[9] 滿建峰,侯磊,楊凱,等.基于PSO-LSTM混合模型的天然氣管道多用氣節(jié)點負(fù)荷預(yù)測研究 [J].油氣與新能源,2022,34(6):91-100.
[10] 高海翔,胡瑜,余樂安.基于分解集成的LSTM神經(jīng)網(wǎng)絡(luò)模型的油價預(yù)測 [J].計算機應(yīng)用與軟件,2021,38(10):78-83.
[11] 呂柏行,郭志光,趙韋皓,等.標(biāo)準(zhǔn)粒子群算法的優(yōu)化方式綜述 [J].科學(xué)技術(shù)創(chuàng)新,2021(28):33-37.
作者簡介:周昌堉(1996—),男,漢族,廣東汕頭人,碩士研究生在讀,研究方向:數(shù)據(jù)分析、智能信息處理;李長云(1971—),男,漢族,湖南衡陽人,教授,博士,研究方向:軟件理論、物聯(lián)網(wǎng)工程、人工智能。