葉楚義 高群霞 李晶 吳成云 曾曉玲 羅創謙 蔡程健



摘? 要:隨著大數據與人工智能技術的興起,深度學習方法在房價投資方面有極大發揮空間。文章設計并實現了一個智能房價分析系統,主要包括基于LSTM的“房價預測”和基于情感分析的“輿情輿論”兩大模塊,可較好實現房價未來趨勢預測及輿情分析,為企業和投資者提供參考和指引。
關鍵詞:房價預測;LSTM;情感分析;數據可視化
中圖分類號:TP311.52? ? ? 文獻標志碼:A? ? ? ? ?文章編號:2095-2945(2019)34-0030-03
Abstract: With the rise of big data and artificial intelligence technology, deep learning method has a great space in housing price investment. In this paper, an intelligent housing price analysis system is designed and implemented, which mainly includes two modules, "housing price prediction" based on LSTM and "public opinion" based on emotion analysis, which can better realize the future trend prediction and public opinion analysis of housing price, and provide reference and guidance for enterprises and investors.
Keywords: housingprice prediction; LSTM; emotion analysis; data visualization
1 研究背景及意義
房價在當今金融市場中起著重要作用,是當前社會的焦點話題,準確預測房價的變化趨勢對購房者、地產商及政府都有很大幫助[1]。以往的預測方式是要對各項相關數據粗糙羅列、經驗方式設計參數權重,未考慮購房意愿、政府政策等人文因素的影響,預測準確性和置信度不理想。
本文運用機器學習、數據挖掘等方法,設計并實現了一個包含基于LSTM的“房價預測”和基于情感分析的“輿情輿論”兩大模塊的智能房價分析系統,可較好實現房價未來趨勢預測和輿論分析,為企業和廣大投資者提供指引和參考。
2 相關原理與技術
2.1 LSTM長短期記憶網絡
長短期記憶網絡LSTM(Long Short-Term Memory)是一種時間遞歸神經網絡,適合處理和預測時間序列中間隔和延遲相對較長的重要事件[2]。LSTM是對RNN(循環神經網絡)的改進,在算法中加入了一個判斷信息有用與否的“處理器”——cell,通過在cell中放置輸入門、遺忘門和輸出門三扇門實現判別。
2.2 情感分析算法
情感分析是自然語言處理(NLP)的一種,是一種可自動識別文本中主觀觀點和情感傾向的文本挖掘方法,目前被廣泛應用于Web信息挖掘、輿情追蹤等領域[3,4]。基于語義規則的情感分析模型是通過語義規則對帶有感情的主觀性文本進行評估,從而挖掘出文本中隱藏的情緒傾向[5,6]。
3 系統設計與實現
3.1 系統設計
系統主要包括房價預測和情感分析兩大模塊,系統整體架構和功能框架分別如圖1和圖2所示。通過爬蟲技術獲取房價數據和用戶評論數據;構建LSTM房價預測模型,結合歷史數據和各大決定因素預測未來房價走勢;構建情感分析模型,對投資者評論進行情感分析,獲得積極度、消極度和置信度等數據;通過Echarts繪圖庫和詞云圖將數據可視化處理后呈現給用戶。
3.2 系統實現
(1)數據分析統計與可視化
用戶登錄系統后,系統后臺將自動獲取用戶所在定位,并從后臺數據倉庫獲取對應數據,完成數據分析與統計,并以折線圖、熱力圖等方式呈現給用戶,如圖3和圖4所示。
(2)房價預測
用requests庫和爬蟲算法爬取安居客網站的房價數據,構建LSTM深度學習模型預測房價走勢。LSTM模型參數為:時間步time_step為20,rnn_unit參數為10,每一批次訓練樣例為60,輸入層維度為2,輸出層維度為1,學習率為0.0006,每一區域模型訓練的次數為5000次,為防止val_loss逐漸增大,導致過擬合現象,使用Dropout技術進行控制,參數為0.5。
房價預測效果如圖5示,可看出預測數值和原始數值高度貼合,能提供一個未來走勢供用戶參考,y軸值將用來展示單位數據元/m2,x軸表示年月。
(3)情感分析
根據用戶輸入的樓盤地址爬取樓盤相關評論信息,使用jieba庫實現分詞和詞頻統計,繪制彩色詞云圖;通過百度情感分析API實現語句情感傾向判斷,獲取消極度、中性,積極度,并以餅圖形式呈現,如圖6所示。
4 結束語
本房價分析系統能很好實現房價預測、情感分析、數據可視化等功能,具有較好應用前景。由于房價市場受多種因素的影響,增加多種數據集及數據量可進一步提高預測效果。
參考文獻:
[1]常誠.基于多模態信息融合的房地產價格預測系統的設計與實現[D].北京郵電大學,2019.
[2]張佳禹.基于深度學習算法的上市公司投資決策支持模型研究[D].遼寧師范大學,2018.
[3]王曉艷.公眾輿情與房價波動的灰色關聯分析——基于網絡輿情的內容分析[J].上海商學院學報,2018,19(03):39-46.
[4]KEVIN JATI KURNIAJAYA.基于新聞情感分析的房價預測研究[D].哈爾濱工業大學,2018.
[5]吳江,唐常杰,李太勇,等.基于語義規則的Web金融文本情感分析[J].計算機應用,2014,34(02):481-485+495.
[6]吳雁.金融微博細粒度情感分析研究與應用[D].華南理工大學,2018.