楊月 盧伊
摘要:大數據時代的到來使得對數據的迅速捕捉和實時分析顯得至關重要。相比傳統商業智能軟件,新型商業智能軟件使用的輕量建模形式能夠迅速響應需求變動。Tableau正是這樣一款定位于數據可視化敏捷分析和完成商務智能的展示工具。利用Tableau進行初步可視化分析及高級可視化分析,極大地提高數據分析與操作的效率。此次研究以沿海城市三亞市為研究對象,從使用角度介紹Tableau數據分析軟件在房價分析中的使用技巧,并將數據以可視化形式展現出來,分析結果發現臨海距離是影響三亞市房產價格的主要因素之一,而交通狀況及住宅面積對于房價的影響并不是最為主要的,對研究影響三亞市房價乃至沿海城市的房價的主要驅動因素有著至關重要的作用。
關鍵詞:大數據;商務智能;Tableau;數據可視化;旅游
中圖分類號:F293 文獻標識碼:A
文章編號:1005-913X(2019)05-0053-03
Analysis of housing price main driving factors in coastal cities
——Take Sanya City as an example
Yang Yue1, LuYi2
(university of sanya, SanYa 572000;2. Taizhou Sunshine Property Insurance Co. Ltd, TaiZhou 318000)
Abstract: The arrival of the era of big data has made the rapid capture of data and real-time analysis essential. Compared with the drawbacks of traditional business intelligence software, the lightweight modeling used by new business intelligence software can quickly respond to changes in demand. Tableau is exactly such a display tool that is aimed at data visualization, agile analysis and completion of business intelligence. Use Tableau for preliminary visual analysis and advanced visual analysis to greatly improve the efficiency of data analysis and operation. This study takes the coastal city of Sanya as the research object, introduces the use of Tableau data analysis software in the analysis of house prices from the perspective of use, and presents the data in a visual form. The analysis found that the coastal distance is the price of real estate in Sanya. One of the main factors, and the impact of traffic conditions and housing area on housing prices is not the most important, and it is of crucial importance to study the main driving factors affecting housing prices in Sanya City and even coastal cities.
Key words: Big data; Business intelligence; Tableau; Bata visualization; Tourism.
隨著數字化技術的普遍使用和信息化程度的不斷提高,人類正在逐漸跨入大數據時代。當然,發達國家充分意識到這一發展趨向,紛紛將大數據上升為國家的重要策略。[1]2015年8月中國國務院通過了《關于促進大數據發展的行動綱要》,推動了大數據的進一步發展。在企業中,數據已成為一種新的重要策略資產,更多的企業選擇了強化數據資產管理,并且開設專門的組織或確定相干的責任部門,大力開展數據分析與運用。數據分析順應時代發展的潮流,作用越來越大。[2]一方面,海量的數據中藏匿了諸多有價值的信息,通過有用的數據分析與發掘,提出適合的業務建議,能夠有效地提高企業競爭力;但從另一方面來看,這樣卻增加了數據監測、分析任務的難度。傳統的數據分析理念、數據分析工具愈加難以順應新的發展情勢。對此,急需提出新的手段和措施,于是高效率的數據分析方法與工具順運而生。Tableau作為一款定位在數據可視化敏捷開發和完成商業智能展示的工具,能夠用來實現交互式的、可視覺化的數據分析和儀表板使用,進而協助企業迅速地了解和知道數據,以此面對不斷變化的市場環境與挑戰。[3]
一、Tableau的主要特性
一是極速高效。在Tableau的高性能數據引擎中導入數據,它便會以極快的速度開始工作。結束時,只要一下單擊便可以完成,過程無需編程。Tableau 的內置裝置能在操作的瞬間將數百萬行的數據轉變為答案。當然也能夠直接點擊 Tableau左上角的菜單鍵選擇連接到快速數據庫、多維數據集,分析實時數據。用戶可以依據自身需要在這兩選項間切換。[4]二是簡單易用。Tableau 是一個直接式的拖拽式工具,用戶能夠直觀的看到其操作帶給整體視圖的每一個變化,數據隨使用者的思路變化而變化演變的過程,得到極速的顯示。[5]三是便捷的數據源聯接功能。Tableau的數據源聯接功能最重要的在于隨時隨地,無需準備只要聯接任何一種數據源就能夠開始分析數據。它可以直接與任何文件、電子表格、數據體、數據庫以及數據倉庫相聯接。其動態連接方式讓用戶能夠對每分鐘的數據都十分清楚。四是完美的數據整合功能。強大的數據處理功能,專注結構化數據(如Excel、數據庫)處理,數據引擎速度極快,在幾秒鐘內可完成上億行數據處理,經過智能化可視化模式的選擇,把干枯無味的數據用簡單、親和、美觀的圖表模式展示。[6]Tableau懂得辨認數據字段且會為字段歸類,自動創建劃分的維度和度量,在確定了維度和度量之后,在Tableau中就可以通過鼠標拖拉拽的方式實現自主式分析。同時,它能夠把兩個數據源整合到同層,并且可以在一個數據源篩選出另一個數據源,并讓篩選出的數據在數據源里突出顯示,這種超強的數據整合能力實用性很大。五是優秀的數據分析實踐工具。在斯坦福大學中問世,結合了諸多博士的智慧而最終實現的 Tableau,在成為優秀的數據分析工具這條路上走上正軌。從活潑的顏填充模式,再到有豐富有內涵的經典模式,Tableau必定可以幫助使用者找到最適合的影響因素的數據描述方式。[7]
二、三亞市房價的成交情況
作為一款主打簡便智能操作的商業軟件,通過簡單的拖放數據字段信息即可形成可視化圖形。此外,Tableau除了沒有復雜的代碼編輯,儀表盤(控制臺)也可完全自定義配置。在儀表板上,不但可以監測信息,而且還提供完整的分析能力。筆者通過收集整理鏈家網上的三亞市新房數據,整理出三亞市房價統計數據,利用輕量級的BI 軟件Tableau作為分析工具,對三亞市房價數據展開多維度分析,通過多種形式的圖表,呈現出房價與地段、空間等方面的關系。
(一)文字云分析
文字云作為一種優秀的圖形展現方式,這種圖形可以看到三亞市所有出售的樓盤。通過連接到數據源三亞市房價統計數據后,做如下操作:將字段“樓盤”拖至【文本】標記,將字段“成交平均價”設置度量“平均值”,并將該字段拖至【大小】標記,將字段“區域”拖至【顏色】標記。然后從【智能顯示】菜單鍵中挑選并單擊“填充氣泡圖”。從【標記】菜單鍵下拉選項中選擇“文本”,此時結果如下圖1所示。
圖1中說明,字體越大,說明房屋成交額越高,當鼠標滑過任意字段,該字段中將出現該樓盤的詳細信息。
(二)條形圖分析
若要看三亞市2018年3月份各區域間樓盤成交價之間的對比情況。其操作如下:雙擊字段“區域”、“樓盤”自動顯示在列功能區。雙擊字段“成交平均價:萬元”自動顯示在行功能區。接著將字段“成交平均價:萬元”拖拽到【標記】里附屬的【顏色】一欄,圖表就能夠依據數值的大小而變化顏色的深淺,十分直觀(柱形圖的高度代表著住房的總額)。在界面左上角處找到【分析】選項,為圖表添加每一個區的平均值線。得到如下圖2所示。
從圖2可以看出三亞市海棠區樓盤的平均成交額最高,為2674萬元。其中住房成交額最高的樓盤是吉陽區的亞龍灣壹號樓盤。就目前來看,房源最多的地區集中在三亞吉陽鎮。崖州地區的開售的樓盤數量最少。
三、主要驅動因素分析
本小節使用Tableau嘗試分析三亞市房價的某些重要的驅動因素。這里考慮的因素主要有:交通狀況(高鐵)、臨海距離、住宅面積等。
在因素分析中,首先考慮的是高鐵距離。操作如下:一是導入數據源,將字段中“城市”(三亞)的地理角色設置為“城市”,雙擊字段“城市”,此時Tableau會自動界定區域。為了能夠精確的知道每個樓盤所在的地理位置,以不同的顏色代表指定的位置,可以在地圖中導入各樓盤的經緯度。選擇菜單【地圖】中的【編輯位置】操作,依次導入經緯度。這里的經緯度數據是從源數據中導入的,由于此次涉及的數據量較少,經緯度的數據是在百度地圖中搜素位置查詢經緯的。
這樣每個樓盤的具體位置得到精確,再次點擊字段“樓盤”,地圖中將出現多個藍色的點,每個點表示一套樓盤。當鼠標劃過各點,將出現相應的樓盤名稱。二是將字段“樓盤”拖至【標記】中的【標簽】、【顏色】。字段“區域”拖至【標記】中的【詳細信息】。【標記】的填充類型選擇“地圖”。菜單欄中選擇【地圖】——【地圖層】,勾選“街道和高速公路”“海岸線”及“地名”等選項。為了使地圖更加美觀,選擇背景顏色“黑色”。三是將字段“平均成交價:萬元”拖至標記中的“大小”。然后將字段“高鐵距離”拖至標記中的“顏色”,設置顏色“紅色—藍色發散”。這樣操作的目的是:設置“高鐵距離”為因子,住房的“成交額”為因變量。在地圖中,據高鐵距離影響圓圈的顏色,與高鐵距離越近的樓盤,其位置上的圓圈的顏色就越紅;與高鐵距離越遠的樓盤,其位置上的點就越藍。住房的成交額影響圓圈的大小,該房屋的價格越高,圓圈就越大。操作結果如下圖4所示。
從圖4中觀察到,無論是離高鐵距離近還是遠,住房的成交額都沒有呈現出明顯的趨勢變化。這就在一定程度上說明了據高鐵的距離并不是驅動高房價的主要因素。
其次,考慮的是住宅建筑面積,設置“住宅建筑面積”為因子,住房的“成交額”為因變量。步驟和上述高鐵距離因素分析類似,結果得到如下圖5所示。
從圖5中觀察到圓圈的面積大小差異不大,在一定角度上說明了房屋面積并不是房價高的主要因素。
然后考慮的是臨海距離。三亞市畢竟是以旅游業為重心發展的城市,三亞市的樓盤也大多為旅游地產。所以考慮到這一因素。為了驗證此猜想,設置“臨海距離”為因子,住房的“成交額”為因變量。結果得到如下圖6所示。
從圖6中可以清楚的發現,圓點較大的大多都靠近海岸線一帶,離海越近的圓圈紅色顏色越深。到此可以由數據歸納出一個可能的結論:三亞市是以旅游業為發展的城市,其充分利用海景等資源推動三亞市旅游地產的發展。特別海棠灣、亞龍灣等地區,離海距離近,風景宜人,成為了該地區在三亞市內房價較高的一個驅動因素。
通過利用Tableau數據分析軟件對三亞市樓盤地理位置、成交額和對樓盤附近交通狀況、臨海距離的比較及樓盤室內空間大小、樓盤類型的分析,數據顯示,三亞市內房源在吉陽鎮最為密集,天涯鎮房源最少。另外,通過觀察圖表可以得到這樣一個結論:三亞市作為一個旅游勝地,高房價的影響因素極大程度與樓盤所處的臨海距離有關,而交通狀況及住宅面積對于房價的影響并不是最為主要的。從三亞也可以輻射出其他沿海城市房價的主要影響因素,對研究一些沿海城市的房價影響因素有著重要的意義。
參考文獻:
[1] 戴國忠,陳 為.信息可視化和可視分析: 挑戰與機遇——北戴河信息可視化戰略研討會總結報告[A].中國科學:信息科學,2013(1).
[2] 高 屹.信息可視化技術研究分析[J].科技創新與應用,2016(1).
[3] 飛 揚.2015年度中國大數據綜合服務提供商Top100[J].互聯網周刊,2016(2).
[4] 張 志.Tableau在華設立分公司幫助客戶掌握數據的力量[J].技術前沿,2015(9).
[5] 王 眾.帶著蘋果基因的BI工具[J].IT經理世界,2016(3).
[6] 馬正杰.商業智能軟件對比評測:FineBI和Tableau[J].中國IT研究中心,2016(4).
[7] 余國勇.Tableau9.3為數據分析、分享和協作提速[J].信息通信技術,2016(4).
[責任編輯:譚志遠]