999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

房價大數據分析模型構建方法

2017-05-17 12:52:49陸紅
數字技術與應用 2017年3期
關鍵詞:大數據

陸紅

摘要:大數據分析有很多方法,由于大數據的特點、數據量大、非結構化、屬性不確定等特點,建立大數據分析模型比較困難,本文通過房價大數據分析案例,介紹如何通過機器學習構建大數據分析模型的途徑和方法,文章重點介紹了如何準備大數據分析模型的訓練數據方法,介紹了房價大數據分析模型機器學習算法、機器學習路徑,大數據分析模型構建方法等,為從事大數據分析的研究人員提供一些可借鑒的經驗和方法。

關鍵詞:大數據;分析模型;房價

中圖分類號:TP399 文獻標識碼:A 文章編號:1007-9416(2017)03-0137-02

1 引言

大數據分析首先要建立一個分析模型,分析模型是大數據分析的基石,只有先建立了模型才能對大數據進行分析。構建大數據分析模型傳統的方法很難實現,大數據非結構化、屬性很難預知,通過數學、統計學等方法構建大數據分析模型都比較困難,機器學習是構建大數據分析模型最有效的方法之一。機器學習通過不斷地學習優化、不斷地迭代逼近所要的模型。

2 訓練數據準備

機器學習構建大數據分析模型的方法是通過訓練數據將模型訓練出來。從要研究的大數據對象中找出訓練集。機器學習分為監督學習和非監督學習,監督學習需要教師,監督機器學習的結果,事先設定好學習目標,期望的結果。非監督學習的數據一般都無標簽,學習結果事先也無法預知,通過數據可視化等方法觀察學習結果。

房價大數據分析模型機器學習屬于監督學習,期望預測值極大地逼近真實值。首先需要采集房價數據作為訓練數據,然后設計房價大數據分析模型機器學習算法,計算機通過機器學習算法和學習路徑學習訓練數據,學習目標是預測的結果極大地逼近真實數據,通過反復迭代,不斷地接近目標,訓練出所希望的模型。

3 數據清洗

清洗后的訓練數據如下:

間數(x1) x1 2 x1 2 x1 3 x1 3 x1 3 x1 3 x1 2 x1 2 x1 2 x1 3 x1 3 x1 3 x1 2 x1 2 x1 1 x1 3 x1 3 x1 3 x1 3 x1 1 x1 2 x1 2 x1 2 x1 2 x1 2 x1 3 x1 2 x1 3 x1 2 x1 2 x1 3 x1 2 x1 2 x1 3 x1 3 x1 3 x1 2 x1 3 x1 2 x1 1 x1 2 x1 2 x1 2 x1 2

面積(x2) x2 126 x2 99 x2 134 x2 137 x2 135 x2 138 x2 104 x2 99 x2 105 x2 126 x2 112 x2 116 x2 88 x2 90 x2 79 x2 120 x2 155 x2 158 x2 161 x2 66 x2 108 x2 88 x2 111 x2 103 x2 104 x2 131 x2 105 x2 130 x2 102 x2 105 x2 148 x2 98 x2 100 x2 128 x2 110 x2 101 x2 121 x2 127 x2 103 x2 67 x2 78 x2 71 x2 81 x2 77

價格(y1) y1 460 y1 425 y1 515 y1 580 y1 630 y1 600 y1 425 y1 439 y1 435 y1 608 y1 460 y1 460 y1 410 y1 380 y1 340 y1 520 y1 685 y1 680 y1 630 y1 328 y1 532 y1 405 y1 495 y1 470 y1 480 y1 690 y1 480 y1 690 y1 462 y1 495 y1 540 y1 440 y1 510 y1 599 y1 395 y1 450 y1 455 y1 595 y1 403 y1 295 y1 315 y1 345 y1 355 y1 335

4 房價大數據分析模型機器學習算法

機器學習首先要設計機器學習學習算法,設計機器學習學習路徑,機器學習解決的問題通??煞譃轭A測和分類兩類問題。首先我們分析一下要解決的問題是屬于預測問題還是分類問題,然后選擇相應的學習算法,設計學習路徑,通過訓練數據訓練和機器學習構建大數據分析模型。模型通過訓練數據訓練出來以后,對模型進行檢驗,然后不斷進行優化,以達到我們所期望的精度。

以下是梯度下降機器學習算法和學習路徑:

首先建立一個估值函數(模型)如下:

x為自變量(特征參數),h(x)為應變量(房價的估值),希望求出此函數的系數θ0、θ1,構成一個完整的函數,此函數就是我們要構建的大數據分析模型。

我們建立一個成本函數,希望預測值與真實值的差趨近于0,也就是成本函數值趨近于0。

J(Θ0, Θ1)=

其中:

X(I)表示向量X中的第i個元素;

Y(I)表示向量Y中的第i個元素;

表示已知的假設函數;

m為訓練集的數量;

Gradient Descent梯度下降方法機器學習步驟:

(1)先隨機選定一個初始點;

(2)確定梯度下降方向;

(3)通過實驗確定下降步伐,學習率Learning rate;

(4)通過不斷地遞歸,收斂到極小值;

通過梯度下降法使成本函數趨于0,在此條件下求得自變量的系數θ0和θ1,將此θ0和θ1帶入到函數中得到我們要的模型。

下面是介紹如何運用梯度下降法,經過反復迭代求出θ0和θ1:

梯度下降是通過不停的迭代,最后沿梯度下降到最低點,收斂到一個我們滿意的數據,誤差趨近于0時迭代結束,此時的θ0和θ1正是我們要求的函數自變量的系數,有了θ0和θ1,這個假設的函數就建立起來了,這個函數就是我們要建的大數據分析模型。

梯度下降法分為批量梯度下降法和隨機梯度下降法,批量梯度下降法速度較慢,每次迭代都要所有訓練數據參與;隨機梯度下降精度差一些,容易在極值周圍震蕩;房價大數據分析模型采用的是實時數據梯度下降法(Real Time Online Gradient Descent),可以隨著房價的變化隨時修正模型的參數。

5 構建房價大數據分析模型

通過數據可視化,我們可以看到房價數據趨于線性,所以我們采用線性回歸構建房價大數據分析模型。采用監督學習,先給定一個訓練集,根據這個訓練集學習出一個線性函數,然后檢驗這個函數訓練的好壞,即此函數是否足夠擬合訓練集數據,不斷優化模型減少殘差,最大限度地接近真實值。

假設房價大數據分析模型:

y=aX1+bX2

通過梯度下降法,不斷遞歸,最后使假設值與實際值之差趨近于0,求得此時的模型變量系數a、b,構建線性函數(房價大數據分析模型)。模型通過回歸診斷、交叉驗證不斷進行優化,直到誤差達到要求。

以下是采用機器學習算法構建的房價大數據分析模型,用R語言編寫房價大數據分析模型程序如下:

令:a=q1;b=q2;

將訓練數據以數據框的形式存儲。

pricedata<-data.frame(

x1<-c(2,2,3,3,3,3,2,2,2,3,3,3,3,2,2,1,3,3,3,3,1,2,2,2,2,2,3,2,3,2,2,3,2,2,3,3,3,2,3,2,1,2,2,2,2),

x2<-c(126, 99, 134 , 137 , 135 , 138 , 104 , 99 , 105 , 105 , 126 , 112 , 116 , 88 , 90 , 79 , 120 , 155 , 158 , 161 , 66 , 108 , 88 , 111 , 103 , 104 , 131 , 105 , 130 , 102 , 105 , 148 , 98 , 100 , 128 , 110 , 101 , 121 , 103 , 67 , 78 , 71 , 81 , 77),

y<-c(460, 425, 515 , 580 , 630 , 600 , 425 , 439 , 435 , 435 , 608 , 460 , 460 , 410 , 380 , 340 , 520 , 685 , 680 , 630 , 328 , 532 , 405 , 495 , 470 , 480 , 690 , 480 , 690 , 462 , 495 , 540 , 440 , 510 , 599 , 395 , 450 , 595 , 403 , 295 , 315 , 345 , 355 , 335));

構造梯度下降算法函數,初始點q1=0、q2=0;下降速率d=0.0001。

grd2<-function(){

q1=0;

q2=0;

d=0.0001;

i=0;

m=9;

plot(y~x1+x2,data=pricedata,pch=16,col='red');

通過反復迭代得出估值函數系數q1、q2。

while (i<100000)

{

i=i+1;

q1=q1-d/m*(q1*x1+q2*x2-y)*x1;

q2=q2-d/m*(q1*x1+q2*x2-y)*x2;

}

return(q1);

return(q2);

}

grd2();

model2<-grd2();

summary(model2);

通過summary(model2)匯總出模型變量系數。

plot(model2);

通過數據可視化檢驗擬合情況,不斷優化房價大數據分析模型。

猜你喜歡
大數據
基于在線教育的大數據研究
中國市場(2016年36期)2016-10-19 04:41:16
“互聯網+”農產品物流業的大數據策略研究
中國市場(2016年36期)2016-10-19 03:31:48
基于大數據的小微電商授信評估研究
中國市場(2016年35期)2016-10-19 01:30:59
大數據時代新聞的新變化探究
商(2016年27期)2016-10-17 06:26:00
淺談大數據在出版業的應用
今傳媒(2016年9期)2016-10-15 23:35:12
“互聯網+”對傳統圖書出版的影響和推動作用
今傳媒(2016年9期)2016-10-15 22:09:11
大數據環境下基于移動客戶端的傳統媒體轉型思路
新聞世界(2016年10期)2016-10-11 20:13:53
基于大數據背景下的智慧城市建設研究
科技視界(2016年20期)2016-09-29 10:53:22
數據+輿情:南方報業創新轉型提高服務能力的探索
中國記者(2016年6期)2016-08-26 12:36:20
主站蜘蛛池模板: 一级做a爰片久久毛片毛片| 亚洲精品无码久久久久苍井空| 成人精品午夜福利在线播放| 久久77777| 狠狠ⅴ日韩v欧美v天堂| 97超级碰碰碰碰精品| 国产区成人精品视频| 91在线激情在线观看| 国产精品永久不卡免费视频| av免费在线观看美女叉开腿| 青青青伊人色综合久久| 粉嫩国产白浆在线观看| 99人体免费视频| 久久综合激情网| 成年人免费国产视频| 久久精品丝袜| 精品99在线观看| 成人毛片免费观看| 久草中文网| 国产欧美综合在线观看第七页| 久久毛片网| 91在线丝袜| 无码人妻热线精品视频| 永久毛片在线播| 欧美福利在线| 2020精品极品国产色在线观看 | 乱人伦中文视频在线观看免费| 久久国产黑丝袜视频| av天堂最新版在线| 92午夜福利影院一区二区三区| 亚洲手机在线| 全部免费毛片免费播放| 九九热在线视频| 欧美成一级| 国产av无码日韩av无码网站| 无码'专区第一页| 国产无码精品在线| 操操操综合网| 一本大道无码日韩精品影视| 婷婷综合在线观看丁香| 国产精品爆乳99久久| 色综合热无码热国产| 亚洲 欧美 偷自乱 图片 | 久久精品人人做人人| 又爽又大又黄a级毛片在线视频| 国产尤物在线播放| 久久精品国产电影| 国产一级在线播放| 久久黄色视频影| 久久天天躁狠狠躁夜夜躁| 久久久精品无码一二三区| 亚洲精品视频网| 国产成人一区在线播放| 国产亚洲欧美日韩在线一区二区三区| 亚洲精品人成网线在线| 白浆免费视频国产精品视频| 国产欧美自拍视频| 女人一级毛片| 国产白浆视频| 国产屁屁影院| 亚洲日韩第九十九页| 国产欧美高清| 在线看免费无码av天堂的| 欧美一道本| 欧美无遮挡国产欧美另类| 成人在线综合| 亚洲欧美日韩中文字幕一区二区三区 | 欧美成一级| 青青青国产视频手机| 成人午夜天| 亚洲美女一区| 国产三级成人| 国产乱人乱偷精品视频a人人澡 | 中国黄色一级视频| 亚洲视频a| 欧美不卡二区| 久久香蕉国产线| 国产不卡国语在线| 国产精品一区二区在线播放| 国产另类视频| 中文字幕欧美日韩高清| 福利在线不卡一区|