999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于SVM的共享單車需求預測

2019-08-17 07:39:58黃同愿劉渝橋
關鍵詞:效果模型

宋 鵬,黃同愿,劉渝橋

(1.重慶市住房公積金管理中心, 重慶 401121; 2.重慶理工大學 兩江人工智能學院, 重慶 401135;3.四川大學 計算機學院, 成都 610044)

1 概述

共享單車是指在公共場所不固定使用者的自行車單車共享分時租賃服務,它的出現開啟了共享經濟的時代,解決了城市內“最后一公里”的問題,既解決了資源閑置又方便出行。然而,隨著規模擴大、用戶增多,各種問題和瓶頸也接踵而至。

首當其沖的是“亂”,共享單車隨用隨取、隨停隨還,但這一特點導致它在發展的過程中出現亂停亂放現象也只是時間問題,對城市空間的管理以及城市的美化造成了極大的困擾;緊隨其后的是“費”,共享單車的初衷是共用共享、經濟節約,但一味的擴張、過多的投放量造成了極大的浪費,背離了共享經濟的初衷,必然導致后繼發展無力;最后是“不均”,共享單車營運是基于廣大用戶,具有顯著的流動性,城市是一個大的場景,各個區域的單車分布常常出現不均的情況,有的區域人多車少,有的區域人少車多,用戶體驗不佳。

要想解決共享單車“亂”與“費”的困局、突破“不均”的枷鎖,實現共享單車平穩、有序、健康、綠色、可持續發展,根本上是實現供需平衡,即共享單車的投放與用戶的需求相適應、相匹配。而用戶的需求是一個動態的過程,會隨著各種因素變化而變化,故通過對各因素的分析,用戶需求可呈現一定的可預測性,動態調整共享單車區域投放數量、協調資源、智能調度,降低運營成本、提高用戶體驗、增強服務質量,對共享單車行業的可持續發展具有重大意義。

共享單車需求預測具有重要意義、良好前景、深遠影響,并且根據研究現狀,結合已有數據進行需求預測具有可行性,許多學者和研究人員在這個研究方向上做出了不懈的努力。

2016年,黃同愿等[1為了對股票價格進行預測,采用了支持向量機以及人工神經網絡進行對比仿真實驗,并通過不同支持向量機核函數的對比構造了效果較好的預測模型,在一定程度上實現了股票價格的預測。

2017年,張建寬等[2]采用支持向量機以及最小二乘支持向量機預測股票價格的漲跌,并通過實驗仿真證實了支持向量機在股票價格預測場景上預測的可行性,具有較穩定的預測效果。

2018年,成波[3]通過機器學習機制進行了校園網絡故障診斷的研究,彌補了傳統方式在故障診斷、自學習能力方面不強的短板,為網絡故障的及時、準確定位提供了重要的支撐保障。

通過這些學者以及研究人員的研究可以看出:在由數據支持的預測場景中,采用支持向量機可以達到預測分析目的,因此基本確定了通過支持向量機構建預測模型進行共享單車需求預測的研究路線。

2 需求預測研究理論基礎

2.1 共享單車需求預測實現的原理

共享單車的需求受到各種因素如時間、季節、節假日、天氣、溫度、濕度、風速等左右和影響。在一天的時間中,共享單車白天的需求明顯大于夜晚,同時又存在早晚高峰,同天中呈現雙波峰、兩波谷,波段變化的顯著特點;在全年不同季節,又呈春秋兩季高、夏冬兩季低的分布態勢;同時受其他因素擾動,最終形成迥異的時序需求,具有較大的研究意義。結合各因素數據與需求的關系,可以建立行之有效的預測模型,并不斷利用現有數據對模型進行訓練與優化,強化凸顯數據與需求的關系,有效預測后續需求變化,得出真正需求,做到先知先覺。在實際應用過程中,不僅僅需實現預測,還需盡可能提高預測的準確率以及縮短預測消耗時間,增強時效性與精準性,原理如圖1所示。

圖1 共享單車需求預測原理

2.2 共享單車需求預測實現的步驟

由已知數據關系來預測后續數據關系,實現預測的原理,非常符合支持向量機的應用場景,故采用支持向量機來實現預測切實可行。一般地,支持向量機進行預測的實現步驟有4個,依次是數據處理(消噪、歸一化、訓測分類)、模型訓練(訓練數據)、模型測試(測試數據)、預測實用,是一個動態遞進的關系。基礎是已知數據集,是整個預測過程實現和不斷完善的動力,模型的訓練和測試是實現預測的具體過程,實際應用是預測的結果輸出與價值實現,具體實現步驟如圖2所示。

2.3 共享單車需求預測常用算法

由需求預測步驟以及實現原理可知:要想得到更好的預測效果,就必須在每一個步驟、每一個環節上采用適合數據以及應用場景的算法,如降低數據噪聲的小波消噪算法、降低數據維度的主成分分析算法、構建預測模型的支持向量機算法。

2.3.1小波消噪

數據信號都存在或多或少的噪聲數據,一方面增加了數據體量,增加復雜度、影響時效性;另一方面又對模型構建產生擾動,降低準確率,干擾穩定性,數據噪聲是一切基于數據進行分析過程中首要克服的困難。小波消噪實際上通過短波實現噪音消除,首先對含噪聲信號進行小波變換,然后對變換得到的小波系數進行某種處理,以去除其中包含的噪聲,最終對處理后的小波系數進行小波逆變換,得到去噪后的信號[4]。實質上是在小波母函數伸縮和平移版本所展成的函數空間中,根據提出的衡量準則,尋找對原信號的最佳逼近,以完成原信號和噪聲信號的區分,這一過程實際上就是低通濾波,是一種保留信號特征的低通濾波,不是單純去掉信號,而是尋求信號特征與整體逼近的折中,如圖3為小波消噪原理圖。

2.3.2主成分分析

主成分分析運用統計方法,將存在相關性的變量轉換為不相關的變量。當變量之間具有相關性時,可以認為是對最終結果信息有重疊的影響,會加大后續分析的復雜性,太過冗余。而主成分分析將具有相關性的變量通過數學手段變換后進行刪除,重新構造盡可能少的不相關的新變量,同時使這些變量對最終的結果依然具有原來的影響。而根據共享單車運營數據的特點可以發現,主成分分析算法十分適用[5]。

2.3.3支持向量機

支持向量機是一種以結構風險最小化為基礎的凸二次優化問題算法,不像以經驗風險最小化原理為基礎的算法一樣得到局部最優解,得到的極值解都是全局最優解。支持向量機(SVM)是由Vapnik于1992年提出的一種機器學習方法,對于解決小樣本、高維數、非線性以及局部最優解等問題有著顯著效果[6]。

支持向量機的基本思想是通過一個非線性映射,將數據集映射到高維特征空間,并在該空間內回歸擬合。

非線性映射函數表達式為:

根據表達式可以看出:只需考慮K(xi,xj)=φ(xi)·φ(xj),則K(xi,yj)為核函數,運用不同的核函數構建的模型具有不同的性能,對不同情況的數據具有不同的處理能力。由于支持向量機對非線性數據進行分析處理時,往往會通過核函數映射將非線性數據轉化為線性數據,因此數據的復雜度直接決定了核函數的種類,核函數的種類又直接影響了最終模型的性能,故而核函數的選取要根據數據的復雜度及所需達到的分析程度來決定。

核函數的準確性受自身參數的影響,設置不同的核參數會不同程度地影響最終模型的性能,因此在參數的選取上需要有依據,可以采用較科學的選優方式對參數進行訓練,得到最適合數據分析的參數,構建性能最佳的模型[7]。

通過對數據以及實際研究需求進行分析,機器學習可以有效構建共享單車需求預測模型,并通過大量數據進行訓練,不斷優化模型,使需求預測更加準確和迅速。支持向量機可用來構建預測模型,并通過對比基于不同核函數的支持向量機構建的預測模型從而得到最佳預測模型,并應用于實際中,而需求預測效果主要體現在預測準確率及預測分析消耗時間。

3 數據處理

原始數據集為某共享單車品牌在某個區域內需求情況,包含時間、季節、節假日、工作日、天氣、實際溫度、體感溫度、濕度、風速、未注冊用戶租借數、已注冊用戶租借數、總租借數,共計十二維數據,數據集記錄了由2016年1月起到2017年12月中每個月1號到19號的共享單車運營數據,其中每日從0點到23點進行24次數據記錄,共計10 886條數據。

第1列到12列分別為:

datetime:時間

season:季節,1=春,2=夏,3=秋,4=冬

holiday:節假日,0:否,1:是

workingday:工作日,0:否,1:是

weather:天氣,1:晴天,2:陰天,3:小雨或小雪,4:惡劣天氣(大雨、冰雹、暴風雨或者大雪)

temp:實際溫度,℃

atemp:體感溫度,℃

humidity:濕度,相對濕度

windspeed:風速

casual:未注冊用戶租借數量

registered:注冊用戶租借數量

count:總租借數量

根據時序序列對整個數據集中共享單車的需求進行刻畫,如圖4所示。

由圖4可知:由于每天以及每年的需求量波動類似,呈現周期性、逐年遞增的變化態勢,根據這一特性可以將由日期和時間構成的數據列進行量化,去除日期,將0∶00—23∶00轉化為0—23,方便后續模型構建,訓練優化。

數據集橫向一行為一條數據,一列為一個數據屬性,根據訓練及測試的要求,以及總的數據集體量,可以把10 886條數據的前8 583條劃分為訓練集,剩余的2 303條劃分為測試集,既有足夠的數據進行模型訓練和優化,又有足夠的測試數據對模型的有效性進行充分驗證。

3.1 消噪

消除數據集無效、異常數據稱為數據的消噪,數據消噪可以減少噪聲數據對整個預測模型的擾動,有利于降低模型復雜度,提高預測精度以及降低預測運行時間,強化預測效率,是開始構建模型前應該而且必須進行的步驟。數據集含有10 886條數據,數據最小間隔為1 h,在整體圖形上細節顯示較為明顯,當某個時刻數據出現異常時,勢必會影響數據的連續性與科學性,最終作用在預測模型上,產生負面影響。

針對共享單車數據的特點,選擇較為科學的小波消噪方法,修剪細節,突出趨勢,保證數據的連續性與科學性[8]。

小波消噪實際上通過短波實現噪音消除,首先對含噪聲信號進行小波變換,然后對變換得到的小波系數進行某種處理,以去除其中包含的噪聲,最終對處理后的小波系數進行小波逆變換,得到去噪后的信號,仿真結果如圖5所示。

圖5 數據集小波消噪圖

由圖5可以看出:數據大體趨勢沒有發生改變,基本上實現了強化整體、弱化細節的作用,對于預測模型的構建具有一定的促進作用。

3.2 降維

通過收集到的原始數據可以看出:用來進行共享單車需求預測的原始數據有12個屬性,同時屬性間并不獨立,相互關聯影響,具有特征屬性多、相關性強的特點,不利于需求的預測[9]。屬性多即維數高,相關性強即冗余多,屬性冗余會對分析運算產生干擾,大大增加預測時間及模型復雜度,而屬性的關聯又會降低模型的可靠性,導致結果不理想,甚至分析失敗。因此,必須精簡特征屬性,降低相關性,這是研究的需要,也是實際情況的選擇,最終目的就是得到既能承載數據包含的大部分信息又盡可能多地降低屬性個數,削減數據間關聯度,降低數據的維度,否則分析的難度太大,復雜度過高,分析時間太長[10]。

通過對數據集進行主成分分析仿真,方差貢獻率及累計方差貢獻率如圖6所示。

圖6 主成分分析結果

通過累計方差貢獻率以及閾值0.85可以將原除去需求標簽以外的11維數據集降維為7維數據集,設7維分別為y1~y7,并通過特征向量與原數據集11維x1~x11對原數據集進行重構,則

y1=-0.279x1+0.616 2x2-0.407 3x3-

0.258x4-0.028 7x5-0.105 3x6-

0.121 8x7-0.011x8+0.520 8x9+

0.105 3x10-0.028 6x11

y2=-0.087 1x1+0.337 0x2+0.677 1x3+

0.405 5x4-0.120 5x5+0.051 2x6+

0.029 7x7-0.074 5x8+0.360 9x9-

0.314 6x10+0.056 4x11

y3=0.357 5x1+0.483 2x2+0.035 4x3+

0.029 2x4-0.160 9x5-0.340 1x6-

0.319 6x7+0.064 3x8-0.471 8x9+

0.025x10+0.406 9x11

y4=0.420 2x1-0.032 3x2+0.113 2x3-

0.051 6x4+0.768 4x5-0.075 1x6-

0.086 6x7+0.232 2x8+0.333 5x9+

0.071 5x10+0.181 8x11

y5=0.098 3x1-0.032x2-0.584 8x3+

0.736 1x4+0.051 3x5+0.055 2x6+

0.051 4x7-0.043 8x8+0.081 4x9-

0.242 4x10+0.172 7x11

y6=0.270 1x1-0.383 2x2+0.010 9x3-

0.0463x4-0.285 8x5-0.311 8x6-

0.329 9x7-0.547 6x8+0.399 6x9+

0.117 4x10+0.129 9x11

y7=0.265 7x1+0.161 6x2+0.013 5x3-

0.041 1x4-0.136 7x5+0.483 8x6+

0.4797x7-0.231x8+0.068 5x9+

0.455 5x10+0.3913x11

3.3 歸一化

通過消噪及降維處理后,由于數據各屬性之間的量級不同,會造成屬性間的差異,量級大的數據屬性會對預測模型產生大的影響,量級小的數據屬性則對預測模型沒有太大的影響,不符合實際情況,需要使每個數據屬性對最終預測結果有著同等重要的影響,故需要統一各屬性量級,消除量級差異帶來的巨大偏差。

將樣本進行歸一化處理,遵循的公式為[11]:

式中:xi為屬性中的第i個樣本數據;xmax和xmin為屬性的最大值和最小值。

圖7為10 886行,7列的數據集,每1行都可與需求構成關聯式,用以不斷訓練預測模型。

4 基于支持向量機的預測模型

根據數據集樣本以及實際應用場景,對于共享單車需求預測可采用支持向量機構建模型,但由于采用不同核函數的支持向量機性能各異,會影響預測模型效果,因此需要分別基于不同核函數進行仿真實驗,選擇效果最佳的模型。

圖7 歸一化前后效果對比

4.1 支持向量機與核函數

支持向量機預測實際上是通過映射函數將非線性的數據樣本映射到高維空間,然后回歸擬合,構建模型,實現預測,而映射的函數、映射空間不同,構建的模型不同,預測的效果也不一,則需要構建多種模型,選取效果最好的模型[12]。

支持向量機的預測過程主要思想就是把原來的低維數非線性問題轉化成更高維數的線性問題,從而便于求解,并且由于高維特征空間是通過核函數來定義和表示的,所以核函數能決定SVM模型的可靠性,影響最終效果。同時,核函數的學習過程是通過在線性子空間中計算來解決全局高維數問題的,類似于分治的思想,并未增加算法的復雜性。

核函數的選取非常重要,常見的核函數有[13]:線性函數K(xi,x)=xi·x;多項式核函數K(xi,x)=(xi·x+1)d;徑向基核函數K(xi,x)=exp(-(x-xi)/σ2);多層感知器函數K(xi,x)=tanh(kxi·x+θ)。

4.2 基于不同核函數的支持向量機預測模型

由支持向量機的原理可知:核函數為映射高維空間的法則,不同核函數造成了不同實際情況下支持向量機模型性能的區別,要選取符合實際情況的核函數,還需要從實際出發,分別進行實驗,通過對比最終確定。

為選取適當核函數進行預測,分別用不同核函數進行仿真對比,如圖8、9、10所示。

圖8 基于線性核函數的SVM預測結果對比

圖9 基于多項式核函數的SVM預測結果對比

圖10 基于徑向基核函數的SVM預測結果對比

線性核函數、多項式核函數、徑向基核函數三者SVM預測模型的效果對比見表1、2。

表1 各類型核函數預測模型效果對比

根據統計學經驗,將預測的效果進行量化,設平均相對誤差率為acc,預測模型得到的預測數值向量為YC[i],原始數值向量為YS[i],測試集樣本數量為n,則平均相對誤差率acc可以表示為

由上式可以看出:平均相對誤差率表示預測值相對于真實值的偏離百分比代數和的平均值,可以客觀反映預測的效果,將仿真實驗構建的各個預測模型的預測結果進行計算,得到表2。

由平均相對誤差率定義可知:當數值較小時,表示預測值與真實值的誤差越小,預測值整體越接近真實值,預測效果越佳;當數值較大時,表示預測值與真實值的誤差越大,預測值整體效果不佳,達不到預測的要求。

表2 需求預測模型誤差率對比

由圖8、9、10以及表1可知:當以徑向基核函數為支持向量機核函數時,構建的預測模型均方差最低,只有0.001 672,平方相關系數最高,有0.968 051,預測需求數值與實際需求數值基本上相當,表明該核函數下的模型最為精準,且這個預測過程耗時只有4.650 7 s,而其他兩種核函數構成的支持向量機預測模型效果均不如徑向基核函數,尤其是多項式效果比較差,而線性核函數稍弱于徑向基核函數。

根據表2中的誤差率可以看出:基于徑向基核函數的SVM預測模型效果最好。綜上所述,最終根據實驗仿真效果,選定基于徑向基核函數的SVM預測模型進行最終共享單車需求預測。

5 結束語

支持向量機對于分類和預測具有良好的效果,而共享單車的需求預測對于解決共享單車資源浪費、發展瓶頸、營運規劃等現存問題具有重要意義,通過現有數據結合支持向量機可以有效預測共享單車需求。同時,由于是通過數據訓練得到的模型,所以預測結果更加貼近真實情況,更具有實際應用意義。主成分分析及小波消噪算法的引入對預測過程具有促進作用,對于降低模型復雜度、縮減預測消耗時間、提升時效性都具有顯著效果。

通過支持向量機構建的回歸預測模型仿真實驗,模型的精確性、時效性、可靠性較好,適合基于當前數據集的需求預測,堅持以數據為基礎、以模型為準繩、以需求為目標,逐步優化、不斷訓練、反復測試,以期獲得更高的預測精準度。支持向量機構建的預測模型可以實現精準的需求預測,模型的構建是基于總數為10 886組的數據集,是在較小區域、不長時間、較小流動的情況下收集的數據,后續在擴大數據范圍、增大輻射區域、提升數據波動的情況下依然有待考證以及繼續優化,需要繼續探討在更大量數據、更復雜情況、更多樣場景下的應用。

猜你喜歡
效果模型
一半模型
按摩效果確有理論依據
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
迅速制造慢門虛化效果
抓住“瞬間性”效果
中華詩詞(2018年11期)2018-03-26 06:41:34
3D打印中的模型分割與打包
模擬百種唇妝效果
Coco薇(2016年8期)2016-10-09 02:11:50
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
3D—DSA與3D—CTA成像在顱內動脈瘤早期診斷中的應用效果比較
主站蜘蛛池模板: 波多野结衣一区二区三区四区视频| 国内精品视频| 日韩毛片视频| 毛片免费网址| 不卡色老大久久综合网| 亚洲欧美国产视频| 四虎AV麻豆| 日韩中文精品亚洲第三区| 亚洲AV色香蕉一区二区| 台湾AV国片精品女同性| 免费无遮挡AV| 狠狠综合久久久久综| 强奷白丝美女在线观看| 国产网站免费看| 久久综合九色综合97婷婷| 国产福利拍拍拍| 亚洲精品成人福利在线电影| 国产视频你懂得| 91人妻在线视频| 高清无码一本到东京热| 亚洲人成网站观看在线观看| 国产91麻豆免费观看| 天堂在线www网亚洲| 欧美性色综合网| 在线精品亚洲一区二区古装| 国产成人亚洲精品色欲AV| 久久久久久久久亚洲精品| 日韩精品久久久久久久电影蜜臀| 国产无码性爱一区二区三区| 国产成人久久777777| 亚洲一区二区约美女探花| 日韩欧美中文| 亚洲一区二区约美女探花| 青青热久麻豆精品视频在线观看| 亚洲第一天堂无码专区| 成人中文字幕在线| 日韩欧美中文亚洲高清在线| 国产高清在线丝袜精品一区| 久久精品aⅴ无码中文字幕| 在线观看无码av免费不卡网站| 亚洲国产中文在线二区三区免| 免费无码一区二区| 99在线观看免费视频| 欧美国产菊爆免费观看 | 中国一级特黄大片在线观看| 97超爽成人免费视频在线播放| 国产成人高清在线精品| 91精品国产自产91精品资源| 国产精品女熟高潮视频| 国产高清自拍视频| 狠狠色丁香婷婷综合| 亚洲欧美成人在线视频| 国产视频欧美| 国产精品3p视频| 制服丝袜国产精品| 日本国产一区在线观看| 欧美A级V片在线观看| 熟妇无码人妻| 最新国产在线| 亚洲午夜福利在线| 亚洲成aⅴ人片在线影院八| 8090成人午夜精品| 午夜欧美在线| 国产白浆在线| 色悠久久综合| 精品国产欧美精品v| 久久国语对白| 国产迷奸在线看| 色亚洲激情综合精品无码视频| 97se亚洲综合在线韩国专区福利| 精品久久蜜桃| 色国产视频| 精品人妻无码区在线视频| 人妻一区二区三区无码精品一区| 国产99热| 久久国产V一级毛多内射| 一级毛片基地| 二级特黄绝大片免费视频大片| 亚洲精品桃花岛av在线| 高清久久精品亚洲日韩Av| 久久女人网| 国产免费羞羞视频|