999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于隱馬爾科夫模型的時空序列預測方法*

2016-04-13 09:52:47柳姣姣禹素萍何風行李鳳榮
網絡安全與數據管理 2016年1期
關鍵詞:模型

柳姣姣,禹素萍,吳 波,姜 華,何風行,李鳳榮

(1.東華大學 信息科學與技術學院,上海 201620;2.中國科學院上海高等研究院 公共安全中心,上海 201210;3.中國科學院上海微系統與信息技術研究所 無線傳感網與通信重點實驗室,上海 200050)

基于隱馬爾科夫模型的時空序列預測方法*

柳姣姣1,2,禹素萍1,吳 波2,姜 華2,何風行2,李鳳榮3

(1.東華大學 信息科學與技術學院,上海 201620;2.中國科學院上海高等研究院 公共安全中心,上海 201210;3.中國科學院上海微系統與信息技術研究所 無線傳感網與通信重點實驗室,上海 200050)

提出了一種基于時空密度聚類的隱馬爾科夫模型對時空序列進行預測的方法。時空序列與一般的時間序列相比,最主要的特征是其時空依賴性以及時空非平穩性。針對如何有效地預測不同尺度分布的時空序列的問題,本文采用基于時空密度聚類的隱馬爾科夫模型,該模型不僅能分析時空序列在時間和空間上的相關性,而且可以通過時空序列的分段有效地去除噪聲,提高模型預測的精度。本文采用該模型對藥品冷藏庫中的時空序列溫度數據進行分析預測,并與其他預測模型比較,結果顯示本文提出的方法更準確有效。

密度聚類;隱馬爾科夫模型;時空序列預測

0 引言

近年來國內外對時間序列的分析研究[1]取得了很多重要的研究成果,但是對時空序列的分析研究還比較少。時空序列是時間序列在空間上的擴展,是指在空間上有相關關系的多個時間序列的集合,時空序列數據是具有空間信息的時間序列數據集。

目前對時空序列數據[2]的建模與預測方法大致可以分為兩類:基于時序的預測方法,如時空自回歸移動平均模型(STARMA)、時空神經網絡(STANN)、時空支持向量機(STSVM)[3]等;基于因果預測方法,如地理加權回歸(GWR)[4]等。STARMA模型只適合對平穩時空序列進行預測,然而大多數時空序列在時間域和空間域上都顯示著非平穩的特征;STANN模型和STSVM模型雖然預測效果較為不錯,但是它們有一個共同點,即模型對歷史樣本的依賴程度非常大,而時空序列經常出現波動,錯誤的樣本會嚴重影響預測的精度。GWR方法是一種局域空間分析的方法,展示了研究區域內部空間關系的變化,對研究區域整體趨勢有一定的局限性。

本文提出一種基于時空密度聚類[5]的隱馬爾科夫模型(Hidden Markov Model,HMM)[6]對時空序列進行預測。首先采用CP-PLR算法[7]對原始時空序列進行分段,然后采用基于時空密度的聚類方法對時空數據進行聚類,最后通過隱馬爾科夫模型進行數據預測,將預測結果與其他模型的預測結果相比較,驗證了該模型的高精度性、高有效性。

1 問題建模

針對本文的情況,假設給定一個空間內的一個時空序列,其在二維空間內的分布情況如圖1所示。

圖1 時空序列的空間分布平面圖

本文采用隱馬爾科夫模型對時空序列進行預測,模型運行的原理是在原始時空序列中獲得模型所需要的隱狀態序列,而獲得隱含狀態的序列就需要先解決對原始時空序列的聚類問題。由上圖可知,時空序列在空間內的分布不均勻,如果將時間與空間分別進行相似性的度量,不能很好地結合二者,而且聚類后的結果具有很大的偏差,這樣將導致預測精度嚴重降低。

根據時空序列時間和空間上的鄰近性,在時空聚類分析中,傳統的距離度量準則難以直接用來描述時空實體間的相似性,本文需要采用特殊的時空聚類方法,該聚類方法在兼顧時空相關性的同時還能很好地對時空序列進行度量,而密度的概念對此是可以直接適用的。要得到基于時空密度聚類的隱馬爾科夫模型,首先必須解決以下幾個問題:(1)如何將原始帶噪聲的時空序列很好地分段而且達到去噪的目的;(2)如何將分段后的時空序列根據時空相關性進行聚類。

2 算法架構

基于時空密度聚類的隱馬爾科夫預測模型的整體架構如圖2所示。首先采用分段算法將原始時空序列進行分段,然后采用ST-DBSCAN算法對分段數據聚類,利用聚類的結果建立隱馬爾科夫模型,最后對時空序列進行狀態預測。

圖2 基于時空密度聚類的隱馬爾科夫模型架構

3 時空序列的聚類

時空序列數據與一般的時間序列數據和空間數據相比,時空依賴性(或相關性)、時空異質性(或非平穩性)是其最主要的特征。時空數據是時間和空間的組合,空間數據和時間序列的一些性質在時空域中并不完全保持一致,例如在時間軸上信息是有明確的過去、現在和未來順序的,這種特征在空間域上并不存在,但是時空域卻繼承了這種時空特性。

3.1 時空序列的分段

本文采用一種基于轉折點的PLR方法(CP-PLR)進行時空序列的分段。首先通過搜索原始時空序列X={x1,x2,…xn}中的轉折點,并將這些轉折點用直線段連接起來,就得到了時空序列的一種分段線性表示,獲得分段后的時空序列轉折點的集合為S={xt1,xt2,…,xtN},N為轉折點的數量,tN=n,終點默認為轉折點。CP-PLR方法能有效地發現原始序列中形態變化明顯的關鍵點,識別并剔除序列中的噪聲干擾,能有效地壓縮數據,并保持較小的擬合誤差。

時空序列數據聚類分析過程中,不僅需要考慮時空序列的空間鄰近性,而且需要考慮在時間上體現的相似性。針對時空序列所具有時空相關性,為很好地對時空序列進行聚類,本文采用基于時空密度聚類中的ST-DBSCAN算法[8]。

時空密度聚類是空間密度聚類在時空域上的擴展,其采用密度作為實體間相似性的度量標準,將時空簇視為一系列被低密度區域(噪聲)分割的高密度連通區域。2006年,Wang等人在DBSCAN算法[9]的基礎上進一步考慮了時間維,發展了一種基于密度的時空聚類方法ST-DBSCAN,針對ST-DBSCAN算法需要過多輸入參數的缺點,參考文獻[10]中給出了經驗設置方法。

3.2 時空序列的聚類方法

ST-DBSCAN算法可以解決空間屬性、非空間屬性和時間屬性的聚類問題。本文對分段后的數據集合S進行聚類,即當空間內的兩個點同時滿足空間鄰近性與時間鄰近性兩個要求時則將兩點歸為一類[11]。聚類后的數據就可以用來建立隱馬爾可夫模型。聚類公式為:

(1)

(2)

Eps1表示空間屬性半徑,Eps2表示非空間屬性半徑。存在兩個點M(x1,y1,t1)和N(x2,y2,t2),其中x,y代表空間屬性,t代表非空間屬性。當M和N同時滿足式(1)和式(2)時,M和N點為Eps鄰近。

3.3 基于時空密度聚類的隱馬爾科夫模型

隱馬爾可夫模型[12]是以馬爾科夫鏈為基礎演化而來。模型可以表示為λ=(A,B,π),其中狀態轉移概率矩陣A={aij},aij表示t時刻從狀態Si轉移到狀態Sj的概率;根據節點采集的原始數據計算出可觀察符號的概率分布矩陣B={bik};初始狀態概率πi=P(q1=si),它表示在初始時刻選擇某個狀態的概率。隱馬爾科夫模型的基本組成如圖3所示。

一個確定的隱馬爾科夫模型可以產生觀測序列O={o1,o2,…,oT},ot表示在t時狀態為Si的觀察值。那么在隱馬爾科夫模型和隱藏狀態序列已知的情況下,隱藏狀態序列和可觀察狀態序列O的聯合概率為:

P(O,Q|λ)=P(O|Q,λ)P(Q|λ)

(3)

其中,P(O,Q|λ)為觀察序列O的概率,P(Q|λ)為隱藏狀態序列在此隱馬爾科夫模型下的概率。由于式(3)在隱馬爾科夫模型計算中計算量非常大,所以本文采用后向算法來解決概率計算的問題。根據以上兩步確定的隱馬爾科夫模型λ,定義在時刻t且狀態為qi的前提下,從t+1到T的部分觀測序列Ot+1,Ot+2,…,OT的概率為后向概率,記作:βt(i)=P(Ot+1,Ot+2,…,OT|st=qi,λ),最終的概率公式為:

(4)

本文采用隱馬爾科夫模型作為對時空序列進行預測的系統模型,通過聚類算法處理時空序列獲得幾個隱含狀態,從而將時空序列預測問題轉化為狀態預測問題。

通過聚類算法聚類S序列,并將聚類看作K個隱狀態,基于時空密度聚類就可以建立狀態轉移矩陣A。同時以分段后的序列S作為觀測對象建立隱馬爾科夫模型,由式(4)產生預測序列的概率。

最后采用維特比算法預測最優的狀態序列:

4 實驗驗證

利用基于密度聚類的隱馬爾科夫模型對藥品冷藏庫內的溫度進行預測,采用均方根誤差來衡量模型預測的精度,并且對同一個時空序列采用時空神經網絡(STANN)、地理加權回歸(GWR)分別對其進行下一時刻溫度的預測,實驗中每隔15 min預測一次,然后計算均方根誤差的值,最后將三個模型的誤差值進行比較。衡量預測精度的均方根誤差公式為:

(5)

其中,Xmodel,i為下一時刻溫度的觀測值,Xobs,i為模型的預測值,n為預測的次數,均方根誤差的值越小說明預測精度越高。圖4為基于時空密度的隱馬爾科夫模型對藥品冷藏庫內溫度預測方法與STANN模型、GWR方法預測誤差值的比較曲線圖。

圖4 模型預測誤差對比曲線圖

從圖4中可以看出,本文提出的基于時空密度聚類的隱馬爾科夫模型對時空序列的預測具有較高的精度,在進行多步預測之后,誤差增長較小,而其他兩種模型的預測精度要遠低于基于時空密度聚類的隱馬爾科夫模型對時空序列的預測,而且隨著預測步數的增長,預測誤差也越來越大。

5 結束語

在隱馬爾科夫預測模型的基礎上,針對時空序列不同于時間序列的特性,本文提出了基于時空密度聚類的隱馬爾科夫模型。首先根據時空密度聚類出隱馬爾科夫模型所需的隱狀態,然后采用隱馬爾科夫模型對隱狀態序列進行預測。經實驗驗證,該模型能夠很好地預測時空序列,而且由于在處理原始時空序列的過程中能去除其中的噪聲,因此預測精度較高。

[1] 章登義,歐陽黜霏,吳文李.針對時間序列多步預測的聚類隱馬爾科夫模型[J].電子學報,2014(12):2359-2364.

[2] Cao Liying, San Xiaohui, Zhao Yueling,et al. The application of the spatio-temporal data mining algorithm in maize yield prediction[J]. Mathematical and Computer Modelling,2013,7(1):507-513.

[3] 王佳璆.時空序列數據分析和建模[D].廣州:中山大學,2008.

[4] 劉美玲.時空地理加權回歸模型的統計診斷[D].西安:西安建筑科技大學,2013.

[5] STRAUSS C, ROSA M B, STEPHANY S. Spatio-temporal clustering and density estimation of lightning data for the tracking of convective events[J]. Atmospheric Research,2013,8(1):98-102.

[6] 彭子平,張嚴虎,潘露露.隱馬爾科夫模型原理及其重要應用[C].2008年中國信息技術與應用學術論壇,2008:138-139.

[7] 方如果.基于相似性分析的時間序列數據挖掘算法研究[D].杭州:浙江大學,2011.

[8] 唐建波,鄧敏,劉啟亮.時空事件聚類分析方法研究[J].地理信息世界,2013(1):38-45.

[9] Jiang Hua, Li Jing, Yi Shenghe,et al. A new hybrid method based on partitioning-based DBSCAN and antclustering[J]. Expert Systems With Applications,2011,38(8):9373-9381.

[10] BIRANT D, KUT A. ST-DBSCAN: an algorithm for clustering spatial-temporal data[J]. Data & Knowledge Engineering,2007,60(1):208-221.

[11] 張麗杰,李廉水,朱慧云.一種帶有虛擬變量的密度聚類算法[J]. 系統工程,2011,29(10):112-118.

[12] 章棟兵,姚寒冰,顏昕. 基于隱馬爾科夫模型的語義傾向性研究[J]. 微型機與應用,2010,29(17):71-73.

A method of spatio-temporal sequence prediction based on hidden Markov model

Liu Jiaojiao1,2, Yu Suping1, Wu Bo2, Jiang Hua2,He Fenghang2, Li Fengrong3

(1.School of Information Science and Technology, Donghua University, Shanghai 201620, China;2.Public Security Center, Shanghai Advanced Research Institute, Chinese Academy of Sciences, Shanghai 201210, China;3.Laboratory of the Wireless Sensor Networks and Communications, Chinese Academy of Sciences Shanghai Institute of Microsystem and Information Technology, Shanghai 200050, China)

A method of spatio-temporal sequence prediction based on hidden Markov model of spatio-temporal density clustering is proposed in this paper. Compared with the general time sequences, the most important features of spatio-temporal sequence are the spatial and temporal dependence and non-stationary. For the problem of how to effectively predict the spatio-temporal sequence of different scales, a hidden Markov model based on temporal and spatial density clustering is used. The model can not only analyze the correlation between time and space, but also can effectively remove the noise and improve the accuracy of the model prediction. In this paper, the model is used to analyze the temperature data of the drug storage. We compare this model with other prediction models. The results show that the proposed method is more accurate and effective.

density clustering; hidden Markov model; spatio-temporal sequence prediction

中國科學院無線傳感網與通信重點實驗室開放課題(2013001);廣東省中國科學院全面戰略合作項目(2012B090400031)

TP301.6

A

1674-7720(2016)01-0074-03

柳姣姣,禹素萍,吳波,等.基于隱馬爾科夫模型的時空序列預測方法[J].微型機與應用,2016,35(1):74-76,80.

2015-09-08)

柳姣姣(1990-),女,碩士研究生,主要研究方向:無線傳感網絡。

禹素萍(1977-),女,博士,副教授,碩士生導師,主要研究方向:機器視覺與圖像處理、模式識別。

吳波(1980-),男,碩士研究生,工程師,主要研究方向:無線傳感網絡。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 国产精品无码一二三视频| 国产91麻豆视频| 国产精品成人久久| 一级片免费网站| 国产精品久久久久久搜索| 亚洲一级毛片免费观看| 亚洲a免费| 中字无码av在线电影| 亚洲国产精品美女| 国产精品专区第1页| 在线播放国产99re| 国产乱人免费视频| 女人18一级毛片免费观看| 中文字幕 欧美日韩| 欧美一级特黄aaaaaa在线看片| 亚洲αv毛片| 午夜无码一区二区三区| 国产嫩草在线观看| 国产成人1024精品| 亚洲熟女中文字幕男人总站| 国内精品免费| 九九香蕉视频| 欧美激情二区三区| 久久香蕉欧美精品| 老司机久久精品视频| 午夜啪啪福利| 欧美丝袜高跟鞋一区二区| 波多野结衣视频一区二区| 91精选国产大片| 亚洲a级在线观看| 亚洲综合狠狠| 欧美色伊人| 国产一区二区丝袜高跟鞋| 亚洲天堂啪啪| 国产日本欧美在线观看| 日本成人不卡视频| h视频在线播放| 欧美精品综合视频一区二区| 久久国产免费观看| 亚洲人成电影在线播放| 亚洲国产91人成在线| 中文字幕欧美成人免费| 日韩A∨精品日韩精品无码| av在线无码浏览| 青草91视频免费观看| 波多野结衣中文字幕一区| 97久久精品人人| 国产美女一级毛片| 亚洲成av人无码综合在线观看| 国产成人精品视频一区二区电影| 亚洲第一区精品日韩在线播放| a毛片在线免费观看| 天天色综网| 免费一级全黄少妇性色生活片| 中文国产成人精品久久一| 91精品国产自产在线观看| 国产一区二区三区夜色| 青青草91视频| 国产日韩欧美在线视频免费观看| 日韩欧美91| 国产欧美日韩在线一区| 国产免费网址| 国产综合亚洲欧洲区精品无码| 亚洲日本精品一区二区| 亚洲色欲色欲www网| 日韩精品成人在线| 亚洲综合色在线| 亚洲一级毛片在线观播放| 国产对白刺激真实精品91| WWW丫丫国产成人精品| 日韩精品成人网页视频在线| 亚洲美女操| 99视频在线看| 亚洲AⅤ无码日韩AV无码网站| 婷婷色中文网| 成人在线观看一区| 国产激爽大片在线播放| 四虎影视无码永久免费观看| 高清大学生毛片一级| 日韩高清中文字幕| 亚洲成aⅴ人片在线影院八| 中文字幕在线日韩91|