999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

透明計算中用戶訪問行為特征分析與預(yù)測

2018-08-20 03:42:38侯翔宇李偉民盛津芳
計算機工程與應(yīng)用 2018年16期
關(guān)鍵詞:特征用戶

王 斌,陳 琳,侯翔宇,李偉民,盛津芳

WANG Bin,CHEN Lin,HOU Xiangyu,LI Weimin,SHENG Jinfang

中南大學(xué) 信息科學(xué)與工程學(xué)院,長沙 410083

School of Information Science and Engineering,Central South University,Changsha 410083,China

1 引言

近年來,云計算作為網(wǎng)絡(luò)計算模式的典型代表,使計算由軟硬件為中心轉(zhuǎn)變?yōu)槊嫦蚍?wù)的模式,能夠根據(jù)終端用戶的需求把服務(wù)端的存儲和計算資源傳輸?shù)娇蛻舳薣1]。透明計算是云計算的一個特例,是一種以用戶為中心的新型服務(wù)模式,旨在為用戶提供無處不在的透明服務(wù)。

透明服務(wù)平臺作為透明計算服務(wù)端的核心,負責(zé)統(tǒng)一存儲并管理多個用戶的資源,包括操作系統(tǒng)、應(yīng)用程序和用戶數(shù)據(jù)[2-3]。同時還要快速高效、安全和可靠地處理各用戶發(fā)送的資源訪問請求,以保證用戶的服務(wù)體驗質(zhì)量。透明服務(wù)平臺采用基于虛擬磁盤的方案來實現(xiàn),在終端用戶看來,服務(wù)端存儲的是終端的虛擬磁盤數(shù)據(jù),終端對虛擬磁盤的訪問請求最終被重定向到服務(wù)平臺[4]。針對透明服務(wù)端如何提高用戶的虛擬磁盤數(shù)據(jù)訪問效率和安全可靠性,文獻[5]設(shè)計了一個局域網(wǎng)中高效可靠的塊級存儲訪問協(xié)議NSAP(Network Storage Access Protocol)。文獻[6]分析驗證了基于虛擬磁盤的透明計算系統(tǒng)性能瓶頸在于服務(wù)端,而cache的命中率又是服務(wù)端性能表現(xiàn)最關(guān)鍵的因素,最后在服務(wù)端和客戶端制定了緩存分配策略。文獻[7]提出了一個評估透明計算多級高速緩存層次結(jié)構(gòu)以及整個透明計算系統(tǒng)的行為和性能的模擬框架TranSim。通過使用TranSim,系統(tǒng)設(shè)計者可以方便快捷地評估緩存策略的有效性和系統(tǒng)性能。

如上所述,目前關(guān)于透明計算服務(wù)端性能優(yōu)化和安全可靠性保障的研究側(cè)重于自身的存儲架構(gòu)、調(diào)度策略和訪問協(xié)議,但沒有研究工作從透明計算需求的源頭:用戶以及用戶訪問行為的特征來分析和預(yù)測其對透明服務(wù)平臺的影響。如文獻[8]提出了基于關(guān)注關(guān)系和用戶行為的物品推薦算法。文獻[9]通過記錄學(xué)生學(xué)習(xí)操作行為,并結(jié)合傳感器數(shù)據(jù),提出一種場景感知分類算法。文獻[10]結(jié)合訪存敏感和用戶行為敏感的MPSoC應(yīng)用映射技術(shù),提出一種混合的動態(tài)映射策略。文獻[11]分析了多臺終端加載相同操作系統(tǒng)過程中數(shù)據(jù)的訪問信息,發(fā)現(xiàn)用戶行為具有集中和相似的特征。因此,本文在構(gòu)建基于多層虛擬磁盤存儲模型的透明服務(wù)平臺基礎(chǔ)上,首先對大量用戶訪問服務(wù)平臺數(shù)據(jù)塊的行為進行統(tǒng)計分析,并利用信息熵策略挖掘出被頻繁集中訪問塊的時序特征。然后利用三次指數(shù)平滑方法預(yù)測未來一段時間用戶對這些塊的訪問行為。最終結(jié)果可以為服務(wù)平臺制定更高效的緩存策略提供有效的依據(jù),進而幫助透明服務(wù)端提高服務(wù)性能和體驗質(zhì)量。

2 透明服務(wù)平臺存儲模型及訪問機制

透明服務(wù)平臺位于透明計算服務(wù)端,它為用戶屏蔽了硬件平臺和操作系統(tǒng)的異構(gòu)性,統(tǒng)一集中管理系統(tǒng)資源,并轉(zhuǎn)化為服務(wù)提供給用戶。因此,透明計算用戶自主可控地按需使用服務(wù)的過程本質(zhì)是對透明服務(wù)平臺數(shù)據(jù)訪問的行為。透明服務(wù)平臺的架構(gòu)和原理決定了用戶數(shù)據(jù)訪問的機制,是用戶行為分析的基礎(chǔ)。

透明服務(wù)平臺存儲了所有透明終端用戶的虛擬磁盤數(shù)據(jù),但透明計算需要面對大量異構(gòu)的終端用戶,如果數(shù)據(jù)共享程度不高,會導(dǎo)致大量的數(shù)據(jù)冗余。為此,本文所構(gòu)建的透明服務(wù)平臺中,實現(xiàn)了一個多層樹狀虛擬磁盤存儲模型,如圖1所示。虛擬磁盤中數(shù)據(jù)資源按資源共享程度及性質(zhì)劃分成3類:系統(tǒng)資源、應(yīng)用群組資源和用戶個性化資源。系統(tǒng)資源主要指操作系統(tǒng)以及相關(guān)數(shù)據(jù),該類資源共享程度最高,能被所有用戶共享,所構(gòu)成的鏡像稱為系統(tǒng)虛擬磁盤鏡像(System Virtual Disk Image,S_VDI)。應(yīng)用群組資源主要指各種相關(guān)的應(yīng)用軟件數(shù)據(jù)組成的集合,具有相同的應(yīng)用屬性的應(yīng)用軟件通常歸為一個群組。該類資源只能被同一群組下的用戶共享,所構(gòu)成的鏡像稱為群組虛擬磁盤鏡像(Group Virtual Disk Image,G_VDI)。用戶個性化資源主要指用戶的私有數(shù)據(jù)資源,一般包括用戶私有文件或者操作系統(tǒng)、應(yīng)用軟件的個性化配置信息,該資源僅用戶自身才能訪問,所構(gòu)成的鏡像稱為用戶虛擬磁盤鏡像(User Virtual Disk Image,U_VDI)。

在面對多終端用戶對共享層資源同時進行訪問時,采用寫時重定向(Redirect on Writing,ROW)機制來進行控制。具體做法是:將系統(tǒng)虛擬磁盤鏡像S_VDI和群組虛擬磁盤鏡像G_VDI以只讀的方式存儲于服務(wù)端,共享給多個終端用戶;采用ROW機制將終端用戶對共享的虛擬磁盤鏡像S_VDI和G_VDI的改寫塊保存于與用戶對應(yīng)的用戶虛擬磁盤鏡像U_VDI中,并采用Bitmap[12]來標記各個改寫塊的位置,從而實現(xiàn)了多個終端用戶對共享數(shù)據(jù)的共同讀寫。在圖1中,當(dāng)用戶i請求第7和8號數(shù)據(jù)塊時,由于用戶對應(yīng)的U_VDI中存儲了數(shù)據(jù)塊7的改寫塊,對7號塊的數(shù)據(jù)訪問讀請求被定位到用戶對應(yīng)的U_VDI,而數(shù)據(jù)塊8在U_VDI和G_VDI的位圖中都沒有改寫標記,因此其請求定位到了S_VDI,最后將所有讀取到的數(shù)據(jù)塊重新排序組合后返回給終端用戶。

圖1 透明服務(wù)平臺虛擬磁盤存儲模型及訪問機制

需要注意的是,如果在有相關(guān)緩存機制的情況下,用戶對服務(wù)平臺的數(shù)據(jù)訪問首先會被定向到緩存池。而本文所研究的用戶行為是在沒有緩存機制的情況下進行的,目的正是為了更好地挖掘和預(yù)測用戶行為特征,為緩存策略提供依據(jù)。整個存儲模型和數(shù)據(jù)訪問機制對用戶是透明的,用戶所獨占的一個既包括操作系統(tǒng),又涵蓋應(yīng)用軟件、個人私有數(shù)據(jù)的“本地磁盤”實際上在服務(wù)端被劃分成多個部分,S_VDI和G_VDI是多用戶共享,僅U_VDI為每個用戶獨享的私有數(shù)據(jù)。

由上述描述可以看出,透明服務(wù)平臺的虛擬磁盤模型具有多層次、高共享和低冗余的特點,因此,其用戶數(shù)據(jù)訪問行為模型也會不同于其他虛擬磁盤存儲模型。另一方面,透明計算是強調(diào)以用戶為中心的網(wǎng)絡(luò)計算服務(wù)模式,面對大量的異構(gòu)終端用戶,并且用戶的所有資源均存儲在服務(wù)端,用戶在獲取服務(wù)時會帶來大量的與服務(wù)端的數(shù)據(jù)交互行為。因此,分析和預(yù)測透明計算用戶行為特征具有重要的現(xiàn)實意義。

3 用戶訪問行為分析

3.1 行為表示

透明計算客戶端是一個僅需保留必要的計算和輸入/輸出硬件的設(shè)備,本地不存儲任何操作系統(tǒng)和應(yīng)用軟件,通過網(wǎng)絡(luò)按需從服務(wù)平臺將其以數(shù)據(jù)塊的形式加載到客戶端設(shè)備上流式執(zhí)行。給定時間內(nèi),用戶對服務(wù)平臺的數(shù)據(jù)訪問請求作為一次用戶訪問行為,用戶訪問行為用塊的集合來表示。本文出現(xiàn)的“用戶”是指全體用戶的集合。基于此,給出下面相關(guān)概念。

定義1設(shè)某特定時間段Tα內(nèi)被訪問的數(shù)據(jù)塊集合為,若時間點Tm∈Tα,所有用戶在Tm時刻對數(shù)據(jù)塊Bi的訪問次數(shù)為count(Bi,Tm) ,那么數(shù)據(jù)塊Bi在Tα?xí)r間區(qū)間內(nèi)被用戶訪問的頻數(shù)為:

通過式(1),得出在Tα?xí)r間區(qū)間內(nèi)不同數(shù)據(jù)塊被訪問的頻數(shù)集合F={FB1,FB2,…,FBn}。記數(shù)據(jù)塊Bi在Tα?xí)r間區(qū)間內(nèi)被訪問的概率為P(Bi),那么:

對不同數(shù)據(jù)塊在Tα?xí)r間區(qū)間內(nèi)計算訪問概率,得出概率集合P={P(B1),P(B2),…,P(Bn)} 。

3.2 行為熵策略

香農(nóng)提出的信息熵概念,反映了信源整體的統(tǒng)計特性,是對總體的平均不確定性的度量。

用戶的行為表現(xiàn)為:對透明服務(wù)平臺上不同數(shù)據(jù)塊的訪問。對這一信源進行熵運算,可以從宏觀上量化用戶的操作行為特征[13]。根據(jù)信息熵的相關(guān)概念與公式,結(jié)合3.1節(jié)的概率集合P,得出其概率空間表示為:

基于信息熵本身的概念,能夠得到如下的推論。

推論1H(B)越大,用戶對數(shù)據(jù)塊的訪問越平均,即在該區(qū)間內(nèi),用戶行為越分散。反之,H(B)越小,用戶對數(shù)據(jù)塊的訪問越集中,即在該區(qū)間內(nèi),用戶行為越集中,則越能體現(xiàn)出用戶行為偏向和特征。

證明 以各數(shù)據(jù)塊被訪問的頻數(shù)集合{FB1,FB2,…,FBn}為離散信源,依據(jù)最大離散熵定理和信息熵的極值性,有即當(dāng)信源出現(xiàn)的可能性相等時,信源的熵達到最大。由此可得,H(B)越大,用戶對數(shù)據(jù)塊的訪問行為越分散;H(B)越小,說明用戶行為越集中。

推論2H(B)=0具有兩種不同的含義。第一種表示在該區(qū)間內(nèi)用戶只對某一數(shù)據(jù)塊進行操作,即對該數(shù)據(jù)塊的需求為100%;第二種表示在該區(qū)間內(nèi)用戶對所有的數(shù)據(jù)塊都沒有進行操作,即所有客戶端都沒有被使用。

證明 由信息量的非負性可知,當(dāng)H(B)=0時,對于任意數(shù)據(jù)塊Bi,有如下推導(dǎo):

P(Bi)=0或lbP(Bi)=0?P(Bi)=0或P(Bi)=1

那么,由信息熵的確定性可知,P(Bi)=0即為用戶只對數(shù)據(jù)塊Bi進行操作;P(Bi)=1即為用戶對所有的數(shù)據(jù)塊都沒有進行操作。

在多臺透明服務(wù)終端設(shè)備相繼啟動時,記錄該時間段內(nèi)對數(shù)據(jù)塊的訪問信息,計算對各個數(shù)據(jù)塊的訪問次數(shù),訪問分布的情況如圖2所示。

圖2 多臺透明服務(wù)終端啟動時數(shù)據(jù)塊訪問分布

這些數(shù)據(jù)塊即為系統(tǒng)共享資源存儲層中操作系統(tǒng)啟動時需要加載的對象。在這段時間內(nèi),68.591%的訪問集中在了17.8%的數(shù)據(jù)塊上,呈現(xiàn)為長尾分布。因此利用信息熵量化用戶行為并挖掘行為時序特征是可行的。

3.3 行為特征歸類

用戶在不同的時刻對資源有不同的需求,式(3)計算出來的熵值反映了一段時間內(nèi)用戶宏觀上的行為特征。本文根據(jù)熵值判斷用戶當(dāng)前行為屬于集中式還是分散式的特征,因此需要對用戶行為熵集合中的熵值進行處理。

(1)根據(jù)熵值初步地把用戶訪問行為分成分散式和集中式兩類。記錄下熵值所對應(yīng)的時間T,用二元組HT<H,T>來表示不同時間段的熵值。用戶行為熵集合HTS={HT1,HT2,…,HTn},為HT按時間推進的有序集合。選取HTS中熵值最大的點HTj和最小的非零點HTk。借鑒數(shù)據(jù)挖掘中的K最近鄰算法,將HTj和HTk作為種子結(jié)點,并且遍歷HTS集合,得到兩個以HTj和HTk為中心的有序的類集合HTjS和HTkS,集合中元素順序為HT下標的升序排列。

(2)分別對有序集合HTjS和HTkS進行處理,獲得用戶行為集中或分散的連續(xù)時間段。若其中HT下標為連續(xù)的,將這些連續(xù)的點歸為一個小集合;若HT下標出現(xiàn)斷點,則從該點開始,使之與后面下標連續(xù)的點歸為一個新的小集合。將獲得的所有小集合按時序生成特征軌跡,至此便完成了對HTS中熵值的特征歸類。

算法1特征歸類算法

輸入:HTS //用戶行為熵集合

輸出:Collections //表示用戶行為分散或集中的連續(xù)時間段集合

1.提取HTS中的最大、最小熵值

pick the max and min H in HTS

2.根據(jù)信息熵對用戶訪問行為分類

i←0

for eachHTinHTS

If|HTi.H-Hmax|>|HTi.H-Hmin|then

addHTiintoHTSmini←i+1

else

addHTiintoHTSmax

i←i+1

3.對表示訪問行為集中的集合按時間連續(xù)性進行劃分

i←0

for eachHTinHSmin

pickHTj(HTjis the next one ofHTi)

ifj=i+1then

addHTiandHTjinto one Collection

i←i+1

else

addHTiandHTjinto different Collection

i←i+1

4.對表示訪問行為分散的集合按時間連續(xù)性進行劃分

do like step 3 inHSmax

5.return Collections

設(shè)算法1返回的集合群體為S1,S2,…,Sn,以時序排列。有這樣的特點:(1)同一集合中的熵值是等價的,即使其數(shù)值不同,但是含義相同,表示用戶在此時間段內(nèi)的行為是分散的或集中的。(2)兩個相鄰的集合Si與Si+1,一個處于“峰”,一個處于“谷”,處于“峰”的熵值代表該時間段內(nèi)用戶的操作為分散式,而處于“谷”的熵值代表操作為集中式。

3.4 行為預(yù)測

用戶對不同應(yīng)用的操作和對不同文件的讀取請求,通過對服務(wù)端數(shù)據(jù)塊的訪問來實現(xiàn)。本文根據(jù)3.3節(jié)描述的行為特征歸類,選取在一段時間內(nèi)呈現(xiàn)出被集中訪問的數(shù)據(jù)塊作為預(yù)測的對象。若數(shù)據(jù)塊在近期訪問次數(shù)較多,并且預(yù)測出在短時間內(nèi)仍然保持著較高的訪問量,說明用戶短時間內(nèi)的操作仍然集中在某些應(yīng)用和文件上。根據(jù)預(yù)測結(jié)果可以優(yōu)化服務(wù)端緩存替換策略,縮短客戶端的響應(yīng)時間。

指數(shù)平滑法[14]是基于時間序列進行預(yù)測的重要方法。它認為時間序列的態(tài)勢具有穩(wěn)定性或規(guī)則性,最近的過去態(tài)勢,在某種程度上會持續(xù)到未來。指數(shù)平滑法兼容了全期平均和移動平均所長,不舍棄過去的數(shù)據(jù),但是僅給予逐漸減弱的影響程度,適用于中短期趨勢[15]。用戶的訪問行為具有時序性,且本文涉及到的預(yù)測是對短時間內(nèi)仍保持較高訪問量的數(shù)據(jù)塊訪問次數(shù)的預(yù)測,因此選用指數(shù)平滑法作為預(yù)測模型。

指數(shù)平滑預(yù)測方法有多種模型:

(1)一次指數(shù)平滑值

(2)二次指數(shù)平滑值

(3)三次指數(shù)平滑值

其中,α為平滑系數(shù);yt為t時刻的觀測值;為一次、二次、三次指數(shù)平滑值。一次指數(shù)平滑法只適合于具有水平發(fā)展趨勢的時間序列分析;二次指數(shù)平滑法是對一次指數(shù)平滑的再平滑,能夠修正滯后偏差,但也只適合于對具有線性特征的模型進行預(yù)測[16];三次指數(shù)平滑法是唯一的非線性平滑法,尤其適用于時間序列上呈二次曲線趨勢的預(yù)測[17]。

隨機抽取透明計算服務(wù)端的某數(shù)據(jù)塊,圖3為其一個小時內(nèi)被訪問的次數(shù),可知數(shù)據(jù)塊訪問次數(shù)在時序上呈現(xiàn)出非線性的變化特征,因此三次指數(shù)平滑法更符合數(shù)據(jù)塊訪問量的變化趨勢,本文采用三次指數(shù)平滑法進行預(yù)測。

圖3 數(shù)據(jù)塊在各周期的訪問量

三次指數(shù)平滑法的預(yù)測模型為:

其中,?t+T表示t時刻之后T個周期的預(yù)測值。3個預(yù)測參數(shù)at、bt、ct由一次、二次、三次指數(shù)平滑值通過下式計算得出:

4 實驗分析

為了驗證信息熵與三次指數(shù)對用戶行為預(yù)測的有效性和準確性,本文采用透明服務(wù)平臺進行實驗。該系統(tǒng)包括一個透明服務(wù)器、30臺瘦終端、5臺移動終端。透明服務(wù)器采用三層存儲模式,分別存儲操作系統(tǒng)、組群、用戶的數(shù)據(jù);瘦終端和移動終端沒有硬盤和操作系統(tǒng),只有運算功能和基本的緩存,分別以有線和無線的形式連接網(wǎng)絡(luò)。實驗中35名用戶使用Win7和CentOS6.5兩種操作系統(tǒng)各自自由操作90 min。每個終端并行使用多種應(yīng)用,根據(jù)統(tǒng)計分析,平均每隔5 min用戶使用的應(yīng)用和訪問的文件極大概率會產(chǎn)生變化。因此,透明服務(wù)器將監(jiān)控到的數(shù)據(jù)塊的訪問以5 min為一個時間周期進行統(tǒng)計,將90 min分為18個時間段。

4.1 統(tǒng)計信息熵及行為歸類

根據(jù)使用Win7和CentOS6.5下的兩次實驗結(jié)果,在35個用戶90 min的自由操作中,平均請求數(shù)據(jù)塊1253萬次,每個時間段訪問到的不同數(shù)據(jù)塊約32000到48000個。使用式(3)計算各個時間段內(nèi)的信息熵,取前10個周期結(jié)果如圖4所示。

圖4 信息熵時序圖

由圖4可以看出,兩條信息熵曲線在時序上有比較明顯的波動,信息熵的數(shù)據(jù)反映了所有用戶的操作行為特點。熵值較高的時間段表示用戶使用的應(yīng)用和讀取的文件比較分散;熵值較低的時間段表示用戶使用的應(yīng)用和讀取的文件比較集中,即用戶的行為更加集中。兩條曲線中熵值最低的時間段均為最早的幾個周期,數(shù)據(jù)塊的訪問最為集中。經(jīng)過分析,這段時間內(nèi),終端大多為啟動階段,主要從透明服務(wù)平臺三層存儲的系統(tǒng)虛擬磁盤層中訪問和加載操作系統(tǒng)資源,這一層數(shù)據(jù)共享程度最高,因此訪問最為集中。后續(xù)時間周期中,用戶自由操作,主要從群組虛擬磁盤層和用戶虛擬磁盤層中按需訪問數(shù)據(jù)塊,同時也會從系統(tǒng)虛擬磁盤層中加載少量用來支持應(yīng)用運行的數(shù)據(jù)塊,因此后續(xù)時間周期的信息熵整體上大于初始時間段。

信息熵量化了用戶的行為,為了對每個時間段內(nèi)用戶行為分類,對得到的熵值做特征歸類處理,結(jié)果如圖5所示。

圖5 信息熵特征歸類處理

圖5顯示了圖4中兩條曲線特征歸類后的結(jié)果,將反映用戶同一行為特征的點歸于一類。由圖可知,用戶在使用CentOS6.5操作系統(tǒng)時,在1、2、3、7、8、10這幾個時間周期內(nèi),用戶使用的應(yīng)用或訪問的文件較為相似,行為較為集中;在其余時間段內(nèi)行為較為分散。同理可找到使用Win7系統(tǒng)時,用戶行為集中和分散的時間段。

根據(jù)圖5得到的結(jié)果,選取兩條曲線中熵值較低的時間段內(nèi)包含的數(shù)據(jù)塊。根據(jù)統(tǒng)計,CentOS6.5和Win7兩次實驗中,用戶行為集中的時間段內(nèi)訪問的不同數(shù)據(jù)塊個數(shù)分別為4257塊和3962塊,占整個實驗訪問過的所有數(shù)據(jù)塊的15.8%和12.3%。

4.2 平滑系數(shù)α擬合

本文使用三次指數(shù)平滑法對數(shù)據(jù)塊的訪問數(shù)量進行預(yù)測,使用式(4)進行計算。其中平滑系數(shù)α是三次指數(shù)平滑法擬合效果的關(guān)鍵,如果數(shù)據(jù)波動較大,α值應(yīng)取大一些,可以增加近期數(shù)據(jù)對預(yù)測結(jié)果的影響。如果數(shù)據(jù)波動平穩(wěn),α值應(yīng)取小一些。本文在確定α值時采用試算法,即取多個α值進行擬合實驗并加以比較。實驗α取值范圍為[0.1,0.7],取值步長為0.05,選取Win7、CentOS6.5實驗中待預(yù)測的數(shù)據(jù)塊各1000個,比較不同α下預(yù)測的均方誤差MSE,選擇誤差最小的α值。擬合實驗結(jié)果如圖6所示,實驗選取0.35作為α的值。

圖6 α擬合實驗

4.3 數(shù)據(jù)塊單周期預(yù)測

本實驗通過比較預(yù)測值和觀測值的誤差衡量預(yù)測算法的準確度。隨機選取一個數(shù)據(jù)塊,偏移量為1033808,從第5個周期開始,使用式(4),取T=1。根據(jù)當(dāng)前的觀測值不斷預(yù)測下一個周期該數(shù)據(jù)塊的訪問次數(shù)。結(jié)果如表1所示。

表1 單個數(shù)據(jù)塊6~18周期預(yù)測情況

根據(jù)前10個周期的觀測值,對兩次實驗中的4257個數(shù)據(jù)塊和3962個數(shù)據(jù)塊進行第11個周期的訪問預(yù)測,使用式(4),同樣取T=1。以作為準確率的衡量指標。其中St代表t時刻的預(yù)測值,Yt代表t時刻的觀測值,E的取值越小代表越精確。預(yù)測結(jié)果精確度分布如圖7所示。

圖7 預(yù)測結(jié)果精確度分布

在誤差低于0.1,0.1~0.2,0.2~0.3以及高于0.3的范圍內(nèi),數(shù)據(jù)塊所占比例分別為:CentOS,65%、18%、10%、6%;Win7,62%、21%、8%、9%。

在上述兩個實驗中,使用三次指數(shù)平滑預(yù)測算法預(yù)測一個周期后的數(shù)據(jù)塊訪問次數(shù)。表1證明了此算法可以在時序上根據(jù)觀測值不斷修正預(yù)測結(jié)果,迅速減小預(yù)測誤差;圖7證明了此算法可以對下一個周期數(shù)據(jù)塊的訪問次數(shù)給予較為精準的預(yù)測。

4.4 中短周期預(yù)測精度測試

4.3節(jié)證明了三次指數(shù)平滑算法在單周期預(yù)測精確度較高,但僅僅能預(yù)測一個周期是不夠的。為了驗證此算法在多少周期內(nèi)預(yù)測結(jié)果可接受,以前10個周期作為觀測值,對所有數(shù)據(jù)塊進行第11~18周期的預(yù)測。使用式(4),T分別取1~8,并以平均誤差作為衡量指標,實驗結(jié)果如圖8所示。

圖8 中短周期預(yù)測精確度測試

上述實驗表明,在預(yù)測1~3個周期時,平均誤差分別為0.07、0.12、0.19,從第4個周期開始,誤差急劇增加。由此得出結(jié)論,使用三次指數(shù)平滑預(yù)測法可以對數(shù)據(jù)塊在3個周期內(nèi)給予較為準確的預(yù)測。

5 結(jié)束語

本文在透明計算背景下,根據(jù)透明服務(wù)平臺三層虛擬磁盤存儲的特點,基于信息熵和三次指數(shù)平滑對透明計算用戶行為特征進行分析和預(yù)測。此方法基于信息熵策略從宏觀上分析用戶行為需求,進而挖掘出被頻繁集中訪問的數(shù)據(jù)塊的時序特征。在此基礎(chǔ)上利用三次指數(shù)平滑算法預(yù)測將來一段時間內(nèi)這些塊的訪問頻率。實驗表明,此方法能夠較為準確地發(fā)現(xiàn)集中訪問的數(shù)據(jù)塊,并對這些數(shù)據(jù)塊給予較為精確的預(yù)測,從而達到對用戶行為分析和預(yù)測的目的。預(yù)測結(jié)果為制定更高效的緩存策略提供有效的依據(jù),從而提高透明計算服務(wù)質(zhì)量與性能。

猜你喜歡
特征用戶
抓住特征巧觀察
新型冠狀病毒及其流行病學(xué)特征認識
如何表達“特征”
不忠誠的四個特征
抓住特征巧觀察
關(guān)注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關(guān)注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關(guān)注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
Camera360:拍出5億用戶
100萬用戶
主站蜘蛛池模板: 国产你懂得| 伊人久久综在合线亚洲91| 国产麻豆精品久久一二三| 亚洲成人高清在线观看| 丁香婷婷激情网| 亚洲成人网在线播放| 亚洲欧美不卡视频| 亚洲高清免费在线观看| 日本妇乱子伦视频| 成人毛片免费在线观看| 欧美一区中文字幕| 久草视频中文| 国产精品天干天干在线观看 | 国产精品片在线观看手机版| 国产成人夜色91| 国产a网站| 综合人妻久久一区二区精品 | 拍国产真实乱人偷精品| 九色最新网址| 国产原创自拍不卡第一页| 婷婷色一区二区三区| 99re精彩视频| 国产精品久久国产精麻豆99网站| 亚洲国产欧美国产综合久久| 欧美成人精品一级在线观看| 亚洲一区波多野结衣二区三区| 国产欧美亚洲精品第3页在线| 国产网站免费| 亚洲经典在线中文字幕| 成人永久免费A∨一级在线播放| 五月激情婷婷综合| 在线观看免费黄色网址| 成年免费在线观看| 国产亚洲高清在线精品99| 国产亚洲精品97AA片在线播放| 欧美日韩亚洲国产主播第一区| 久久semm亚洲国产| 毛片最新网址| 亚洲香蕉伊综合在人在线| 理论片一区| 亚洲大尺码专区影院| 秋霞国产在线| 毛片在线播放a| 国产成人精品亚洲日本对白优播| 欧美、日韩、国产综合一区| 亚洲成网站| 国产精品性| 在线视频一区二区三区不卡| 国产永久在线观看| 亚洲精品视频在线观看视频| 青青草原偷拍视频| 蜜桃臀无码内射一区二区三区| 国产成人亚洲综合A∨在线播放| 日本三级欧美三级| 国产亚洲欧美日韩在线观看一区二区 | 亚洲色图欧美视频| 热久久国产| 亚洲一区黄色| 国产97视频在线| 国产精品自在在线午夜区app| 亚洲人成网站色7777| 网友自拍视频精品区| 精品一区二区三区中文字幕| 欧美日韩在线亚洲国产人| 国产xxxxx免费视频| 精品夜恋影院亚洲欧洲| 精品视频在线一区| 高清无码一本到东京热| 新SSS无码手机在线观看| AⅤ色综合久久天堂AV色综合| 色婷婷亚洲十月十月色天| 亚洲最猛黑人xxxx黑人猛交| a毛片免费观看| 久久综合色视频| 国产理论最新国产精品视频| 永久天堂网Av| 精品国产aⅴ一区二区三区| 亚洲男人的天堂久久香蕉| 国产真实乱子伦视频播放| 四虎亚洲精品| 国产18在线| 久久中文字幕av不卡一区二区|