999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于草原牲畜放牧軌跡的數據挖掘研究

2022-05-18 07:59:38邢光磊周李涌李寶山
內蒙古科技與經濟 2022年7期
關鍵詞:數據挖掘模型

邢光磊,周李涌,李寶山

(內蒙古科技大學 信息工程學院,內蒙古 包頭 014010)

近年來,隨著大數據技術發展迅速,產生了海量的時空軌跡數據,時空軌跡數據挖掘的研究已成為國內外的一個研究熱點[1]。Teimouri, Maryam等人[2]提出了一種利用從軌跡數據中提取的運動參數來推導動物的運動行為(行走,覓食和休息)的方法。對每只動物的個體運動路徑進行量化。選擇適當的運動參數表示。Clark, Patrick E.等人[3]對于麋鹿和牛的行為通過GPS跟蹤系統進行分類,在兩項隨機試驗中,識別成年牛和圈養麋鹿牧場的GPS記錄喂食、行走和靜態行為。在移動對象數據挖掘中,主要以移動對象的歷史行為數據,即軌跡數據作為研究對象,發現其中潛在的信息和有用的知識,如:移動對象行為特征、行為模式、環境影響等[4]。

在大數據技術日益普及中,草原畜牧業也得到快速發展。牧羊人在放牧過程中使用定位系統產生大量軌跡數據。在處理軌跡數據上,結合傳統軌跡挖掘技術并針對草原畜牧業牲畜運動軌跡特有特點,筆者提出了一種適合牧區的軌跡挖掘模型,并利用Hadoop開源平臺的數據計算處理框架[5,6],對軌跡數據進行預處理,提高算法處理效率。最后通過真實軌跡數據對于該模型進行驗證,結果證明了模型的有效性,對后續草原科學放牧的研究是具有重要意義的。

1 軌跡數據處理

對于放牧產生的軌跡數據可以提取數據中潛藏的信息。然而,并不是全部的數據都能應用于研究。在牲畜上GPS定位設備產生的軌跡數據中存在一些無效數據、重復數據和噪聲數據。為了提高數據挖掘的準確性,必須剔除無效數據,并根據現有的軌跡數據提取有用數據,以便于后續分析。

1.1 實驗數據來源

筆者使用的數據是蘇尼特左旗某牧區放牧中產生的軌跡數據。數據時間是2021年5月—7月。通過牧區上頭羊所佩戴定位項圈產生的連續定位信息,其中有定位項圈編號、定位狀態、經緯度等。模型使用軌跡數據的格式,見表1。

1.2 數據預處理

滿足草原牧區產生海量數據的存儲和計算處理需求,搭建了hadoop[7,8]平臺,可以通過平臺對原始軌跡數據進行清洗。其中包括缺失值清洗、邏輯錯誤清洗、格式內容清洗。在平臺上,對于草原數據進行不同主題區分,根據數據挖掘主題需求,抽取對應的數據做支撐。在預處理這個環節將直接影響軌跡數據挖掘的效果。

表1 軌跡數據模型

2 基于BP-DBSCAN的畜牧軌跡數據挖掘模型

根據實際需求將畜牧軌跡數據經過預處理后,由于羊群的軌跡比較緩慢、迂直的特點,對現有的軌跡挖掘所采用各種聚類算法進行分析后,最終采用DBSCAN算法[9]作為數據的處理分析。DBSCAN聚類算法有發現不同密度、尺度和形狀聚類的能力。DBSCAN聚類算法發現類簇個數變化是基于使用者給出的最少樣本點數和近鄰半徑兩個參數[10]。但是,DBSCAN算法在使用者對數據集沒有先驗經驗的情況下確定上述兩個參數有一定困難。因此確定了一種BP-DBSCAN算法的模型,通過神經網絡確定訓練出最優參數,達到放牧產生軌跡數據聚類的準確性。

2.1 DBSCAN聚類算法

1996年由Ester M、Kriegel H P、Xu X.等人[11]提出了基于密度空間聚類算法——DBSCAN算法,該算法不用事先規定類簇的個數,當需要指定兩個參數(Eps,MinPts),為了詳細的描述DBSAN算法,須給出以下定義[12,13]:

定義1:(Eps領域)假設給出數據集D={x1,x2,x3,…,xm},對于xj屬于D,xj的領域NEps(xj)定義為以xj為中心,以Eps為半徑的區域內,即:

NEps(xj)={xj∈D|dist(xi,xj)≤Eps}

(1)

其中D是數據集;dist(xi,xj)表示D中兩個數據對象xi和xj之間的距離;NEps(xj)在數據集D中對象xi與對象xj距離小于Eps的所有對象。

定義2:(核心點)對于數據xi∈D,設定MinPts最小閾值,如果|NEps(xj)≥MinPts|,稱為核心點,不是核心點可是某核心點的Eps鄰域內的對象稱為邊界點。

定義3:(直接密度可達)在數據集D中若對象xi在對象xj的Eps域內,并且是核心對象,稱對象xi從對象xj出發是直接密度直達的(directly density-reachable)。

定義4:(密度可達)如果存在一個對象序列P1,P2,P3,…,Pn,滿足P1=xj,Pn=xi,并且Pn+1由Pn直接密度可達,則對象xi從對象xj關于Eps和MinPts是密度可達的(density-reachable)。

定義5:(密度相連)如果存在對象xk=D使得點xj和xi都是從xk關于Eps和MinPts密度可達的,那么點xj到xi是關于Eps和MinPts密度連通的(density-connected)。

定義6:(噪聲點)不屬于在任何簇的樣本點則標記成噪聲點(noise)。

該算法流程圖,如圖1所示。

圖1 DBSCAN算法流程

2.2 BP神經網絡

BP神經網絡[14,15]是1986年Rumelhart和Williams提出的,是應用較為廣泛的人工網絡模型。BP神經網絡由輸入層、隱含層與輸出層3部分組成。BP神經網絡模型,如圖2所示。

圖2 BP神經網絡模型

BP神經網絡通過信號的正向傳播和誤差的反向傳播來降低誤差函數的函數值,網絡訓練過程就是不斷地調整優化權值和閾值。對于3層BP神經網絡。算法計算公式如下:

隱含層第l個神經元輸出:

(2)

輸出層第m神經元輸出:

(3)

誤差反向傳遞更新隱含層到輸出層權重:

φlm(m+1)=Φlm(m)+ΔΦlm

(4)

誤差反向傳遞更新輸入層到隱含層權重:

ωpl(m+1)=ωpl(m)+Δωpl

(5)

式中:ωpl和φlm是連接權值;θl和Φm是閾值;f為該層的激活函數。

2.3 BP-DBSCAN軌跡挖掘模型

目前DBSCAN聚類算法的結果會受到初始化參數Eps和MinPts的影響,筆者通過密度聚類算法和BP神經網絡模型的優勢,提出了基于密度聚類算法和BP神經網絡相結合的草原畜牧軌跡數據挖掘模型。該模型主要由DBSCAN算法模塊和BP神經網絡模塊兩個部分組成。通過BP神經網絡的得出最優參數,再進行對于放牧產生的軌跡數據進行聚類。

基于BP-DBSCAN軌跡挖掘模型的步驟如下:

step1 確定BP神經網絡結構,初始化參數;

step2 輸入參數進入BP神經網絡,得到參數Eps和MinPts;

step3 以訓練出Eps和MinPts為參數輸入DBSCAN算法;

step4 掃描軌跡數據,依次訪問所有軌跡點;

step5 判斷此軌跡點是否被訪問過;

step6 結合Eps和MinPts參數,判斷此軌跡點是否為核心點;

step7 如果此點是核心點,訪問其所有密度相連的軌跡點,將其與核心點定為一個類簇;

step8 繼續循環,直至所有軌跡點訪問完為止,得到分布E1;

step9 將E1和實際結果Y1輸入損失函數中,得誤差值;

step10 通過誤差值對神經網絡進行反向傳播訓練,得出最優Eps和MinPts;

step11以最優Eps和MinPts為參數的DBSCAN算法對再數據集進行聚類。

3 實驗及結果分析

實驗使用數據是蘇尼特左旗某牧區放牧中產生的軌跡數據。BP-DBSCAN軌跡挖掘算法模型通過Python語言實現,在Win10系統運行,計算機硬件配置:Intel(R) Core(TM) i7-8550U CPU @ 1.80 GHz,8 GB內存,1 TB硬盤。通過訓練出最優參數對軌跡數據進行聚類,從而提升軌跡數據聚類效果。

3.1 誤差分析

鑒于目前基于草原畜牧軌跡的挖掘算法模型,是否能訓練出最優參數。損失函數[16]可以判斷模型預測與實際數據差距。如表2所示損失函數呈現遞減趨勢,說明預測值越來越接近實際數據,得到的參數越準確。

表2 BP-BDSAN模型誤差值

3.2 聚類分析

本次實驗抽取某類簇的數據和其他類簇少量數據對軌跡數據聚類,圖3(a)圖是對原始軌跡數據的聚類效果圖,圖3(b)圖是通過模型訓練出最優參數聚類出的效果圖,實驗結果表明通過神經網絡結合DBSCAN算法模型,是可以滿足自適應確定DBSCAN參數的需求,聚類效果圖,如圖3所示。

(a) (b)

4 結論

筆者對草原牧區牲畜放牧過程中產生的大量軌跡數據,確定一種基于BP-DBSCAN軌跡挖掘算法模型,對牲畜軌跡數據進行聚類,以滿足牧區牲畜軌跡數據挖掘要求。為提升算法處理效率,搭建了大數據hadoop平臺對海量數據進行預處理。BP-DBSCAN軌跡挖掘算法模型對于軌跡聚類效果提高,為后續牧區板塊規劃做基礎,使草場數據信息化。科學放牧,可以達到羊群與草場之間的相對的生態平衡,減輕草場壓力。

畜牧業屬于基礎產業同時也是重要產業,在畜牧業向現代化轉型過程中,如何結合現有技術,更好地服務于畜牧業是研究人員所需要考慮的。草原牧區以其獨特的特色和優勢在畜牧業發展中占有重要地位。基于現研究背景,筆者依托于大數據結合軌跡挖掘技術,指導草原畜牧業生產科學發展,是具有非常重要意義的。

猜你喜歡
數據挖掘模型
一半模型
探討人工智能與數據挖掘發展趨勢
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
3D打印中的模型分割與打包
一種基于Hadoop的大數據挖掘云服務及應用
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
數據挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
主站蜘蛛池模板: 奇米影视狠狠精品7777| 国产鲁鲁视频在线观看| 亚洲欧美在线精品一区二区| 97久久超碰极品视觉盛宴| 亚洲男人的天堂视频| 一级毛片免费不卡在线| 99re66精品视频在线观看| 一本一道波多野结衣av黑人在线| 欧美全免费aaaaaa特黄在线| 国产精品原创不卡在线| 国产精品专区第1页| 日本人又色又爽的视频| 91九色国产在线| 71pao成人国产永久免费视频| 日韩高清一区 | 亚洲日本www| 91探花国产综合在线精品| 日本久久网站| 色婷婷电影网| 欧美成人一级| 精品国产福利在线| 久久综合结合久久狠狠狠97色| 久久免费看片| 亚洲啪啪网| 国产一级视频久久| 99久久精彩视频| 国产激情无码一区二区三区免费| 亚洲资源在线视频| 亚洲熟妇AV日韩熟妇在线| 亚洲福利视频网址| 人妻无码AⅤ中文字| 国产精品永久在线| 老司机久久99久久精品播放| 毛片网站在线播放| 日韩国产无码一区| 国产地址二永久伊甸园| 噜噜噜久久| 国产精品综合色区在线观看| 亚洲国产精品一区二区第一页免| 国内毛片视频| 孕妇高潮太爽了在线观看免费| 亚洲一区精品视频在线| 亚洲第一区欧美国产综合| 国产高潮视频在线观看| 亚洲精品图区| 色综合中文字幕| 毛片基地美国正在播放亚洲| 成人伊人色一区二区三区| 亚洲最黄视频| 国产人人乐人人爱| 在线日韩一区二区| 亚洲欧洲日韩综合色天使| 久久午夜夜伦鲁鲁片不卡| 伊人久综合| 999国产精品永久免费视频精品久久| 亚洲天堂久久| 亚洲中文字幕23页在线| 国产精品福利在线观看无码卡| 精品少妇人妻一区二区| 老熟妇喷水一区二区三区| 国产成人免费视频精品一区二区| 欧日韩在线不卡视频| 麻豆国产精品一二三在线观看| 日本国产在线| 超碰精品无码一区二区| 日本国产精品一区久久久| 亚洲国产日韩欧美在线| 日韩亚洲综合在线| 国产精品久久自在自2021| 日本在线国产| 国产精品一区二区在线播放| 亚洲视频四区| 国产午夜人做人免费视频| 欧美在线中文字幕| 欧美成人在线免费| 国产区免费| 欧美精品成人一区二区在线观看| 免费国产不卡午夜福在线观看| 久久久久免费看成人影片| 666精品国产精品亚洲| 四虎综合网| 国产毛片不卡|