999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

農業大數據分類算法探討與研究

2020-06-21 08:20:16鄒承俊
四川農業科技 2020年4期
關鍵詞:分類農業信息

李 敏,葉 煜,文 燕,陳 琳,鄒承俊

(成都農業科技職業學院,成都 溫江 611130)

民以食為天,食源于農業。我國幅員遼闊,是農業大國,傳統農業在中華大地上養育了幾千年的祖祖輩輩。古人常說,農業收成是靠天吃飯。而在當今信息技術爆炸及物聯網技術的指數級發展下,農業也和其他產業一樣,利用現代技術,由傳統農業向著智慧農業發展。

農業生產活動過程中,產生大量的農業數據,俗稱農業大數據。如農業種植、養殖、農產品加工處理、天氣狀況、市場行情以及通過自動化網絡監控系統產生的監控數據等。對于這些海量的原始農業數據,看似雜亂卻包含著巨大的價值,若能對這些數據進行有效的分析處理,在雜亂中尋求其規律,就能為農業預測及發展決策提供科學依據和參考。[1]

農業大數據挖掘是農業數據分析的最關鍵工作。大數據的挖掘是從海量、不完全的、有噪聲的、模糊的、隨機的大型數據庫中發現隱含在其中有價值的、潛在有用的信息和知識的過程。收集到的數據首先就要進行分類管理。所謂分類是找出數據中的一組數據對象的共同特點并按照分類模式將其劃分為不同的類,其目的是通過分類模型,將數據庫中的數據項映射到某個給定的類別中。農業大數據的挖掘中常用的分類算法有貝葉斯分類算法、K最近鄰分類算法、決策樹分類算法等,這些方法從不同的角度對數據進行挖掘。

1 樸素貝葉斯算法

1.1 算法介紹

1.2 農業數據舉例應用

對歷史發生的情況進行統計,估算出生病的雞為母雞或公雞的概率。

第1步,構造一個歷史發生的情況表,如表1:

表1 雞生病情況

第2步,計算出每一個組成部分的概率,構造出頻率表,如表2:

表2 生病頻率

如果歷史中沒有出現的事件,即發生的概率為0的情況,導致整個結果也為0。但未來不一定不發生。可以利用拉普拉斯估計,給頻率表中的每個計數加上一個較小的數,這樣就可以保證每個特征發生概率非零。一般將0變成1,增加一個小的概率,讓它的占比很小,將0的情況覆蓋掉。而對整個結果影響不是很大。如上一個例子,歷史數據中,公雞沒有生病,也就是公雞生病的概率為0的情況,如表3:

表3 生病頻率有0的情況

改為增加公雞數為4,如表4:

表4 修改生病頻率

如果有多重特征,則p(B|A) = p(B0|A) ×p(B1|A)×p(B2|A)× .... ×p(Bn|A)。

2 K最近鄰分類算法(KNN)

2.1 算法介紹

2.1.1 KNN(K-Nearest Neighbor)算法的思路 如果一個樣本在特征空間中的K個最相似的樣本中的大多數屬于某一個類別,則該樣本也屬于這個類別。

2.1.2 KNN三要素

(2)K的選擇 指定一個K值(K值的選擇一般低于樣本數據的平方根,一般是K<=20的整數),按照距離依次排序,選取當前點距離最小的K個點,確定前K個點所在類別的出現概率。

(3)分類決策規則 根據少數服從多數的原則,返回前K個點出現頻率最高的類別作為當前點預測分類。

2.1.3 KNN算法的缺點 當樣本不平衡時,如一個類的樣本容量很大,而其他類樣本容量很小時,有可能導致輸入一個新樣本時,該樣本的K個鄰居中大容量類的樣本占多數。可以采用權值的方法。根據和該樣本距離的遠近,對近鄰進行加權,距離越小的鄰居權值越大,權重一般為距離平方的倒數。

2.2 案例

通過收集含玉米象小麥籽20g與正常小麥籽20g的發育過程中含蟲數據,從種植的第3天開始,共測1個月。玉米象的發育過程如表5:

表5 玉米象的發育過程

通過小波降噪,特征的選擇與優化后,計算均值、標準差、光子統計熵等特征參數得到數據庫,從數據庫中實驗組和對照組中各取60%作為樣本訓練集,40%作為測試集,利用歐式距離,K取5,使用KNN及其加權的KNN,來檢驗分類的效果。通過比較,KNN的正確率為90%,加權KNN為92.5%,加權分類法的效果最好。[3]

3 決策樹

3.1 算法介紹

決策樹是通過對訓練集的研究,挖掘有用的規則,用于對新集進行預測分類的一種算法。基本算法是貪心算法,自頂向下遞歸方式構造決策樹。在其生成過程中,如何將屬性進行度量分割尤為重要,直接影響到最終分類效果。

3.2 步驟

(1)開始時,所有的數據都在根節點,屬性需要離散型字段值,如果是連續的,則將其離散化。

(2)用離散化的屬性進行遞歸分裂所有記錄,直到分裂停止。

決策樹的分裂原則:數據的每一次分裂,盡可能讓類別一樣的數據在樹的一邊,當樹的葉子節點的數據都是一類的時候,則停止分類,可以用if-else語句來實現。

(3)分類劃分的優劣用不純性度量來分析。將純粹度用數據進行量化,度量信息混亂程度的指標:

類別越少,信息熵和基尼系數越低。

條件熵:在某個分類條件下某個類別的信息熵叫做條件熵,類似于條件概率,在知道Y的情況下,X的不確定性。條件熵一般使用H(x|y)表示,代表在Y條件下,X的信息熵。哪個條件熵相對信息熵下降的最快,就選擇誰做為分類,用信息增益來表示條件變化的程度,分類前的信息熵減去分類后的信息熵。選擇信息增益大的屬性作為分類節點的方法叫ID3分類算法。例如特征Y對訓練集D的信息增益為g(D,Y)=H(X)-H(X|Y)。 但這種方法會出現過擬合問題。所以用條件熵作為頂層分類有弊端。

信息增益率gr(D,Y)=g(D,Y)/ H(X):使用信息增益率來做為頂層分類將消除當某些屬性比較混雜時,使用信息增益來選擇分類條件的弊端,這種分類法也叫做C4.5。如果最后一個條件依然沒能將數據準確進行分類,則在這個節點上就可以使用概率來決定。看哪種情況出現的多,就做為該節點的分類結果。

(4)用決策樹來做預測值(回歸),可以求一個平均值做為預測結果。

3.3 決策樹的構建算法

主要有ID3、C4.5、CART三種,其中ID3是決策樹最基本的構建算法,而C4.5和CART是在ID3的基礎上進行優化的算法。常用的是C4.5。

3.4 決策樹的優化

決策樹如果太復雜,很可能出現過擬合,造成預測不準確的分類,因此需要對決策樹進行優化,優化的方法主要有2種,一是用信息增益率(C4.5)來做。二是剪枝。

3.5 案例[4]

下表為某些地區第三季度雨水洪澇數據訓練集樣本屬性,如表6。

表6 雨水洪澇數據訓練集樣本屬性

3.5.2 條件熵的計算

3.5.3 信息增益的計算

(1)以月份為前提條件的信息增益G1=H-H1=1.23096-1.04316=0.1878

(2)以受災人數為前提條件的信息增益G2=H-H2=1.23096-0.70042=0.53054

(3)以農作物受災面積為前提條件的信息增益G3=H-H3=1.23096-0.85977=0.37116

用ID3的算法,即用信息增益作為標準,通過對比,以受災人數作為條件使原來的信息熵下降最快,則將它作為頂層劃分。

3.5.4 信息增益率的計算

(1)以月份為前提條件的信息增益率Gr1=(H-H1)/H=(1.23096-1.04316)/1.23096=0.1526

(2)以受災人數為前提條件的信息增益率Gr2=(H-H2)/H=(1.23096-0.70042)/1.23096=0.4310

(3)以農作物受災面積為前提條件的信息增益率Gr3=(H-H3)/H=(1.23096-0.85977)/1.23096=0.3015用C4.5的算法,即用信息增益率作為標準,通過對比,以受災人數作為頂層條件劃分。

ID3和C4.5這2種算法均得出相同的結果,再進行規則剪枝,最后生成決策樹,如圖1。

算法名稱收斂時間是否過度擬合是否過渡擬合缺失數據敏感度訓練數據量樸素貝葉斯算法快存在不敏感無要求KNN快存在敏感數據量多決策樹快存在不敏感小數據集

4 3種算法比較

在農業大數據中,根據實際情況選擇不同的分類算法或多種算法相結合的方式,使數據分類更為準確。

猜你喜歡
分類農業信息
國內農業
今日農業(2022年1期)2022-11-16 21:20:05
國內農業
今日農業(2022年3期)2022-11-16 13:13:50
國內農業
今日農業(2022年2期)2022-11-16 12:29:47
擦亮“國”字招牌 發揮農業領跑作用
今日農業(2021年14期)2021-11-25 23:57:29
分類算一算
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
主站蜘蛛池模板: 中文字幕日韩视频欧美一区| 制服丝袜 91视频| 欧美一区中文字幕| 四虎永久免费地址在线网站| 国内精品小视频在线| 亚洲天堂福利视频| 日本精品一在线观看视频| 亚洲国产日韩欧美在线| 亚洲国产天堂在线观看| 99无码中文字幕视频| 全部毛片免费看| 免费在线看黄网址| 秋霞一区二区三区| 久久精品中文无码资源站| 日韩欧美国产综合| 伊人激情久久综合中文字幕| 欧美区一区| 国模极品一区二区三区| 国产成人免费观看在线视频| 精品国产自在现线看久久| 亚洲人成网站在线播放2019| 亚洲AV无码乱码在线观看代蜜桃| 国产极品美女在线播放| 国产欧美亚洲精品第3页在线| 免费视频在线2021入口| 一区二区三区四区在线| 高清无码手机在线观看| 日本高清免费不卡视频| 亚洲视频欧美不卡| 亚洲精品视频免费观看| 久久这里只有精品2| 手机看片1024久久精品你懂的| 久视频免费精品6| 国产精品无码影视久久久久久久| 亚洲欧美色中文字幕| 国产精品99在线观看| 精品色综合| 久久精品娱乐亚洲领先| 亚洲中文字幕无码mv| 91美女视频在线观看| 国产精品亚洲片在线va| 亚洲欧洲综合| 午夜啪啪福利| 欧美色伊人| 国产成人91精品免费网址在线| av在线人妻熟妇| 手机成人午夜在线视频| 在线国产你懂的| 日韩欧美国产区| 久久毛片免费基地| 综合久久五月天| 日本欧美视频在线观看| 三级欧美在线| 国产91av在线| 欧美一级夜夜爽| 丰满少妇αⅴ无码区| 97国内精品久久久久不卡| 人人澡人人爽欧美一区| 国产三级国产精品国产普男人| 日本人真淫视频一区二区三区| 国产玖玖玖精品视频| 国产色婷婷视频在线观看| 国产一区二区视频在线| 国产永久在线视频| 久久无码高潮喷水| 国产女同自拍视频| 婷婷亚洲天堂| 成人午夜久久| 国产第一页免费浮力影院| 五月天福利视频| 成人永久免费A∨一级在线播放| 在线观看无码av免费不卡网站| 人人妻人人澡人人爽欧美一区 | 又黄又湿又爽的视频| 九色视频在线免费观看| 一区二区三区成人| 亚洲三级成人| 东京热高清无码精品| 一本大道香蕉中文日本不卡高清二区| 久久久国产精品无码专区| 亚洲男人的天堂在线观看| 超碰免费91|