999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于集成特征選擇的漁船捕撈類型辨別

2021-07-05 12:00:06胡濤李波姚為
電子技術與軟件工程 2021年10期
關鍵詞:特征作業信息

胡濤 李波 姚為

(中南民族大學計算機科學學院 湖北省武漢市 430074)

1 引言

近年來,過度捕撈已使得我國海洋漁業資源急劇的減少[1]。海洋中不同的漁船作業方式捕捉魚的大小、捕撈魚量、捕撈魚類存在較大區別,不同的作業方式對漁業資源的傷害往往不同。其中,拖網漁船因為其工作特性對漁業資源的傷害巨大[2],有些地區甚至對拖網漁船實行了一年禁拖的措施[3]。依靠漁船在海洋中航行的軌跡數據來識別漁船的作業方式、進而保護海洋資源是一個很有意義的工作。

漁船的軌跡數據主要包括漁船的位置、航速、航向和日期,Pipanmekaporn 等人利用聚類策略和循環神經網絡對漁船的軌跡進行表示,從而達到漁船作業方式判斷的目的[4]。Zong 等人利用數學形態學的方式捕獲漁船的經緯度信息從而判斷漁船的作業方式[5],鄭巧玲等人借助航速、航向二個因子建立了神經網絡模型對漁船作業方式進行判斷[6]。沈凱等人提取大量關于出行漁船的軌跡特征,使用邏輯斯蒂回歸模型完成對漁船作業方式的判斷[7]。Haiguang 等人設計了一個從數據預處理、特征提取、特征選擇、模型訓練,建立了漁船作業方式模型FVID[8]。任迎春等人采用支持向量機識別漁船的作業方式[9]。

本文對漁船的軌跡提取大量的手工特征、使用集成的特征選擇算法對提取的大量手工特征進行篩選,保留對漁船作業方式判斷最有效的特征。

2 特征工程

漁船的軌跡T 是由多個軌跡點 Pj 組成的,其中 Pj 主要包括當前軌跡點的經緯度、速度、方向、時間信息。無法直接使用傳統的機器學習算法直接建立模型,需要從這些軌跡點中提取關鍵的特征,將該軌跡包含的所有軌跡點轉換成一維向量。

由于軌跡數據主要包含4 個重要的信息:經緯度、速度、方向、時間,所以主要分為單個變量進行特征提取,以及組合多個信息進行特征提取。具體的操作如表1所示。

表1:特征工程介紹

經緯度信息主要提取了統計特征,提取軌跡包含的所有軌跡點的經緯度的最大值、最小值、極差、均值、眾數等。速度信息除了提取了軌跡包含的所有軌跡點的速度的統計信息以外還包括分桶特征,即將速度分為[0,1),[1,2),[2,3),.,[18,19),[19,20),[20,+∞)一共 21個桶,統計軌跡包含的所有軌跡點的速度落在每個桶之間的次數以及占的比例。航向信息是先對軌跡的航向信息進行一階差分來衡量航向變換的快慢,然后對得到的一階差分信息進行一些統計學運算從而提取特征。一階差分代表的意思是當前軌跡點的航向與上個軌跡點的航向的差值。速度與經緯度交互特征指的是將速度劃分為低速(0 到8 海里/小時)、中速(9 到16 海里/小時)、高速(16 節以上),統計在三個區間內經緯度坐標的統計信息。時間與經緯度的交互特征指的是通過經緯度信息和時間信息計算漁船的平均速度,然后對得到的平均速度提取統計特征。

經過特征工程后每條軌跡產生了168 個特征,即使用這168 個一維信息來代表該條軌跡。

3 集成特征選擇算法

如算法1所示,特征選擇算法主要可以分為過濾法(Filter)、包裝法(Wrapper)、嵌入法(Embedding)三種。其中嵌入法主要依賴于一些機器學習模型表現特征選擇能力,如正則化具體表現為當一個特征對應的系數為 0 時表示該特征不重要,樹模型具體表現為某個特征在構造樹時有無作為劃分數據的節點。

嵌入式特征是一種高效、選擇精度高的方法對于分類任務來說,本文主要采用 lightgbm 模型[10]作為嵌入式特征選擇的基礎學習器。根據構造樹時使用該特征的次數的總和作為特征重要性,將特征重要性小于均值的特征視為無關特征或者噪聲特征,從而達到特征選擇的效果。

特征選擇存在很大的不穩定性,小小的數據變動可能會導致選擇出來的特征子集差異特別大,所以特征選擇的性能會受到很大的影響。而集成學習可以吸收多個結果的優缺點從而使得整體的結果趨于穩定。

本文依靠交叉驗證來劃分數據集。將每折劃分得到的訓練集數據采用基于lightgbm 的嵌入式特征選擇算法進行學習,從而得到M 個特征選擇的結果,M 代表交叉驗證的折數。然后采用了詞頻統計將這M 個結果進行整合,得到特征在這M 次選擇結果中出現的次數。最后設置超參數 N,將在這M 次選擇結果中出現次數大于等于N 的特征保留,從而得到最終特征子集。算法 1 是本文所提出的基礎特征選擇算法的偽代碼。

4 實驗結果分析

實驗數據來源于福建省海洋局的公開實驗數據,包括了8166條漁船出行的軌跡記錄。

按 8 比 2 的比例劃分成訓練集和測試集,大約包含1600 個測試集和6400 個訓練集?;诮徊骝炞C的集成特征選擇算法設置的折數為5,采用的分類器是 lightgbm,表2 主要討論了基于lightgbm 嵌入式的特征選擇、基于改進的基于交叉驗證的集成特征選擇算法的不同閾值N 對實驗結果的影響。

表2:實驗結果

從實驗結果中可以看出改進的特征選擇算法在閾值取2 時各項性能都有明顯的提升。當閾值選取為2 的適合的交叉驗證分類效果最好,具體原因是閾值過大的時候也會過濾掉一些有效的特征。閾值選用一個適中的往往會取得更好的效果。

5 結束語

本文主要對漁船軌跡數據進行了特征工程,設計了一種集成特征選擇算法來對特征工程得到的特征進行選擇。最終對于漁船的作業方式的辨別的準確率可以達到 91.5%。通過對漁船作業方式的辨別,對于漁業資源的保護和管理有重要的意義。

猜你喜歡
特征作業信息
快來寫作業
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
作業
故事大王(2016年7期)2016-09-22 17:30:08
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
線性代數的應用特征
河南科技(2014年23期)2014-02-27 14:19:15
我想要自由
三十六計第七計:無中生有
主站蜘蛛池模板: 久综合日韩| 欧美不卡在线视频| 99免费在线观看视频| 丝袜美女被出水视频一区| 欧美a级在线| 香蕉视频在线观看www| 国产经典在线观看一区| www.亚洲天堂| 亚洲天堂2014| 亚洲中文无码av永久伊人| 一级毛片高清| 91无码网站| 4虎影视国产在线观看精品| 性色生活片在线观看| 福利小视频在线播放| 亚洲欧美综合在线观看| 国产成人免费观看在线视频| 久久精品一卡日本电影| 亚洲一级毛片免费看| 美女无遮挡免费视频网站| 在线观看91精品国产剧情免费| 不卡色老大久久综合网| 26uuu国产精品视频| 成人在线视频一区| 综合天天色| 真实国产乱子伦视频| 91视频区| 亚洲日本精品一区二区| 自拍亚洲欧美精品| 丁香婷婷激情网| 刘亦菲一区二区在线观看| 青青草原国产av福利网站| 亚洲第一成年免费网站| 亚洲毛片在线看| m男亚洲一区中文字幕| 视频一区亚洲| 亚洲h视频在线| 国产大全韩国亚洲一区二区三区| 日韩中文字幕免费在线观看| 日韩国产欧美精品在线| 无码日韩视频| 中文字幕调教一区二区视频| 国产亚洲一区二区三区在线| 国产无码高清视频不卡| 国产一区三区二区中文在线| 亚洲愉拍一区二区精品| 欧美成人a∨视频免费观看 | 免费在线观看av| 鲁鲁鲁爽爽爽在线视频观看| 欧美精品H在线播放| 亚洲精品无码av中文字幕| 好吊妞欧美视频免费| 九九免费观看全部免费视频| 伊人精品成人久久综合| 亚洲AV无码乱码在线观看裸奔| 国产成人乱码一区二区三区在线| 国产亚洲欧美在线人成aaaa| 欧美一区日韩一区中文字幕页| 欧美激情视频二区| 天天操天天噜| 国产jizzjizz视频| julia中文字幕久久亚洲| 香蕉久久永久视频| 欧美视频二区| lhav亚洲精品| 亚洲国产高清精品线久久| 国产嫖妓91东北老熟女久久一| 青青热久麻豆精品视频在线观看| 好紧好深好大乳无码中文字幕| Jizz国产色系免费| 亚洲国产成人精品青青草原| 影音先锋丝袜制服| 色视频国产| 尤物国产在线| 大学生久久香蕉国产线观看| 国产精品亚洲天堂| 成人国产小视频| 五月天综合网亚洲综合天堂网| 久久久波多野结衣av一区二区| 中文字幕久久亚洲一区| 2022国产91精品久久久久久| 国产精品自拍露脸视频|