999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

利用機器學習算法的海洋漁船捕撈能力影響因素權重分析

2021-09-16 09:05:44孫佳新
農業工程學報 2021年13期
關鍵詞:因素能力模型

呂 超,孫佳新,劉 爽

利用機器學習算法的海洋漁船捕撈能力影響因素權重分析

呂 超,孫佳新,劉 爽※

(上海海洋大學工程學院,上海 201306)

針對傳統方法在宏觀層面上進行海洋漁船捕撈能力計量分析中,對指標數量要求有限,考慮因素不足、漁船作業數據利用不充分等問題,該研究在分析南海三省2018至2019年間,約20萬條海洋漁船捕撈監測數據特征的基礎上,提出了基于機器學習算法的單船捕撈能力影響因素權重分析評價模型。首先,利用四分位法、主成分分析法以及數據標準化與獨熱編碼法對原始數據集進行了清洗處理,獲得了4萬余條可靠數據。進一步,采用機器學習算法,構建了BP神經網絡、決策樹和隨機森林算法分析模型,同時,利用網格搜索和交叉驗證結合遍歷循環創建6000次生成學習曲線,結果表明隨機森林模型的均方誤差、平均絕對誤差和可決系數均最優,表現最好的一組參數的決定系數達0.951,明顯優于另外兩種算法模型。最后,基于隨機森林算法對各指標進行權重提取,得出本次研究數據集中漁撈監測數據所包含的影響因素權重排序,結果顯示,影響漁船捕撈能力的各因素權重依次為:網次產量(50.070%)、pa(功率、總噸和船長降維后的指標)(23.779%)、拖網(包括單拖、雙拖以及拖蝦網)(9.409%)、網次數量(6.782%)、作業時長(4.578%)、刺網(2.019%)、張網(1.347%)、圍網(1.228%)、罩網(0.628%)、雜漁具(0.122%)、釣具(0.022%)、船齡(0.009%)、鋼質漁船(0.002%)、玻璃鋼漁船(0.002%)和木質漁船(0.002%)。研究結果明晰表征了各因素的影響占比,可為海洋捕撈漁船捕撈能力量化評價與監管、減船轉產與更新改造等海洋捕撈業管理提供重要的技術支撐與參考。

漁業;漁船; 機器學習算法;捕撈能力;智慧漁業工程

0 引 言

按照國際糧農組織的定義,捕撈能力是“漁船或漁船船隊如果充分利用,可在一定時間內生產的魚數量”,一般以一定時期、相同資源環境下單船或船隊捕撈漁獲量來衡量漁船或船隊的捕撈能力。影響捕撈能力的因素較多,主要有:規格參數,比如尺寸、功率、總噸等;作業類型,比如拖網、圍網、刺網等;網具參數,比如網次產量、網目尺寸、網具結構材料等;漁業資源,比如漁期、海域地理等;生產作業參數,比如作業時長、作業環境、網次數量等;捕撈技術及設備,比如船長經驗、船載機械設備、探魚儀器等,還包括船長船員情緒等管理及人為等因素[1]。針對漁船捕撈能力的研究,現有方法是圍繞投入與產出之間的技術效率、投入因素利用率等進行量化分析研究,主要研究方法包括:峰值法(Peak To Peak Method,PTP)[2]、隨機生產邊界法(Stochastic Production Frontiers,SPF)[3]和數據包絡分析方法(Data Envelopment Analysis,DEA)[4]。以FAO(Food and Agriculture Organization of the United Nations)推薦的數據包絡分析法(C2R模型)為例,方法通常以某區域一定時間內的漁船總數、總功率、總噸和專業捕撈總人數(年捕撈作業超過6個月的職業漁民)等因素作為實際投入指標,以實際捕撈量作為產出指標,計算捕撈能力技術效率以及投入因素利用率等。在此基礎上,對各投入因素總量利用度進行逐項分析,并根據利用度高低給出各投入指標削減建議。

Vestergaard等采用DEA-Malmquist模型對丹麥刺網船隊捕撈能力利用度展開分析,研究發現,針對鱈魚捕撈的能力利用度遠低于其他魚種,而導致這一現象的原因是受漁業政策影響,針對其他魚種的捕撈,船隊的可變投入“時間”比鱈魚船隊捕撈高出約27%[5]。張祝利等采用DEA法,通過分析1979年到2016年的《中國漁業統計年鑒》關于近海捕撈投入方向的數據,認為中國政府出臺的漁船“雙控政策”實施以來受多方面因素影響并未達到預期效果[6]。Tingley等采用DEA-C2R模型和SPF法對船隊的技術效率展開對比研究,研究以英吉利海峽船隊的固定投入船只數量、總噸和功率等和可變投入作業時間、船員人數作為投入量,以船隊捕撈量作為產出量,結果表明,在一些情形下DEA法有著比SPF法更強的適應性[7]。鄭奕等采用數據包絡分析方法對中國1994年至2005年之間近海海洋捕撈和遠洋捕撈能力利用度情況進行了研究,研究發現,中國近海捕撈能力存在嚴重的過剩情況,最大過剩率已超過50%[8]。饒欣等利用2009年至2014年《中國漁業統計年鑒》的統計數據,通過DEA法,比較研究了中國東海、黃海和南海的捕撈能力情況[9]。Vassdal等采用DEA-BC2模型研究了挪威大西洋鮭魚捕撈船隊2001年至2008年間的能力利用度,研究提出一種以馬爾奎莫斯特生產效率指數MPI(Malmquist Productivity Index)作為衡量指標的方法,結果表明2001年至2005年間船隊的利用度持續增加,隨后出現大幅度下降趨勢[10]。Lim等采用DEA-Malmquist模型和SPF法對馬來西亞拖網和圍網船隊中安裝回聲探測儀對捕撈技術效率的影響,研究表明DEA和SPF法一致認為安裝回聲探測器的船隊的技術效率明顯高于未安裝的船隊,在安裝回聲探測器的船隊中,DEA的計算效率為56.6%,SPF法的計算效率約為71.7%[11]。梁鑠等基于中國沿海11省2008年至2011年的近海捕撈數據,采用隨機前沿分析法研究多項漁業管控政策對中國近海漁業捕撈技術效率的影響[12]。Asche等采用DEA-Malmquist模型對挪威鮭魚養殖水產養殖企業的全要素生產效率變化展開研究,研究發現全要素生產效率每年變化約1%~2%,其中技術效率貢獻約0.2%~1.2%[13]。Su等以拖網漁業為研究對象,采用DEA法研究了1960年至2010年間,拖網漁船的技術發展對捕撈能力的影響,研究發現,漁具技術的發展推動了捕撈能力的迅速提升,僅1980年至2010年間,拖網漁船捕撈能力就提升了2~3倍[14]。多年來,眾多學者利用DEA法作為捕撈能力分析的主要方法,取得了有益成果,然而DEA方法無法求得影響因素權重,同時也存在諸如模型指標數量有限、求解權重無法比較、無法對各指標權重進行全排序、對大量實際監測數據處理能力不足等局限[15]。

綜上所述,當前漁船捕撈能力的研究主要考慮漁船功率、總噸、船長以及數量4個指標因素,忽視了其他大部分因素,如衡量網具性能的重要指標網次產量(按照每艘或不同等級漁船某一時期的產量除以各自投網次數計算)、網具類型、生產作業參數等因素。此外,現有研究中,尚不見基于捕撈監測數據,開展海洋機動漁船單船捕撈能力影響的研究。針對上述問題,該研究基于南海三省2018至2019年漁撈監測數據,以監測數據所含字段信息因素為重點,在分析數據特征的基礎上,利用機器學習算法,探索研究包含漁船功率、總噸、船長、作業類型、網具參數、船齡、材質等多參數對單船捕撈能力的影響,并計算得出影響因素權重排序,力求全面綜合地考察多因素對單船捕撈能力的影響。

1 數據及其處理

1.1 數據及其分析

該研究數據來源于南海三省2018年至2019年間近700艘漁船主要規格參數信息及近20萬條捕撈監測數據,數據信息來源于廣東省漁業漁船管理監測系統和農業農村部全國漁船動態管理系統。監測數據字段信息所含的因素主要包括:漁獲量(kg)、功率(kW)、總噸(t)、船長(m)、船齡(a)、漁船材質、作業方式、網次產量(kg)、作業時長(h)和網次數量等。統計部分不同作業類型漁船漁撈數據信息,展示如表1。表中序號是漁撈監測數據表中對應的數據行數序號,其中部分網次產量值是依據該船近3年在同一區域和時期而得出的經驗平均值,為此,漁撈監測數據得到的漁獲量并不等于網次產量與網次數量的理論乘積值,漁獲量還因資源環境、船長經驗等其他因素影響而不同,但本研究基于漁撈監測數據的字段信息而展開,不涵蓋的信息因素比如探魚儀器、漁場資源以及船長經驗等不在本研究考慮范圍內。從表中觀察能夠看出較少關系規律,還需基于大量數據樣本,充分利用漁撈數據,采用人工智能算法開展自學習推演,以獲得更優的結果規律。

表1 部分類型漁船漁撈數據

進一步分析捕撈監測數據,梳理其主要特征:1)數據類型多樣。樣本數據中既有數字型,也有字符型,數據特征多樣,需要將不同數據類型處理成計算機能夠識別的類型;2)數據噪聲較大。原始數據樣本中存在異常值和缺失值,比如大中型漁船一定時間內的漁獲量僅為個位數或者部分漁獲量字段信息漏填等;3)漁船功率、總噸、船長參數間具有相關性。船長、總噸和功率是漁船主要規格參數,根據經典漁船設計理論算式,3個參數之間存在函數關系[16],利用統計學中的相關與回歸分析理論中的相關系數法,衡量3個參數之間的相關性,結果顯示:功率與總噸相關系數為0.836;功率與船長相關系數為0.762;總噸和船長相關系數為0.972。綜上對漁撈數據特征分析,在利用算法計算分析之前,需要先進行數據清洗工作。針對數據存在的問題,該研究采用病態數據分析、四分位法、主成分分析法以及標準化和獨熱編碼處理結合的方式對捕撈數據進行清洗處理。

1.1.1 四分位法

針對上述原始數據樣本中存在異常值和缺失值問題,通過四分位法對原始數據進行病態數據合并以及異常值的剔除處理。捕撈監測數據受限于漁民對填報數據的重視程度不同,導致所填數據存在較多的異常值,在該研究中統稱為“異常點”。異常點在單船捕撈能力影響因素研究中會影響各因素權重的分析判斷,為提升研究結果準確性,需要剔除這些異常點。

四分位法是統計學中分析數據特征簡單、高效的手段之一[17]。四分位法利用觸須(Whisker)上限W和下限W來剔除原始樣本集中的異常值,該研究中定義縱向時序矢量X中處于WW之間的數據點為X正常值,之外的點為X異常值。將漁撈數據集中的全部數據按照漁獲量大小順序依次排列為4等份,處于分割點位置的3個數值就是四分位數,第一、第三分位數分別表示X前25%和后25%數據點的位置所表示的數值。X的四分位間距表示大小處于X中間50%的X(其中,=1,2,3,…,)的集合,四分位間距框的大小整體反應漁撈數據的集中程度。

1.1.2 主成分分析法

自變量在對因變量作解釋時,會因為自變量之間高度的相關關系而導致自變量對因變量的解釋能力變弱。針對漁撈數據信息中的船長、總噸和功率之間的相關性問題,為降低因素之間相關性,采用主成分分析法(Principal Component Analysis,PCA)對船長、總噸和功率進行降維處理。

計算如下:

設維向量為目標子空間的一個坐標軸方向,稱為映射向量,最大化數據映射后的方差,有:

式中tr表示矩陣的跡,是數據協方差矩陣。

1.1.3 獨熱編碼處理

漁船捕撈能力研究是一個復雜系統工程問題,字符型數據的存在是其鮮明的特征,而獨熱編碼在處理這種類型數據問題時具備高效、快捷等特點。獨熱編碼,又稱為有效編碼,這種方式是使用位寄存器來對個狀態進行編碼,且每個狀態都有獨立的寄存器位,在任意時候其中只有一位數據有效,即將同屬性但不同類型的字符型數據進行特征數字化處理。利用獨熱編碼技術對離散無序的數據類型進行特征數字化處理,制作成真實標簽[19],如漁船材質(木質)標記為“100”,漁船材質(鋼制)標記為“010”,漁船材質(玻璃鋼)則標記為“001”,同理將不同作業方式進行標簽化處理,如表2中所示4艘漁船的木質與玻璃鋼質為0,鋼質為1,則表示表中所示漁船的材質是鋼質。利用上述方法對漁撈數據進行清洗與標準化處理,基于Python語言環境,形成后續機器學習算法能夠識別的標準化數據,清洗后的數據達4萬余條,部分數據結果如表2所示。其中由于采用sklear分解時的方法是通過奇異值分解(Singular Value Decomposition,SVD)來實現的,分解后沒有進行翻轉特征向量符號以強制執行確定性輸出操作,為此表2中數據有負號出現,但不影響最終的算法計算結果。

1.2 算法及參數設置

機器學習算法在計算漁船捕撈努力量方面得到了應用[20],但相對于支持向量機核函數選擇上有著較高的要求,該研究數據集樣本量大,結構復雜且計算過程耗時漫長,因此支持向量機不是最佳算法選擇。隨機森林、決策樹和BP神經網絡算法則不需要選擇核函數,卻仍具備準確的計算效果,尤其是隨機森林與決策樹算法比支持向量機更適合處理同時具有字符型和數字型的數據。

表2 部分數據獨熱編碼處理結果

注:表中數據沒有進行翻轉特征向量符號的數字化處理;“pa”表示船長、總噸、功率主成分分析后的指標。

Note: The data in the table has not been digitized for symbols of flipped eigenvectors;“pa” means index of length and gross tonnage and power of fishing vessels by principal component analysis.

1.2.1 BP神經網絡算法

人工神經網絡(Artificial Neural Network,ANN)結構十分復雜,類似于一種網絡拓撲結構,由無數個人工神經元相互連接而成,是基于生物神經網絡處理信息的原理模擬發展而來,形成一種特殊數學抽象表現。BP神經網絡被廣泛應用于人工智能、數據分析等領域,它的結構主要由三個層面組成,即:輸入層、隱含層和輸出層[21]。其兩層模型結構示意如圖1所示。

1.2.2 決策樹與隨機森林算法

決策樹(Decision Tree)是在數據挖掘、統計等領域應用最廣泛的技術方法之一,能夠表現復雜關系的非線性模型及其特征關系。算法在訓練數據樣本時,是類似于樹枝分叉一般自上而下的經過每一個環節評估特征分割的信息增益,挑出分割數據集最佳特征,接著對分割的全部子問題采用遞歸處理,而數據樣本將被劃分到樹的各個枝干。依據上述原則,重復操作直到最優結果后停止運算[22]。決策樹在訓練過程中,特征劃分選擇的關鍵在于怎樣挑出最佳劃分方式,常用的方法有包括:信息增益、增益率和基尼指數。

隨機森林是一種基于Bagging和決策樹的有監督學習算法,從原始樣本集中有放回地隨機抽取訓練樣本,并訓練得到單個弱學習器,該弱學習就被稱為回歸樹,并基于此重復上述訓練過程,隨著訓練次數的增加,生產的回歸樹就構成了隨機森林,最終算法會根據所有樹的預測結果進行平均化處理,進而得到最終預測值。

算法在訓練數據過程中主要采用裝袋法(Bagging method)和自助法(Bootstrap method)來實現的,具體的構建步驟如下:

1)使用Bootstrap方法隨機有放回地從個原始訓練樣本中選擇(<)個樣本,生產個訓練子集。

2)使用訓練子集訓練回歸樹,在節點上所有的樣本特征中隨機選擇一部分樣本特征,依據最小均方差進行回歸樹的左右子樹劃分,遞歸建樹直到滿足終止條件。

3)重復上述步驟,將多棵回歸樹組成隨機森林。

4)將測試樣本輸入隨機森林回歸模型,取所有樹預測值的平均值作為最終預測結果,并與實際值對比,評價模型的擬合效果。

1.2.3 隨機森林調參

利用捕撈監測數據,基于隨機森林建立投入值對產出值的影響關系回歸模型。漁船主規格參數(船長、總噸和功率)、網次產量、網次數量、作業方式、作業時間、船齡和漁船材質設為模型的輸入(特征參數),漁獲量為模型的輸出(目標參數)。并將數據樣本無序拆分成訓練集(70%),測試集(30%)。同時,考慮到參數之間的量化綱差異,采用標準化處理方式進行無量化綱處理。

在隨機森林眾多的可調參數中,主要有:回歸樹數目n、最大特征值m、回歸最大深度m、內部節點再劃分的最小樣本數量m和葉子節點最小樣本數m等。需要指出的是,若n數量過小則會易造成模型欠擬合,太大則又易造成過擬合;m的作用是限制子樹繼續劃分的條件,當節點的樣本量小于m時,劃分將停止;m與回歸樹的剪枝有關,而剪枝有助于模型增強其泛化能力,當m大于葉子節點數時,同枝干上的節點將都被剪枝。為防止過擬合的發生,通常研究不會追求過高的可決系數值,在多次嘗試后發現模型的泛化能力較好,且隨著m的提升,模型的優度不斷提升,因此決定對nmm3個參數進行調參,而m不作限制[23]。對nmm3個參數進行尋優,給定參數足夠的范圍n∈[500,1 000]并且n為10的倍數,m∈[1,12],m∈[1,12],采用網格搜索與交叉驗證結合的方式,讓計算遍歷循環持續學習,訓練出最好的模型,建立了6 000次隨機森林模型生成學習曲線,并對表現最好的一組參數進行提取[24]。同步驗證不調參與默認值條件下的回歸效果。分別評價模型調參前后的訓練效果,評價指標為均方誤差(Mean Squared Error,MSE)。隨機搜索返回的最優參數組合為:n=921,m=10,m=3。

使用隨機森林搜索返回的最優參數組合建立隨機森林回歸模型,并使用訓練集對模型進行訓練,最后利用測試集測試模型的回歸效果。為了驗證模型回歸的精確性,同時采用BP神經網絡、決策樹和隨機森林算法建立對比回歸模型,并引入均方誤差MSE、平均絕對誤差(Mean Absolute Error,MAE)以及決定系數2作為模型回歸效果的評價指標。

2 結果與分析

3種模型測試結果如表3所示。

表3 3種模型調參后的擬合效果對比

通常情況下,有效模型的可決系數2的取值范圍默認為[0,1],2越接近1,表示模型回歸效果越好,反之越接近0則越差。由表3可知,經過調參后的隨機森林回歸模型可決系數2值最大(0.951),調參后模型回歸效果有顯著提升,且所有回歸模型的MAE和MSE均小于默認參數的隨機森林回歸模型。

進一步,對測試集進行反標準化,繪制3種算法模型的單船投入因素條件下漁獲量的預測值與實際漁獲量對比圖,如圖2所示。由于測試集的樣本量大,故只截取50組數據進行對比。

由圖2可以看出,3種算法建立的回歸模型都能反應投入因素與產出漁獲量之間的變化關系,基于調參后隨機森林算法的回歸模型可決系數、均方誤差和平均絕對誤差均優于其他算法模型。利用隨機森林算法計算得出的各影響因素權重值見表4所示。

表4 各因素權重值

通過上述影響因素排序及各自權重的計算結果,一方面可得:1)在現有捕撈監測數據范圍內的因素中,網次產量、漁船(總噸、功率和船長)對單船捕撈能力的影響最大,二者權重值之和可達73.849%;2)從不同的網具類型來看,拖網(包括單拖雙拖)對單船捕撈能力的影響明顯要高于其他網具,而影響最小的網具類型是釣具;3)船齡與漁船材質權重之和僅為0.015%,整體來看可忽略不計;4)漁船在同等網次數量和作業時長的條件下,忽視船齡、漁船材質的影響,漁船總噸、功率和船長的船舶規格參數越大,網次產量越大,則漁船的捕撈能力越強;5)同等條件下拖網漁船捕撈能力依次強于刺網、張網、圍網、罩網、雜漁具和釣具漁船。

另一方面,參照所得因素排序與權重值的研究結果,能夠為海洋漁船監管提供建議參考:1)為減船轉產補貼計算和單船捕撈能力評價提供多因素權重值;2)網具參數與功率總噸船長漁船規格參數,影響占比最大,是后續捕撈強度管控的重點;3)網次產量、網次數量與作業時長,影響捕撈能力加起來超過60%,因此,限額捕撈、漁獲定點上岸等產出式管理政策需要進一步加強;4)漁船功率總噸船長影響捕撈能力約占24%,減船轉產項目可持續進行;5)為現有“雙控”管理制度的更新與完善,提供更加靈活多樣的因素選擇。

研究結果能夠為現行以控漁船數量與功率的“雙控”制度提供多因素控制的支持參考,為現行以單一功率因素核算減船轉產補貼政策的優化提供多因素參考,為實現漁船裝備現代化升級與其捕撈能力之間協調平衡的更新改造政策優化提供參考,進而為“十四五”漁船監管制度的完善與優化提供幫助。

3 結 論

針對影響因素考慮不足、漁撈數據重視不夠等問題,基于機器學習算法開展了單船捕撈能力影響因素權重分析與研究,涵蓋了船長、總噸、功率、網次產量、作業時長、網次數量、拖網、張網、刺網、圍網、罩網、釣具、船齡以及材質等15種以上因素。基于漁撈監測數據,建立了包括神經網絡、決策樹以及隨機森林回歸模型,計算得出了各影響因素權重值,結果表明:

1)神經網絡、決策樹以及隨機森林算法,均能夠較好地體現投入與產出因素的變化,決定系數2均大于0.84,機器學習算法等智能算法非常適合包含多因素的漁船捕撈能力分析與研究。

2)各影響因素的權重值及其排序,表明網次產量、漁船功率、總噸、船長4個因素的占比達到73.849%,是計算或控制單船捕撈能力重點考慮的指標。

3)該研究將機器學習算法用于包含多影響因素的海洋漁船捕撈能力研究中,推進了大數據、人工智能等智慧技術在農業水產、海洋漁業領域的應用。相對于傳統解決方法,所采用的方法能夠涵蓋漁船捕撈能力分析的多個因素指標,能夠提升多指標因素預測回歸的準確性,計算得出權重排序。

海洋漁船捕撈能力分析,是一項復雜的系統工程,涉及眾多變量因素,穩定、廣泛且高質量的包含捕撈數據在內的多源監測數據是推進捕撈能力精準管控的重要源泉,也是未來推進海洋漁業、海洋工程裝備數字化、智慧化升級、優化的重要支持,為此,有必要全面加強開展海洋漁業及其裝備等高質量數據采集與維護工作。對于包含漁撈數據、統計數據等多數據融合推演的海洋漁船捕撈能力的分析,進而對單船捕撈能力進行量化研究,將是下一步的工作。

[1] FAO Technical Guidelines for Responsible Fisheries No.4 Suppl.3 Fisheries Management 3. Managing Fishing Capacity[M]. Rome:Food and Agriculture Organization of the United Nations, 2008.

[2] 蘇新紅,方水美,鄭奕,等. 福建省燈光圍網作業的捕撈能力[J]. 水產學報,2004,28(3):303-310.

Su Xinhong, Fang Shuimei, Zheng Yi, et al. Fishing capacity of light-purse seine in Fujian province[J]. Journal of Fisheries of China, 2004, 28(3): 303-310. (in Chinese with English abstract)

[3] 顏云榕,馮波,盧伙勝. 中、西沙海域2種燈光作業漁船的捕撈特性及其技術效率分析[J]. 南方水產,2009,5(6):59-64.

Yan Yunrong, Feng Bo, Lu Huosheng. Comparative analysis on fishing capability of two light attracting commercial fishing methods around Zhongsha and Xisha Islands sea areas,south China Sea[J]. South China Fisheries Science, 2009, 5(6): 59-64. (in Chinese with English abstract)

[4] Laso J. Revisiting the LCA+DEA method in fishing fleets. How should we be measuring efficiency?[J] Marine Policy, 2018, 91(5): 34-40.

[5] Vestergaard N, Squires D, Kirkley J. Measuring capacity and capacity utilization in fisheries: the case of the danish gill-net fleet[J]. Fish. Res. 2003, 60(2): 357-368.

[6] 張祝利,吳姍姍,李勝勇,等. 我國漁船“雙控制度”實施有效性評估與政策建議[J]. 中國水產,2018(4):34-40.

Zhang Zhuli, Wu Shanshan, Li Shengyong, et al. Effectiveness evaluation and policy suggestions of “dual control” implementation for Chinese fishing vessels[J]. China Fisheries, 2018(4): 34-40. (in Chinese with English abstract)

[7] Tingley D, Pascoe S, Coglan L. Factors affecting technical efficiency in fisheries: Stochastic production frontier versus data envelopment analysis approaches[J]. Fish. Res. 2005, 73(3): 363-376.

[8] 鄭奕,方水美,周應祺,等. 中國海洋捕撈能力的計量與分析[J]. 水產學報,2009,33(5):885-892.

Zheng Yi, Fang Shuimei, Zhou Yingqi, et al. The measuring and analyzing on the fishing capacity for Chinese marine fleets[J]. Journal of Fisheries of China, 2009, 33(5): 885-892. (in Chinese with English abstract)

[9] 饒欣,黃洪亮,陳雪忠,等. 中國東海、黃海及南海捕撈能力的比較分析[J]. 海洋漁業,2016,38(6):680-688.

Rao Xin, Huang Hongliang, Chen Xuezhong, et al. Measurement and comparison of capacity utilization in Chinese waters[J]. Marine Fisheries, 2016, 38(6): 680-688. (in Chinese with English abstract)

[10] Vassdal T, Holst H M S. Technical progress and regress in Norwegian Salmon farming: A malmquist index approach[J]. Mar. Resour. Econ. 2011, 26(4): 329-341.

[11] Lim G, Ismail A L, Hussein M A. Does technology and other determinants effect fishing efficiency? An application of stochastic frontier and data envelopment analyses on trawl fishery[J] J. Appl. Sci. 2012, 12(1):48-55.

[12] 梁鑠,秦曼. 中國近海捕撈業技術效率影響因素分析:基于省級面板數據[J]. 中國漁業經濟,2016,34(1):55-62.

Liang Shuo, Qin Man. The study on affecting factors of technical efficiency of inshore-offshore fishery in China: Based on provincial panel data[J]. Chinese Fisheries Economics, 2016, 34(1): 55-62. (in Chinese with English abstract)

[13] Asche F, Guttormsen A G, Nielsen R. Future challenges for the maturing Norwegian salmon aquaculture industry: an analysis of total factor productivity change from 1996 to 2008[J]. Aquaculture, 2013, 396(6): 43-50.

[14] Su J H, Liu S Y, Yun O T, et al. Change of relative fishing power index from technological development in the otter trawl fishery[J]. Journal of the Korean Society of Fisheries and Ocean Technology, 2020, 56(1): 26-36.

[15] 胡賀年,竇學誠. 基于DEA方法的種業經濟效益評價研究:以張掖市玉米種業為例[J]. 中國農業科技導報,2015,17(6):150-157.

Hu Henian, Dou Xuecheng. Studies on economic benefits evaluation of seed industry based on DEA model: A case study of Zhangye corn seed industry[J]. Journal of Agricultural Science and Technology, 2015, 17(6): 150-157. (in Chinese with English abstract)

[16] 賈復. 漁船設計[M]. 北京:農業出版社,1990.

[17] 楊錫運,劉玉奇,李建林. 基于四分位法的含儲能光伏電站可靠性置信區間計算方法[J]. 電工技術學報,2017,32(15):136-144.

Yang Xiyun, Liu Yuqi, Li Jianlin. Reliability confidence interval calculation method for photovoltaic power station with energy storage based on quartile method[J]. Transactions of China Electro Technical Society, 2017, 32(15): 136-144. (in Chinese with English abstract)

[18] 李元,張昊展,唐曉初. 基于多模態數據全信息的概率主成分分析故障檢測研究[J]. 儀器儀表學報,2021,42(2):75-85.

Li Yuan, Zhang Haozhan, Tang Xiaochu. Study on probabilistic principal component analysis fault detection based on full information of multimodal data[J]. Chinese Journal of Scientific Instrument, 2021, 42(2): 75-85. (in Chinese with English abstract)

[19] Abril V U A, Itzamá L Y, Cornelio Y M. One-hot vector hybrid associative classifier for medical data classification[J]. Plos One, 2014, 9(4): 1-10.

[20] 楊勝龍,張勝茂,周為峰,等. 采用AIS計算中西太平洋延繩釣漁船捕撈努力量[J]. 農業工程學報,2020,36(3):198-203.

Yang Shenglong, Zhang Shengmao, Zhou Weifeng, et al. Calculating the fishing effort of longline fishing vessel in the western and central pacific ocean using AIS[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2020, 36(3): 198-203. (in Chinese with English abstract)

[21] 唐建軍,王映龍,彭瑩瓊,等. BP神經網絡在水稻病蟲害診斷中的應用研究[J]. 安徽農業科學,2010,38(1):199-200,204.

Tang Jianjun, Wang Yinglong, Peng Yingqiong, et al. Application study on BP neural network in the diagnosis of rice diseases and Pests[J]. Journal of Anhui Agricultural Sciences, 2010, 38(1): 199-200, 204. (in Chinese with English abstract)

[22] 陳靜波,劉順喜,汪承義,等. 基于知識決策樹的城市水體提取方法研究[J]. 遙感信息,2013,28(1):29-33,37.

Chen Jingbo, Liu Shunxi, Wang Chengyi, et al. Research on urban water body extraction using knowledge-based decision tree[J]. Remote Sensing Information, 2013, 28(1): 29-33, 37. (in Chinese with English abstract)

[23] 李玉強,陳鋆昊,李琦,等. 基于差分隱私下包外估計的隨機森林算法[J]. 哈爾濱工業大學學報,2021,53(2):146-154.

Li Yuqiang, Chen Junhao, Li Qi, et al. Random forest algorithm under differential privacy based on out-of-bag estimate[J]. Journal of Harbin Institute of Technology, 2021, 53(2): 146-154. (in Chinese with English abstract)

[24] 李蔚,吳愷逾,陳堅紅,等. 基于非線性自回歸神經網絡和隨機森林算法的核電汽輪機組出力優化[J]. 中國電機工程學報,2021,41(2):409-416.

Li Wei, Wu Kaiyu, Chen Jianhong, et al. Output optimization of nuclear power steam turbine based on nonlinear autoregressive neural network and random forest algorithm[J]. Proceedings of the CSEE, 2021, 41(2): 409-416. (in Chinese with English abstract)

Weight analysis of influencing factors of fishing capacity of marine fishing vessels using machine learning algorithm

Lyu Chao, Sun Jiaxin, Liu Shuang※

(,,201306,)

Previous quantitative analysis is often made at the macro level, such as the fishing capacity of marine fishing vessels. There are some limited requirements on the number of indicators in the fishing vessel operation. In this study, a weight evaluation model was presented on the influencing factors in the fishing capacity of a single vessel using machine learning. Fishing monitoring data were about 200,000 rows from 2018 to 2019 in three provinces of the South China Sea. First, the cleaning of original data was implemented using quartile, principal component analysis, data standardization, and unique thermal coding, where reliable data of more than 40,000 rows was obtained.Secondly, machine learning was used to construct the BP neural network, decision tree, and random forest models. At the same time, the grid search and cross validation combined with the traversal cycle were used to create 6,000 generations of learning curves.The results showed that the random forest model performed the best in terms of mean square error, mean absolute error, and determination coefficient, where the determination coefficient of the best parameters group was 0.951, indicating that the random forest model was obviously superior to others.Finally, the weights of each index were extracted using the random forest, thereby obtaining the weights of fishing monitoring data.The result showed that the weights of various influencing factors were as follows: Output of nets(50.070%), PCA (after reducing the dimension of power, gross ton and length)(23.779%), trawls (including single tow, double tow and shrimp tow nets)( 9.409%), number of nets(6.782%), operating time(4.578%), gill nets(2.019%), net drawing(1.347%), seine nets(1.228%), cover nets(0.628%), fishing gear(0.122%), fishing tackle(0.022%), age of vessel(0.009%), material of fishing vessel (steel)(0.002%), material of fishing vessel (FRP) (0.002%) and material of fishing vessel (wood) (0.002%).The research results clearly represent the impact proportion of various factors, which can provide important technical support and reference for the quantitative evaluation and supervision of the fishing capacity of marine fishing vessels, ship reduction and conversion, renewal and transformation and other marine fishing industry management.

fishing; fishing vessels; machine learning algorithm; fishing capacity; smart fisheries engineering

呂超,孫佳新,劉爽. 利用機器學習算法的海洋漁船捕撈能力影響因素權重分析[J]. 農業工程學報,2021,37(13):135-141.

10.11975/j.issn.1002-6819.2021.13.016 http://www.tcsae.org

Lyu Chao, Sun Jiaxin, Liu Shuang. Weight analysis of influencing factors of fishing capacity of marine fishing vessels using machine learning algorithm[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2021, 37(13): 135-141. (in Chinese with English abstract) doi:10.11975/j.issn.1002-6819.2021.13.016 http://www.tcsae.org

2021-04-12

2021-06-19

農業農村部財政項目(D8021210076),國家自然科學基金面上項目(51876114),上海海洋可再生能源工程技術研究中心(19DZ2254800),上海海洋大學海洋科學研究院開放課題基金資助(A1020300300102)

呂超,副教授,研究方向為海洋漁業工程與船舶、海洋能源利用、系統建模仿真等。Email:clv@shou.edu.cn

劉爽,講師,研究方向為海洋漁業工程與船舶、海工裝備力學分析與優化等。Email:s-liu@shou.edu.cn

10.11975/j.issn.1002-6819.2021.13.016

S126

A

1002-6819(2021)-13-0135-07

猜你喜歡
因素能力模型
一半模型
消防安全四個能力
腹部脹氣的飲食因素
中老年保健(2022年5期)2022-08-24 02:36:04
群眾路線是百年大黨成功之內核性制度因素的外在表達
當代陜西(2021年12期)2021-08-05 07:45:46
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
大興學習之風 提升履職能力
人大建設(2018年6期)2018-08-16 07:23:10
你的換位思考能力如何
3D打印中的模型分割與打包
短道速滑運動員非智力因素的培養
冰雪運動(2016年4期)2016-04-16 05:54:56
主站蜘蛛池模板: 亚洲欧洲日产国产无码AV| 亚洲第一视频网| 久久精品国产电影| 在线色国产| 2020精品极品国产色在线观看| 88国产经典欧美一区二区三区| 国产av一码二码三码无码| 国产成人三级| 91无码国产视频| 好紧太爽了视频免费无码| 久久久久国产精品嫩草影院| 久久性妇女精品免费| 91精品情国产情侣高潮对白蜜| 国产凹凸视频在线观看| 亚洲欧美在线综合图区| 国产精品刺激对白在线| 亚洲男女在线| 精品一区二区三区自慰喷水| 亚洲国产成人精品一二区| 日韩精品欧美国产在线| 97久久免费视频| 少妇高潮惨叫久久久久久| 日本手机在线视频| 91亚瑟视频| 为你提供最新久久精品久久综合| 老熟妇喷水一区二区三区| 亚洲AV无码一区二区三区牲色| 国产精品亚欧美一区二区| 亚洲精品免费网站| 亚洲精品国产精品乱码不卞| 激情成人综合网| 99视频在线观看免费| 亚洲aⅴ天堂| 成年A级毛片| 中文字幕第1页在线播| 97视频免费在线观看| 国产午夜无码专区喷水| 91免费在线看| 91在线免费公开视频| 欧美视频免费一区二区三区| 日韩一级毛一欧美一国产| 亚洲色图欧美在线| 在线色国产| 欧美日韩第三页| 国产精品美女免费视频大全 | 国产精品99久久久久久董美香 | 国产国产人成免费视频77777| 亚洲无码视频图片| 国产一二视频| 亚洲一区毛片| 日本欧美精品| 欧美成人看片一区二区三区| 在线看AV天堂| 欧美人与动牲交a欧美精品| 91午夜福利在线观看| 亚洲天堂777| 亚洲aaa视频| 在线观看av永久| 国产午夜福利片在线观看| 精品福利一区二区免费视频| 亚洲日韩精品无码专区97| 一级毛片在线播放免费观看| 国产一区二区人大臿蕉香蕉| 91九色国产porny| 国产亚洲欧美日韩在线一区| 中文无码日韩精品| 狠狠色丁婷婷综合久久| 精品国产免费观看一区| 免费A∨中文乱码专区| 色屁屁一区二区三区视频国产| 日韩欧美一区在线观看| 欧美国产在线看| 97狠狠操| 国产高潮流白浆视频| 精品国产香蕉伊思人在线| 国产97公开成人免费视频| 一区二区三区成人| 东京热av无码电影一区二区| 台湾AV国片精品女同性| 另类综合视频| 久久semm亚洲国产| 19国产精品麻豆免费观看|