袁紅春,王敏,劉慧,陳冠奇









摘要:長鰭金槍魚是南太平洋漁業(yè)生產(chǎn)中主要的捕撈對象,準確預(yù)測其漁場分布對提高漁業(yè)捕撈效率具有重要意義。針對傳統(tǒng)漁場預(yù)測方法預(yù)測精度低的問題,本研究提出一種基于特征交互與卷積網(wǎng)絡(luò)的漁場預(yù)測模型——CNN-Cross。該模型引入Embedding層對數(shù)據(jù)進行處理,解決了One-Hot Encoding(獨熱編碼)帶來的特征稀疏性問題以及手動特征工程對結(jié)果的影響。同時,引入Cross網(wǎng)絡(luò)提取特征之間的交互信息,消除了單特征對目標擬合不足的問題,并且結(jié)合CNN網(wǎng)絡(luò)對Embedding層生成的二維特征圖進行高階隱藏信息提取,最后將兩部分網(wǎng)絡(luò)提取到的特征融合,輸出分類結(jié)果。使用漁業(yè)數(shù)據(jù)對模型預(yù)測效果進行驗證,結(jié)果表明,模型預(yù)測南太平洋漁場總召回率達到87.4%,中心漁場召回率達到89.4%。表明,將特征交互網(wǎng)絡(luò)與卷積神經(jīng)網(wǎng)絡(luò)相結(jié)合可以明顯提高漁場預(yù)報精度,且精度能夠較好地滿足現(xiàn)實漁業(yè)作業(yè)需求。
關(guān)鍵詞:長鰭金槍魚;Cross網(wǎng)絡(luò);卷積神經(jīng)網(wǎng)絡(luò);特征交互
中圖分類號:S931.41文獻標識碼:A文章編號:1000-4440(2021)06-1501-09
Fishing ground prediction model based on feature interaction and convolutional network
YUAN Hong-chun 1,2,WANG Min 1,LIU Hui 1,CHEN Guan-qi 1
(1.College of Information Technology, Shanghai Ocean University, Shanghai 201306,China;2.Key Laboratory of Fisheries Information,Ministry of Agriculture and Rural Affairs,Shanghai 201306,China)
Abstract:Thunnus alalunga is the main fishing target of fishery production in the South Pacific Ocean. It is of great significance to accurately predict the fishery distribution of T. alalunga for improving fishery efficiency. In view of lack of accuracy of traditional fishery prediction methods, this paper proposed a fishery prediction model based on feature interaction and convolutional network—CNN-Cross. In this model, the Embedding layer was introduced to process the data, which solved the problem of feature sparsity caused by One-Hot Encoding and the influence of manual feature engineering on the result. At the same time, the Cross network was introduced to extract interactive information between different features to eliminate the problem of insufficient target fitting by single feature, and the two-dimensional feature map generated by the Embedding layer was extracted with the CNN network for high-order hidden information extraction. Finally, the features extracted by two networks were fused and the classification results were output. The effect of the model was verified by fishery data. The results showed that the predicted total recall rate of the South Pacific fishery reached 87.4%, and that of the central fishing ground reached 89.4%. The research results show that the combination of feature interaction network and convolutional neural network can obviously improve the accuracy of fishery forecast, and the accuracy can better meet the needs of practical fishery operations.
Key words:Thunnus alalunga;Cross network; convolutional neural network;feature interaction
長鰭金槍魚作為一種大洋性中上層高度洄游生物,具有較高的經(jīng)濟價值、營養(yǎng)價值[1]。長鰭金槍魚廣泛分布于各熱帶海域與溫帶海域[2],尤以南太平洋海域分布較廣。近年來,長鰭金槍魚已成為南太平洋金槍魚延繩釣的主要捕撈對象之一[3-5]。因此,準確預(yù)測南太平洋長鰭金槍魚漁場,對于降低漁業(yè)作業(yè)成本、提高尋找漁場效率具有極大的意義。
目前國內(nèi)外學(xué)者仍然使用傳統(tǒng)的方法與模型對漁場進行預(yù)測,并沒有對漁場預(yù)測與深度學(xué)習(xí)結(jié)合進行進一步探究。如Zainuddin等[6]分別利用廣義加性模型(GAM)和廣義線性模型(GLM)對長鰭金槍魚漁場進行回歸預(yù)測。崔雪森等[7]利用樸素貝葉斯建立漁場預(yù)報模型對西北太平洋柔魚漁場進行預(yù)測,對高產(chǎn)區(qū)預(yù)報精度達到69.9%。張孝民等[8]利用MAXNET模型預(yù)測西北太平洋秋刀魚潛在漁場。宋利明等[9]采用SVM研究了水中環(huán)境因子與長鰭金槍魚漁獲關(guān)系,建立了金槍魚棲息環(huán)境綜合指數(shù)模型。但由于海洋數(shù)據(jù)存在數(shù)據(jù)維度高、環(huán)境數(shù)據(jù)復(fù)雜等情況,目前傳統(tǒng)方法無法很好地擬合復(fù)雜數(shù)據(jù),對特征信息提取不夠充分,且在數(shù)據(jù)預(yù)處理過程中,人為因素也會對最后的預(yù)測準確度造成影響,存在預(yù)測精度較低的問題,導(dǎo)致預(yù)測結(jié)果對漁業(yè)作業(yè)的指導(dǎo)具有局限性。
現(xiàn)有的特征選擇方法都忽略了特征之間的交互作用。某一特征可能與目標沒有直接關(guān)聯(lián),如果將該特征與其他特征結(jié)合,就可能與目標密切相關(guān)[10]。目前特征交互在廣告點擊率預(yù)測領(lǐng)域已有較多的研究。如Guo等[11]提出DeepFM模型可以對特征進行二階交互,解決了特征稀疏情況下的特征組合問題,成功提高了廣告點擊率預(yù)測精度。Cheng等[12]提出wide & deep模型,該模型使用wide部分提取特征交互信息,并與DNN相結(jié)合,明顯提高了google play應(yīng)用的獲取率。由于海洋數(shù)據(jù)與廣告數(shù)據(jù)都具有高維稀疏特性,故本研究將特征交互技術(shù)應(yīng)用于漁場預(yù)測領(lǐng)域,從而進一步提高漁場預(yù)測精度。
隨著漁業(yè)捕撈技術(shù)的提高與科技的發(fā)展,漁業(yè)數(shù)據(jù)規(guī)模也變得越來越大。傳統(tǒng)方法對于大規(guī)模數(shù)據(jù)擬合效果欠佳,而深度學(xué)習(xí)可以挖掘出復(fù)雜動態(tài)場景中重要的語義特征,可以擬合高維復(fù)雜數(shù)據(jù)。CNN作為深度學(xué)習(xí)領(lǐng)域的代表,已在圖像識別、語音識別等方面取得巨大成功。CNN網(wǎng)絡(luò)從圖像中提取局部有效特征,可以有效提高模型的泛化性。因此,本研究將特征交互技術(shù)與CNN相結(jié)合,提出了一種全新的漁場預(yù)測模型——CNN-Cross網(wǎng)絡(luò)。模型采用Cross網(wǎng)絡(luò)部分提取顯式低階交互特征,采用CNN部分提取隱藏高階特征,然后對兩部分網(wǎng)絡(luò)的輸出結(jié)果進行融合,最后通過sigmoid函數(shù)輸出分類結(jié)果。
1材料與方法
1.1數(shù)據(jù)來源
本研究選取南太平洋110°E~135°W、5°S~40°S為研究區(qū)域,采用2000-2015年共16年數(shù)據(jù)進行試驗。
其中,漁業(yè)作業(yè)數(shù)據(jù)來自于中西太平洋漁業(yè)委員會(Western and Central Pacific Fisheries Commission, WCPFC)的南太平洋延繩釣數(shù)據(jù)。該數(shù)據(jù)包括空間坐標位置、漁業(yè)作業(yè)時間、平均釣鉤數(shù)以及平均漁獲量(質(zhì)量和尾數(shù))。本研究對該數(shù)據(jù)以月為時間單位進行統(tǒng)計,并將產(chǎn)量按5°×5°空間范圍進行歸并。部分漁業(yè)作業(yè)數(shù)據(jù)如表1所示。
環(huán)境因子選取海面高度(SSH)、海表溫度(SST)和葉綠素a濃度(Chla),3種環(huán)境因子數(shù)據(jù)均來自美國國家海洋和大氣管理局(Nation Oceanic and Atmospheric Administration, NOAA),并且3種環(huán)境因子數(shù)據(jù)以月為時間分辨率,空間分辨率為1°×1°網(wǎng)格。由于漁業(yè)作業(yè)數(shù)據(jù)與環(huán)境因子數(shù)據(jù)空間分辨率不匹配,所以需要將環(huán)境因子數(shù)據(jù)取在漁區(qū)網(wǎng)格中心點上,歸并為5°×5°空間分辨率,消除量綱。部分數(shù)據(jù)如表2所示。
1.2數(shù)據(jù)預(yù)處理
1.2.1單位捕撈努力量漁獲量(CPUE)在漁業(yè)生產(chǎn)當(dāng)中,通常使用單位捕撈努力量漁獲量(CPUE)作為評估漁業(yè)資源密度的指標[13]。CPUE通過公式(1)計算:
CPUE(m,n)=F(m,n)H(m,n)(1)
其中,CPUE(m,n)代表經(jīng)緯度為(m,n)漁區(qū)范圍內(nèi)的月平均CPUE,F(xiàn)(m,n)和H(m,n)分別代表該月該漁區(qū)漁獲尾數(shù)和某月該漁區(qū)總千鉤數(shù)。
1.2.2漁場等級劃分為了適應(yīng)模型的需要并使?jié)O場等級劃分更加合理,本研究采用陳雪忠等[14]的漁場等級劃分方式,計算了各月各個漁區(qū)的CPUE三分位數(shù),并將大于上三分位數(shù)的漁區(qū)劃分為中心漁場(分類標簽用1表示),小于上三分位數(shù)的漁區(qū)劃分為非中心漁場(分類標簽用0表示)。試驗使用了2000-2015年共16年南太平洋長鰭金槍魚作業(yè)數(shù)據(jù),把漁區(qū)按5°×5°空間分辨率進行劃分,最終得到10 603個樣本,其中,中心漁場數(shù)為3 584個,非中心漁場數(shù)為7 019個。
1.2.3分類標準的定義由于本試驗是二分類問題,而Sigmoid函數(shù)輸出(y)在0~1,優(yōu)化會相對穩(wěn)定方便,所以將Sigmoid函數(shù)作為最后輸出層的激活函數(shù),結(jié)果會更加合理。在樣本分布均勻的試驗中,定義當(dāng)y>0.5時,為正樣本(在本研究中為中心漁場)。但在本研究中,由于樣本分布不均勻,其中訓(xùn)練集中中心漁場數(shù)為2 669個,非中心漁場數(shù)為5 182個,故分類閾值應(yīng)按照公式(2)劃分:
y1-y=TF(2)
其中,T和F代表中心漁場與非中心漁場個數(shù)。故按照上式,最終的分類閾值為0.339。
1.2.4數(shù)據(jù)歸一化處理由于不同數(shù)據(jù)的單位、數(shù)量級以及量綱不同,故需要將月份、經(jīng)緯度、海面高度、海表溫度和葉綠素a濃度歸一化到0~1。計算公式如公式(3)所示:
x*=xi-xminxmax-xmin(3)
其中,x*表示某一樣本歸一化后的值,xi表示該樣本初始值,xmax、xmin分別表示樣本中某一類特征值中的最大值和最小值。
1.3模型結(jié)構(gòu)
本研究模型分為4部分,分別為Embedding層、Cross網(wǎng)絡(luò)、CNN網(wǎng)絡(luò)和輸出部分。首先Embedding層對one-hot編碼后的時空因子數(shù)據(jù)進行重新空間映射,然后CNN網(wǎng)絡(luò)對Embedding層生成的二維特征圖進行高階隱藏信息提取,同時將Embedding層生成的數(shù)據(jù)展平后與環(huán)境因子數(shù)據(jù)結(jié)合共同作為Cross網(wǎng)絡(luò)的輸入,在Cross網(wǎng)絡(luò)部分提取所有特征之間的顯式交叉信息。最后,在輸出部分將CNN網(wǎng)絡(luò)與Cross網(wǎng)絡(luò)提取到的特征進行融合,并通過Sigmoid激活函數(shù)輸出預(yù)測結(jié)果。
1.3.1Embedding層在回歸、分類等機器學(xué)習(xí)任務(wù)中,特征值之間的距離以及相似度計算的準確性對于模型的性能有顯著的影響,大部分算法計算距離和相似度都是基于歐氏空間。然而離散特征無法映射到歐氏空間導(dǎo)致無法計算距離和相似度,因此,對于離散特征需要進行One-Hot處理。使用One-Hot編碼,可以使非偏序關(guān)系的變量取值不具有偏向性,而且到原點的距離是等距的,能夠讓特征之間的距離計算更加合理,但數(shù)據(jù)在One-Hot編碼后會變得非常稀疏,不利于模型對相關(guān)信息的提取。針對One-Hot編碼帶來的稀疏問題,本研究使用Embedding技術(shù)來解決。
Embedding在數(shù)學(xué)上可以看作一種空間映射。該映射是單射,且映射前后結(jié)構(gòu)不變,即函數(shù)f被稱為單射函數(shù)時,對每一個y至多存在一個定義域內(nèi)的x使得f(x)=y。對應(yīng)到Embedding就是尋找一個單射函數(shù),將原始數(shù)據(jù)特征生成新的空間表示。
Embedding向量是動態(tài)生成的,無需繁瑣的手動特征工程, Embedding向量會隨機初始化得到一組隨機向量,接著該向量會像其他權(quán)重參數(shù)一樣隨著網(wǎng)絡(luò)訓(xùn)練最終確定,即Embedding向量會隨著網(wǎng)絡(luò)的訓(xùn)練得到優(yōu)化。本研究學(xué)習(xí)的是一個4維的Embedding向量,最終每一項都會映射到4維空間中的一個點,這樣相似項就會在該空間內(nèi)彼此鄰近。Embedding向量計算公式如式(4)所示:
xembed,i=Wembed,ixi(4)
其中,xembed,i是生成的嵌入向量,xi是離散特征(時空因子)生成的One-Hot編碼,Wembed,i∈ 瘙 綆 ne×nv是對應(yīng)的嵌入矩陣,該矩陣將會與其他網(wǎng)絡(luò)參數(shù)一起隨著訓(xùn)練進行優(yōu)化。ne是每一個特征中不同類別的個數(shù),nv是嵌入的維度。
引入Embedding層可以避免繁瑣的手動特征工程,而且還可以解決One-Hot編碼帶來的特征稀疏性問題。
1.3.2Cross網(wǎng)絡(luò)模塊特征交互又名特征組合,是一種合成新特征的方法,可以在具有多維數(shù)據(jù)的數(shù)據(jù)集上很好地擬合非線性特征。由于單一特征不能很好地表達目標信息,所以數(shù)據(jù)中的各個特征往往需要以不同的維度展現(xiàn)不同的信息,因此,需要對特征進行交叉,獲取特征之間的交互信息,從而更充分地擬合目標。
傳統(tǒng)的特征交叉是由專業(yè)人員通過手工進行組合的,這種方法常常存在局限性,并且成本較高,難以應(yīng)用。因此,許多學(xué)者開始研究使用神經(jīng)網(wǎng)絡(luò)模型自動學(xué)習(xí)交叉特征,彌補傳統(tǒng)特征交叉方法的不足。如Rendle[15]于2010年提出的因子分解機,該算法可以顯式自動組合二階特征交叉,但該算法無法提取更高階的特征交互信息。2017年Wang等[16]提出了DCN網(wǎng)絡(luò),該網(wǎng)絡(luò)解決了因子分解機的缺陷,可以對特征進行更深層次的交互,從而可以挖掘到更深層次的信息。
Cross網(wǎng)絡(luò)是DCN網(wǎng)絡(luò)的一個模塊,該模塊可以以一種顯式、可控且高效的方式,自動構(gòu)造有限高階顯式交叉特征。Cross網(wǎng)絡(luò)由交叉層組成(圖1),其中每層的計算公式見公式(5):
xl+1=x0xTlwl+bl+xl=f(xl,wl,bl)+xl(5)
其中,x0表示初始輸入向量,xl、xl+1為列向量,分別代表第l和第l+1個交叉層的輸出,wl和bl分別代表第l層的權(quán)重和偏置值。每次完成特征交叉后,交叉網(wǎng)絡(luò)都會將原來的輸入(xl)再輸入,作為下一次交叉網(wǎng)絡(luò)的輸入。這里借鑒了殘差網(wǎng)絡(luò)的思想,可以提高權(quán)重的敏感度,并且使網(wǎng)絡(luò)更易于反向傳播,提高訓(xùn)練效率。
經(jīng)過試驗驗證,模型設(shè)置5層Cross網(wǎng)絡(luò)層,可以獲得最好的預(yù)測效果,因此本研究設(shè)置5層Cross網(wǎng)絡(luò)層對經(jīng)過Embedding層編碼后的時空因子數(shù)據(jù)和環(huán)境因子數(shù)據(jù)進行特征交叉,提取6種因子之間的特征交互信息。
xl、xl+1:列向量;x0:初始輸入向量;wl:第l層的權(quán)重;bl:第l層的偏置值。
1.3.3卷積神經(jīng)網(wǎng)絡(luò)模塊卷積神經(jīng)網(wǎng)絡(luò)由Lecun等[17]提出,主要用于對圖像中的信息進行提取。卷積神經(jīng)網(wǎng)絡(luò)基本結(jié)構(gòu)由輸入層、卷積層、池化層、全連接層以及輸出層組成[18],具有權(quán)值共享、局部連接等特點。
傳統(tǒng)的卷積神經(jīng)通常會采用卷積層與池化層交替使用的結(jié)構(gòu),池化層用于選擇特征和減少特征數(shù)量,以達到減少參數(shù)量的目的,但池化操作后可能會存在信息丟失的問題。卷積層通過卷積核在特征圖上進行滑動操作,提取一個局部區(qū)域的特征,不同的卷積核相當(dāng)于不同的特征提取器[19]。假設(shè)給定1張圖片X∈ 瘙 綆 M×N(M、N為原圖像尺寸)和1個濾波器W∈ 瘙 綆 U×V(U、V為濾波器尺寸),那么此時卷積按公式(6)計算:
yij=∑Uu=1∑Vv=1wuvxi-u+v,j-v+1(6)
其中,wuv表示卷積核矩陣,xi-u+v,j-v+1表示特征圖中與卷積核對應(yīng)的矩陣,yij表示卷積之后的結(jié)果。
二維卷積層的卷積過程如圖2所示:
本模型卷積部分的輸入為Embedding層生成的3×4×1的矩陣,由于矩陣的尺度較小,故CNN部分使用全卷積網(wǎng)絡(luò)[20]結(jié)構(gòu),同時對特征圖邊緣使用0填充,以便能更加充分提取到特征圖的邊緣信息。經(jīng)過多次試驗,卷積層設(shè)置為3層,卷積核數(shù)目為32,卷積核大小為2×2,步長為1,可以更好地適應(yīng)本研究模型的需求。
1.3.4模型總體結(jié)構(gòu)本研究模型的總體結(jié)構(gòu)如圖3所示。其中,在數(shù)據(jù)處理部分,將原始時空因子數(shù)據(jù)進行one-hot編碼后輸入到Embedding層,經(jīng)Embedding層動態(tài)生成3×4×1矩陣。在Cross網(wǎng)絡(luò)部分,將Embedding層的輸出與環(huán)境因子數(shù)據(jù)結(jié)合(即圖3中的x0代表Embedding層輸出展平后與環(huán)境因子數(shù)據(jù)拼接的結(jié)果),共同作為Cross網(wǎng)絡(luò)的輸入,然后通過5層Cross網(wǎng)絡(luò)進行交叉特征信息提取,并在最后輸出一維特征向量。在CNN網(wǎng)絡(luò)部分,輸入Embedding層生成的3×4×1矩陣,通過滑動窗口操作提取特征圖的高階隱藏信息,并在最后將二維特征圖展平為一維向量。在輸出部分,將CNN網(wǎng)絡(luò)部分與Cross網(wǎng)絡(luò)部分提取得到的兩組一維向量進行融合,最后輸入全連接層,通過sigmoid激活函數(shù)輸出最后的分類結(jié)果。
1.4評價指標
分類任務(wù)中通常把準確率(Accuracy)作為衡量分類準確性的評價指標,但在樣本分布不均衡的時候,該評價指標存在明顯缺陷,假設(shè)正樣本數(shù)占總樣本數(shù)的90%,分類器只要全部預(yù)測為正,分類器的準確率就可以達到90%,但其實際泛化性能非常低。因此本研究采用召回率(查全率)、準確率(查準率)和F1分數(shù)作為綜合漁場等級評估標準。由于漁業(yè)實際作業(yè)中,主要選擇中心漁場作為作業(yè)區(qū)域,故本研究將中心漁場看作正樣本,非中心漁場看作負樣本,以更好滿足漁業(yè)作業(yè)需求。
1.5試驗設(shè)計
本研究所使用的工作站顯卡型號為NVIDIA GeForce RTX 2070 Super,中央處理器(CPU)型號為Intel Core i7 10750H,操作系統(tǒng)為Windows 10,并搭建了基于Python 3.6的Tensorflow 2.1.0框架。
試驗數(shù)據(jù)集為2000-2015年期間南太平洋110°E~135°W、5°S~40°S時空因子、環(huán)境因子數(shù)據(jù)以及漁業(yè)作業(yè)數(shù)據(jù)。將2000-2014年的9 860條數(shù)據(jù)分別按照15%和85%劃分為驗證集和訓(xùn)練集,同時將2015年的743條數(shù)據(jù)作為測試集。
公式變量含義同公式(5)。
為了提高整體訓(xùn)練速度,初始學(xué)習(xí)率(lr)=0.01,并采用學(xué)習(xí)率動態(tài)調(diào)整策略,當(dāng)循環(huán)迭代1 000次后,損失值仍不下降時,按0.96的衰減率調(diào)整學(xué)習(xí)率,動量參數(shù)(momentum)=0.9。并設(shè)置batch_size=32,epochs=150。
本研究設(shè)置了3組對比試驗,第一組試驗研究模型中各組成部分對模型精度的影響與作用;第二組試驗驗證引入Embedding層對模型精度的影響;第三組試驗與現(xiàn)有主流漁場預(yù)報模型進行對比,驗證本研究模型的合理性與有效性。本研究統(tǒng)一采用方法1.4的評價指標對試驗結(jié)果進行評估,其中中心漁場召回率和總召回率為主要參考指標。
2結(jié)果與分析
2.1模型各模塊組成對比分析
本研究對模型組成部分合理性進行驗證,通過模型自身結(jié)構(gòu)對比試驗可以驗證本研究模型各部分構(gòu)成的合理性和有效性。其中CNN模型通過Embedding層對數(shù)據(jù)進行處理,輸入到CNN網(wǎng)絡(luò)中進行試驗,Cross網(wǎng)絡(luò)也使用Embedding層對數(shù)據(jù)進行處理,輸入到Cross網(wǎng)絡(luò)中進行試驗。
分析表3可知,使用CNN網(wǎng)絡(luò)對漁場進行預(yù)測,中心漁場召回率最低,這是因為僅通過CNN網(wǎng)絡(luò)對特征進行提取,并不能有效提取到特征之間的交互信息,所以最后的預(yù)測結(jié)果并不理想。而使用Cross網(wǎng)絡(luò)對漁場進行預(yù)測時,雖然中心漁場召回率高于CNN網(wǎng)絡(luò),但在總召回率上偏低,這是因為該網(wǎng)絡(luò)加強了特征交互信息的提取,但忽略了對高階隱藏信息進行提取,對數(shù)據(jù)擬合不夠充分。因此本研究將兩部分網(wǎng)絡(luò)進行組合,既能有效獲得特征交互信息,又能提取到高階隱藏信息,分析表4得出,本研究模型相較于單一使用某一部分網(wǎng)絡(luò),在所有評價指標上均有較大幅度的提升,驗證了本研究模型的合理性與有效性。
2.2Embedding層對模型精度的影響
本小節(jié)共設(shè)置了2組試驗,以驗證引入Embedding層對模型產(chǎn)生的影響。一組為BP神經(jīng)網(wǎng)絡(luò)模型,另一組為本研究模型的Cross網(wǎng)絡(luò)模塊。通過設(shè)置2組對比試驗,可以消除試驗中可能存在的偶然性,從而保證試驗的真實有效。在2組試驗中分別使用Embedding層和不使用Embedding層驗證其對模型精度的影響。試驗結(jié)果如表4所示。
分析表4可知,無論是BP神經(jīng)網(wǎng)絡(luò)模型,還是Cross網(wǎng)絡(luò)模型,通過使用Embedding層對輸入的時空因子特征進行處理,相較于將原始特征作為網(wǎng)絡(luò)的輸入,在評價指標上都有不同程度的提高。通過對時空因子特征進行Embedding處理,相較于將原始時空因子特征作為網(wǎng)絡(luò)的輸入,試驗結(jié)果在各項評價指標上都有不同程度的提高。這是因為Embedding層對時空因子特征進行了重新的空間映射,將在歐氏空間中距離相近的特征信息聚集在一起,消除了one-hot編碼的稀疏性問題,同時又避免了手動特征工程對結(jié)果的影響,后續(xù)特征提取將會更加充分,提取的特征信息也將更具代表性。
2.3本研究模型與現(xiàn)有模型對比分析
為了驗證本研究模型的優(yōu)勢,我們選擇了3種主流的漁場預(yù)測模型進行對比,分別為BP神經(jīng)網(wǎng)絡(luò)模型、SVM機器學(xué)習(xí)模型以及F-CAN深度學(xué)習(xí)模型。其中,BP神經(jīng)網(wǎng)絡(luò)模型采用6-512-1網(wǎng)絡(luò)結(jié)構(gòu),SVM模型采用文獻[21]中的模型參數(shù),即采用徑向基函數(shù)(RBF)為核函數(shù),F(xiàn)-ACN模型[22]采用one-hot編碼方式對數(shù)據(jù)進行處理,并使用全卷積網(wǎng)絡(luò)結(jié)構(gòu)。
如表5所示,BP神經(jīng)網(wǎng)絡(luò)模型中心漁場召回率為72.2%,總召回率為75.7%,該模型在漁場預(yù)測中的精度最低。這是因為BP神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)簡單,可訓(xùn)練參數(shù)量較少,因此對于大規(guī)模數(shù)據(jù)的擬合能力十分有限。
SVM模型中心漁場召回率為83.0%,總召回率為80.6%,相較于BP神經(jīng)網(wǎng)絡(luò)模型有提升,但預(yù)測精度仍然較低。SVM模型針對小樣本具有較好的擬合能力,具有較強的泛化能力,但是面對大規(guī)模復(fù)雜海洋數(shù)據(jù),SVM模型的效率會下降很多,而且SVM核函數(shù)對于高維數(shù)據(jù)的映射解釋力不強,尤其是徑向基函數(shù)。因此采用SVM模型進行漁場預(yù)測的精度并不理想。
F-ACN模型使用了深度學(xué)習(xí)模型——全卷積網(wǎng)絡(luò),因此中心漁場召回率達到84.0%,說明深度學(xué)習(xí)對大規(guī)模非線性復(fù)雜數(shù)據(jù)的擬合能力較強。但是,該模型使用one-hot編碼對數(shù)據(jù)進行預(yù)處理,因此數(shù)據(jù)會變得非常稀疏,不利于特征的提取,從而使得總召回率為78.3%,預(yù)測精度偏低。
本研究模型(CNN-Cross)在各個評價指標上相較于上述模型都有很大程度的提高。中心漁場召回率為89.4%,總召回率為87.4%,相較于F-ACN模型分別提高了5.4個和9.1個百分點。在真實的漁業(yè)捕撈作業(yè)中,漁獲量和捕撈效率與漁場的等級密切相關(guān),通常漁業(yè)作業(yè)會選擇中心漁場,最大程度地提高漁獲量。而本研究模型中心漁場召回率達到了89.4%,遠遠高于現(xiàn)有模型,這對于縮短尋找漁場時間、節(jié)省作業(yè)成本可以起到很大的作用,可以較好滿足真實漁業(yè)作業(yè)的需求。
3討論
本研究針對傳統(tǒng)漁場預(yù)測模型預(yù)測精度低、難以擬合海洋大數(shù)據(jù)的問題,提出了一種基于特征交互與卷積網(wǎng)絡(luò)的漁場預(yù)測模型——CNN-Cross,該模型引入Embedding層,避免了手動特征工程以及解決了one-hot編碼帶來的特征稀疏性問題。Cross網(wǎng)絡(luò)通過線性時間復(fù)雜度提取特征之間的交互信息,消除了單一特征對目標值表達不足的問題。同時通過CNN網(wǎng)絡(luò)對高階隱藏信息進行提取,提高了模型對復(fù)雜數(shù)據(jù)的擬合能力,提高了模型的泛化性和魯棒性。研究結(jié)果顯示,CNN-Cross模型的南太平洋長鰭金槍魚漁場中心召回率達到89.4%,總召回率達到87.4%,相較于現(xiàn)有的主流漁場預(yù)測模型預(yù)報精度有較大的提升,且預(yù)測精度可以較好地滿足現(xiàn)有漁業(yè)作業(yè)的需求,可以為南太平洋長鰭金槍魚漁業(yè)捕撈作業(yè)提供有效的指導(dǎo)。
CNN-Cross模型是一種“黑盒模型”,原理和實現(xiàn)較為簡單,通用性較強,對漁業(yè)數(shù)據(jù)不需要過多手動特征工程,僅需對數(shù)據(jù)進行簡單的one-hot編碼即可輸入到模型中進行訓(xùn)練,所以應(yīng)用于其他漁場也不會對模型泛化性產(chǎn)生較大影響。但CNN-Cross模型僅使用了3種易于獲取的環(huán)境因子數(shù)據(jù)對長鰭金槍魚漁場進行預(yù)報,而長鰭金槍魚是一種高度洄游性生物,其漁場分布必然會受到許多環(huán)境因子的影響,而且漁場分布也必然會與時間和空間有緊密的聯(lián)系,所以在下一步工作中需要收集更多環(huán)境因子數(shù)據(jù),同時考慮漁場的時間序列因素和空間相關(guān)性,從而進一步提高模型的精度和泛化性。
參考文獻:
[1]范永超,陳新軍,汪金濤. 基于多因子棲息地指數(shù)模型的南太平洋長鰭金槍魚漁場預(yù)報[J].海洋湖沼通報,2015(2):36-44.
[2]郭剛剛,張勝茂,樊偉,等. 基于表層及溫躍層環(huán)境變量的南太平洋長鰭金槍魚棲息地適應(yīng)性指數(shù)模型比較[J].海洋學(xué)報,2016,38(10):44-51.
[3]王德芬,王玉堂,楊子江,等. 我國漁業(yè)多功能性的研究與思考[J].中國水產(chǎn), 2012(1):15-17.
[4]苗振清,黃錫昌. 遠洋金槍魚漁業(yè)[M].上海:上海科學(xué)技術(shù)文獻出版社,2003.
[5]BRIAND K, MOLONY B, LEHODEY P. A study on the variability of albacore (Thunnus alalunga) longline catch rates in the southwest Pacific Ocean[J]. Fisheries Oceanography, 2011, 20(6): 517-529.
[6]ZAINUDDIN M, SAITOH K, SAITOH S E I I. Albacore (Thunnus alalunga) fishing ground in relation to oceanographic conditions in the western North Pacific Ocean using remotely sensed satellite data[J]. Fisheries Oceanography, 2008, 17(2): 61-73.
[7]崔雪森,唐峰華,張衡,等. 基于樸素貝葉斯的西北太平洋柔魚漁場預(yù)報模型的建立[J].中國海洋大學(xué)學(xué)報(自然科學(xué)版),2015,45(2):37-43.
[8]張孝民,石永闖,李凡,等. 基于MAXENT模型預(yù)測西北太平洋秋刀魚潛在漁場[J].上海海洋大學(xué)學(xué)報,2020,29(2):280-286.
[9]宋利明,周建坤,沈智賓,等. 基于支持向量機的庫克群島海域長鰭金槍魚棲息環(huán)境綜合指數(shù)[J].海洋通報,2017,36(2):195-208.
[10]ZHOU P, LI P, ZHAO S, et al. Feature interaction for streaming feature selection[J]. IEEE Transactions on Neural Networks and Learning Systems, 2020,10:1-12.
[11]GUO H F, TANG R M, YE Y M, et al. DeepFM: a factorization-machine based neural network for CTR prediction[C]//SIERRA C. Proceedings of the Twenty-Sixth International Joint Conference on Artificial Intelligence. Melbourne: International Joint Conferences on Artificial Intelligence, 2017: 1725-1731.
[12]CHENG H T, KOC L, HARMSEN J, et al. Wide & deep learning for recommender systems[C]//KARATZOGLOU A, HIDASI B, TIKK D, et al. Proceedings of the 1st workshop on deep learning for recommender systems. New York: Association for Computing Machinery, 2016: 7-10.
[13]周為峰,黎安舟,紀世建, 等. 基于貝葉斯分類器的南海黃鰭金槍魚漁場預(yù)報模型[J]. 海洋湖沼通報,2018(1):116-122.
[14]陳雪忠,樊偉,崔雪森,等. 基于隨機森林的印度洋長鰭金槍魚漁場預(yù)報[J].海洋學(xué)報(中文版),2013,35(1):158-164.
[15]RENDLE S. Factorization machines[C]//HINCHEY M, BERGMAN L A, WANG W P, et al. 2010 IEEE International Conference on Data Mining. Los Alamitos: IEEE Computer Society, 2010: 995-1000.
[16]WANG R, FU B, FU G, et al. Deep & cross network for ad click predictions[C]//ACM Special Interest Group on Knowledge Discovery in Data. Proceedings of the ADKDD′17. New York: Association for Computing Machinery, 2017: 1-7.
[17]LECUN Y, BOTTOU L, BENGIO Y, et al. Gradient-based learning applied to document recognition[J]. Proceedings of the IEEE, 1998, 86(11): 2278-2324.
[18]周飛燕,金林鵬,董軍. 卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J].計算機學(xué)報,2017,40(6):1229-1251.
[19]邱錫鵬. 神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)[M]. 北京:機械工業(yè)出版社,2019:110-115.
[20]AYZEL G, HEISTERMANN M, SOROKIN A, et al. All convolutional neural networks for radar-based precipitation nowcasting[J]. Procedia Computer Science, 2019, 150: 186-192.
[21]崔雪森,唐峰華,周為峰,等. 基于支持向量機的西北太平洋柔魚漁場預(yù)報模型構(gòu)建[J].南方水產(chǎn)科學(xué),2016,12(5):1-7.
[22]袁紅春,陳冠奇,張?zhí)祢裕? 基于全卷積網(wǎng)絡(luò)的南太平洋長鰭金槍魚漁場預(yù)報模型[J].江蘇農(nóng)業(yè)學(xué)報,2020,36(2):423-429.
(責(zé)任編輯:陳海霞)
收稿日期:2021-04-08
基金項目:國家自然科學(xué)基金項目(41776142);國家重點研發(fā)計劃項目(2018YFD0701003)
作者簡介:袁紅春(1971-),男,江蘇海門人,博士,教授,主要從事專家系統(tǒng)、智能計算、智能信息處理等研究。(E-mail)hcyuan@shou.edu.cn