張明乾, 劉立博, 趙羨波, 吳 龍, 張永安, 林志華, 許山河, 胡興川*
(1.福建中煙工業有限責任公司, 福建 廈門 361012; 2.福建省煙草公司 龍巖市公司, 福建 龍巖 364000)
煙葉內在化學成分是用來評價烤煙品質的常用指標之一,化學成分特別是常規化學成分是影響煙葉內在品質的重要因素,其含量決定了煙草的品質特征和工業可用性[1],目前已普遍將烤煙內在化學成分作為評價烤煙品質的重要指標[2]。土壤養分是影響優質煙葉生產的關鍵因素之一,植煙土壤的養分狀況直接影響煙草生長發育的營養水平,進而影響煙葉的化學成分和產量,最終影響煙葉品質[3-6]。因此,土壤養分與煙葉化學成分及煙葉最終品質的形成緊密相關[7-9]。目前對土壤養分與煙草生長發育及其品質形成的研究報道較多,但利用土壤養分與煙葉化學成分的相關關系對煙葉化學成分進行預測的研究還較少。因此,研究選用影響煙葉化學成分的土壤養分因子,采用回歸分析法和BP神經網絡(Back Propagation neural network)分別構建預測模型,分析構建模型的預測精度,以期為煙葉化學成分預測和卷煙工業原料使用提供理論依據。
供試品種為云煙87,由龍巖市煙草公司永定分公司提供。試驗于2014年1月至2018年12月在福建省龍巖市永定區湖雷基地單元湖雷鎮(24°47′N,116° 48′E)和湖坑鎮(24°62′N,116° 98′E)進行,兩地相距20.7 km。5年試驗煙田均為同一片煙田,土壤為水稻土,前茬作物為水稻,田塊肥力中等均勻,排水方便。烤煙生產、烘烤措施均嚴格參照Q/LYYC 122-2010《龍巖市優質烤煙生產技術標準體系》執行。
1.2.1 土壤樣品 采集時間為2014-2017年,采用5點取樣法[10]于煙株移栽前15 d取0~20 cm的耕層土壤。2個鄉鎮定點采集具有代表性地塊的土壤樣品10份,土壤樣品經登記編號后進行預處理,經過風干、磨細、過1 mm篩、混勻、裝瓶后待檢。
1.2.2 煙葉樣品 煙葉樣品于2014-2017年采集,每年煙葉出烤后至交售前,采用隨機抽樣法進行取樣,煙葉水分要求在16%~17%。湖雷鎮和湖坑鎮試驗田塊均采集煙葉樣品3份,每份包含中等質量水平的X2F、C3F、B2F煙葉各1 kg,煙葉樣品經登記編號后進行扎捆、包裝、裝箱后待檢。
土壤樣品測定項目包括有機質、堿解氮、有效磷、速效鉀和pH。其中,有機質含量測定采用重鉻酸鉀滴定法[11],堿解氮含量測定采用堿解擴散法[12],有效磷含量測定采用碳酸氫鈉浸提-鉬銻抗比色法[13],速效鉀含量測定采用醋酸銨浸提-火焰光度法[14],pH測定采用pH計法(水土比為1.0∶2.5)。
煙葉常規化學成分測定包括總植物堿、水溶性總糖、水溶性還原糖和總鉀,分別按照煙草行業標準 YC/T 468-2013、YC/T 159-2002、YC/T 217-2007進行測定。煙葉質量評價方法參照福建中煙《原料質量評價體系(烤煙)取樣及質量評價技術要求》執行。
1.4.1 相關分析 選取湖雷鎮2014-2017年數據為分析對象,運用SPSS對煙葉化學成分與土壤因子進行Person相關分析,顯著性檢查采用雙尾檢驗。
1.4.2 回歸模型構建 運用SPSS 22,以湖雷鎮2014—2017測定的5個參數作(有機質、堿解氮、有效磷、速效鉀和pH)為自變量及其對應的4個參數(總植物堿、水溶性總糖、水溶性還原糖和總鉀)為因變量,采用基于最小二乘法的逐步回歸方式建立線性模型F1-F5,Probability-of-F-to-enter≤0.050,Probability-of-F-to-remove≥0.100。
1.4.3 BP神經網絡模型構建 BP神經網絡模型拓撲結構包括輸入層(input)、隱含層(hide layer)和輸出層(output layer)[15-16]。以湖雷鎮2014-2017年5個參數(有機質、堿解氮、有效磷、速效鉀和pH)為輸入層因子,以其對應的4個參數(總植物堿、水溶性總糖、水溶性還原糖和總鉀)為輸出層因子構建神經網絡模型。
神經網絡法的判定精度主要受制于隱含層神經元數,若隱含層神經元數過少,將影響網絡的學習效果,則需要增加訓練次數,而這又會降低訓練的精度;反之,網絡訓練時間增加,網絡易過擬合。先由經驗公式(A)確定不同的神經元數[17-20],然后進行訓練對比,取訓練判定結果與實際誤差最小的隱含層神經元數為最優拓撲結構。

(1)

研究采用MATLAB的Neural Network Toolbox構建化學成分預測的BP網絡神經模型,操作步驟如下:
1) 數據的歸一化處理。由于反映輸入層各參數原始數據的級差差異明顯,在進行BP神經網絡構建前先對原始數據進行歸一化處理,將數據線性壓縮到[—1,1]的范圍,使其在訓練階段的網絡更易收斂。
2) 神經網絡訓練。網絡中間層神經元傳遞函數采用Logsig函數,輸出層神經元傳遞函數采用線性函數Purelin,訓練函數采用Trainlm。將數據的70%用于模型訓練,15%用于預測驗證,15%用于模型測試。設置模型的收斂誤差為0.000 1,學習速率為0.05,最大訓練次數為1 000。
分別將湖坑鎮2014—2017土壤數據輸入回歸模型和BPNN模型中,記錄其對不同年份不同化學成分指標的預測結果,計算其預測精準度。
式中,N為模型預測值,M為湖坑化學成分真實值。
從表1可以看出,云煙87的4項化學成分指標與5項土壤養分指標均無顯著線性相關,因此,無法構建云煙87化學成分指標-土壤養分指標回歸模型,傳統的回歸方式已不適用。

表1 云煙87化學成分與土壤養分的相關性
通過多次模型訓練,確定永定地區云煙87化學成分預測BP模型最佳拓撲結構如表2所示,這些模型的決定系數(R2)均在0.98以上,具有良好的擬合效果。
從表3看出,模型總體預測精準度以C3F最高,為93.71%,較B2F及X2F分別高3.18及2.79百分點。從圖1看出,BP模型對2017年的預測精準度最高,達95.67%,對2015年最低,只有87.36%;對水溶性還原糖和水溶性總糖預測精準度最高,分別達94.30%及94.07%,而總植物堿最低,總體精準度只有87.06%。

表2 云煙87化學成分BP預測模型最佳拓撲結構
注:A、B、C分別為隱含層、輸入層及輸出層的神經元數。
Note: A, B and C are the neuron in hide layer, input layer and output layer respectively.

表3 BP模型對龍巖永定云煙87化學成分預測的精準度
圖1BP模型對云煙87化學成分預測精準度
Fig.1 Prediction accuracy of chemical components of Yunyan 87 analyzed by BP model
煙葉內在化學成分預測是煙葉生產中工商企業關注的重要問題之一。研究表明,采用回歸模型預測龍巖永定煙葉化學成分和土壤養分指標無顯著線性相關性;而采用BP神經網絡模型預測顯示出較高的相關性和模型精準度,原因可能是回歸模型屬線性預測,受空間數據相互作用而出現對稱、叢聚和屏蔽等效應,導致精度不高;而BP神經網絡可以處理復雜空間的非線性系統,受樣本空間分布影響較小,其通過調整內部的權重來提高網絡優化效果,減小樣本位置對預測結果的影響,使其比多元回歸模型在空間預測上具有更高的精度和應用范圍[20]。有研究[21-22]表明,土壤pH、有效磷、速效鉀與烤后煙葉鉀、總糖、還原糖、鉀氯比、糖堿比密切相關,這與筆者等研究利用BP神經網絡預測模型顯示土壤養分和煙葉化學成分之間存在高度相關性的結果一致。BP預測結果表明,C3F等級的預測精準度較高且年度間變化較為平穩,B2F和X2F的預測精準度年度間變化略大;在煙葉化學成分指標的精準度方面表現為對水溶性糖的預測精準度較高。綜上,BP神經網絡相比多元回歸在對龍巖永定煙區云煙87化學成分分析預測上具有更好的穩定性和精確性。運用BP神經網絡可較好地服務于煙葉化學成分的預測,為煙葉生產和工業使用提供科學合理的預見性支持。