周 兵,譚卓昆,段紅星,劉 亮,張 競,吳文斗
(1.云南農業大學理學院,云南 昆明 650201;2.云南大學 信息學院,云南 昆明 650500;3.云南農業大學茶學院,云南 昆明 650201;4.云南農業大學大數據學院,云南 昆明 650201)
中國有源遠流長的茶文化,茶禮茶俗等。隨著中國經濟的發展,茶的需求量逐步增加,各類茶企發展迅速,茶產品層出不窮,為了有利于品牌的宣傳,對茶葉品質進行評價成為必不可少的一環。傳統評價方式易受評審人員與評審環境等諸多因素影響,如何使評價過程更為簡便科學,是目前在茶葉評定領域較為迫切的任務之一,而色澤作為茶葉品質評審的主要內容,對其進行標準且科學的評價便極其重要。
目前對茶葉色澤的評價主要看茶葉外表色澤、茶湯色澤和葉底色澤,以此來了解茶葉品質的高低及制作工藝。但在實際評審過程中,往往因為不同人員對色澤的感官強弱不同,使得評價結果存在一定的主觀誤差。國外對茶葉品質因子和茶葉質量評定的研究應用越來越多,P Mishra等人在2019年使用近紅外高光譜測量綠茶數據,構建綠茶分類模型,實現了16種綠茶產品的分類。國內大部分仍是采用人工感官審評的方法進行,但也不乏創新性的茶葉品質評價的研究。2016年,潘玉成等利用人工神經網絡對綠茶色澤進行茶葉品質的評定,對標準樣和預測樣本獲得了較令人滿意的評判結果。2019年,帥曉華等人采用計算機視覺技術,對拍攝的茶葉和茶水圖片進行識別分類,識別的準確率總體達到90%。兩者的研究中選取的樣本數較少,條件控制不足,即便是同一種茶類,由于品控因素,如干茶制作時溫度、干濕度不同,都會對茶類的分級造成極大的影響。
為解決誤差問題,本文設計的實驗嚴格控制紅茶干茶光照時長,茶湯沖泡的時間、溫度、水質,以及葉底測量方式,最大限度排除環境因素帶來的干擾誤差。利用具有精確色彩識別能力的色差儀測定不同色澤類型的 L(亮度值)、a(紅綠色值)、b(黃藍色值)范圍,基于GA-BP算法將測量的數值與人工感官評價的結果建立數學模型,找到紅茶不同類型的干茶、茶湯、葉底色差值與人工感官評價的相關性,構建茶葉色度值參數與茶葉色澤類型數據評審模型,較好的實現了茶葉的分類識別,為茶葉色澤類型的數字化評定提供了科學依據。
1.1.1 干茶數據。紅茶干茶通過將嫩葉,經發酵等工藝制作而成。本研究選取了市場上常見種類的紅茶,如:古樹紅茶、名優紅茶等茶種。為了使數據豐富,具備科學性、普適性,又從已選取的紅茶種類中挑選了不同價位、不同品質及規格的紅茶干茶。實驗用的干茶樣本如圖1所示:

圖1 部分干茶樣本及相應色澤人工評審結論
通過篩選、評估,共選取63份紅茶干茶,用色差儀測得380組數據,可分為烏黑、烏黑帶毫、烏黑有毫、烏黑多金毫、烏褐顯金毫、金黃共計六個干茶評定色類。
1.1.2 茶湯數據。用熱水沖泡前述干茶樣本即得茶湯數據。對湯色進行L、a、b值測量時,發現同一種茶類在不同溫度、不同水質下測量的色差值不同;不同的溫度、不同水質下的不同茶類測量的數據范圍會相互重疊。所以我們選用同一種類的礦泉水,茶葉稱量5克左右,將水加熱至93℃時開始沖泡。用測溫槍檢測茶湯的溫度,當茶湯降溫至30℃左右時,對不同茶類的茶湯,在封閉式的色差儀中進行L、a、b值的測量。研究所用的紅茶茶湯如圖2所示。

圖2 部分茶湯樣本及相應色澤人工評審結論
本研究選取了60份紅茶干茶進行沖泡,用色差儀測得400組數據,可分為杏黃、橙黃、橙紅、紅亮、紅濃、紅艷、紅暗共計七種茶湯評定色類。
1.1.3 葉底數據。葉底也叫茶渣,即干茶經開水沖泡后所展開的葉片。紅茶葉底越有光澤,品質越好。判斷方法是首先將泡過的茶葉倒入潔凈的器皿中,再將茶葉拌勻鋪開進行觀察后給出結論。由于發酵程度不一致,相同種類紅茶的葉底色澤也是不同的,為了盡量減少這個問題帶來的誤差干擾,評審人員以大面積的茶葉色澤分布作為葉底顏色分類的依據。

圖3 部分葉底樣本及相應色澤人工評審結論
在色差儀測量葉底前,首先用機器將葉底打碎,收入相應容器中,再對其進行L、a、b值的測量,使數據更加穩定、可靠。本研究選取了63份紅茶葉底,用色差儀測得380組數據,可分為泛青、泛青稍帶紅、棕紅較勻稍青、棕紅、紅共計五大葉底評定色類。
本次研究的測量儀器采用封閉式的色差儀(深圳市三恩時科技有限公司的 YS6060 色差儀),實物圖如圖4所示,該儀器能夠減少在不同環境條件下,給數據測量帶來的誤差干擾,同時本研究的色差值數據是由專業人員進行專業測量、評估,測量的 L、a、b值更加準確。

圖4 色差儀實物圖
1.3.1 GA-BP網絡搭建。GA-BP算法就是使用遺傳算法(GA)將BP神經網絡的權值和閾值作為初始種群,不斷的迭代進化,尋找出全局最佳的權值和閾值,實現對BP神經網絡的優化。GA-BP算法流程如圖5所示:

圖5 GA-BP算法流程圖
1.3.2 網絡參數設置及測試。BP神經網絡模型隱含層包含的神經元節點個數能反映出整個網絡的非線性水平,進行參數設置時,找到該網絡最佳隱含層節點數是十分困難的。若隱含層節點個數過多,不僅會增加神經網絡的學習時間,而且還會出現“過擬合”現象;若隱含層節點個數過少,網絡甚至無法訓練或使用。我們通過對樣本數據準確率結果分析,判斷各節點數對網絡模型的影響,確定相關模型的最優隱含層節點數。隱含層節點常用計算公式如下所示:

式中 H——隱含層節點數;
M——輸入層節點數;
N——輸出層節點數;
A——取1到10的整數。
紅茶干茶、茶湯、葉底網絡模型的隱含層節點范圍如表1所示。

表1 各樣本種類隱含層范圍的確定
依次選取可能的隱含層節點數,測試相應數據集的準確率,訓練集數據的各隱含層節點數與各樣本準確率的分布如表2所示。

表2 各樣本訓練集隱含層節點數的準確率
通過對比不同隱含層節點數對應的訓練集識別的準確率,將均方誤差最小時的隱含層節點數目確立為最佳。求得紅茶干茶、茶湯、葉底的最佳隱含層節點數目分別為13、10、8。另外,在其它網絡參數的配置上,本研究設置網絡的訓練次數為1000次,顯示頻率為25,即每訓練25次顯示1次,學習速率為0.01,動量因子為0.01,最小性能梯度為10-6,并設置最高失敗次數為6次。
1.3.3 學習方式的選擇。為尋找最適合本次研究的學習方式,選擇紅茶干茶色澤數據集對增加動量算法、彈性BP算法、自適應學習算法、共軛梯度算法、LM算法分別進行測試。通過網絡訓練,再隨機選取數據對模型進行測試,比較不同學習方式對測試數據集預測的準確率,結果如表3所示。

表3 不同學習方式對干茶色澤預測的準確率
測試的結果顯示LM算法的效果最好,三次平均準確率可達到93.75%,因此后面的研究過程中選擇該算法對網絡進行訓練。
為了檢驗GA-BP算法應用效果,我們選用了100組干茶數據對模型進行測試。同時,將標準BP神經網絡模型作為對照組,將兩種模型的測試結果進行分析。根據測試結果可知標準BP神經網絡對紅茶干茶色澤數據識別效果一般,準確率只有85.86%,而且存在少部分識別結果和正確結果誤差較大的數據。而GA-BP神經網絡模型分類識別更為精準,數據準確率為94.95%。
在茶湯數據的測試中,選用了105組紅茶湯色數據對GA-BP模型與標準BP模型進行測試,標準BP神經網絡分類識別的準確率為80.95%,使用GA-BP算法的網絡模型的準確率可達到95.23%。
在葉底數據的測試中,選用了95組紅茶葉底數據對模型進行測試。標準BP神經網絡對大部分數據識別比較精準,但是也存在少部分識別結果和正確結果誤差較大的數據,其分類識別的準確率為88.54%,而GA-BP網絡模型極大提高測試集數據分類識別的準確率,其測試準確率為90.62%。
經過紅茶的干茶、湯色、葉底數據的測試,使用GA-BP算法對干茶、湯色、葉底數據測試的準確率分別為94.95%、95.23%、90.62%,模型的分類識別效果較好,GA-BP算法使得全局尋優能力、數值范圍交叉的數據處理能力更佳,分類結果與專家評估較為一致,通過本次研究獲得的網絡模型,機器視覺識別的結果可以與人工評審結果做最好的關聯。這不僅大大減少了人工評審帶來的主觀誤差,也能為茶葉色澤類型的量化審評提供科學依據,較好地推動茶產業的數字化發展進程。