劉軍紅,蔡宗群,李軍法
(泉州出入境檢驗檢疫局,福建 泉州 362000)
在紡織服裝領域羊毛與羊絨的成分鑒別及其含量檢測一直都是研究的難點,其原因在于羊毛與羊絨同屬于天然蛋白質纖維,兩者的化學組成、組織結構和理化性質非常相近。而羊絨纖維具有光澤好、細度均勻、滑糯柔軟、富有彈性等優良特性,是一種稀有的動物纖維,產量少、價格貴,素有“軟黃金”的美稱;羊毛盡管和羊絨具有相近的化學成分,但在組織結構上,尤其在纖維特性和經濟價值上遠不如羊絨[1-3]。我國雖然是生產羊毛羊絨的大國,但是因為羊毛羊絨的國家標準還不夠完善,使得我國的羊毛羊絨產品經常在國際貿易中陷于被動。因此如何準確鑒別羊毛與羊絨,以及如何準確確定紡織品中羊毛、羊絨的含量就顯得極為重要。這既是保證產品質量,維護消費者權益,提高我國毛紡織品國際貿易地位的需要,也是擺在出入境檢測機構面前的一大課題。
紅外測試技術是1800年由物理學家W.Herschel發現紅外輻射以后逐漸建立和發展起來的[4],是一種依據某一物質成分對電磁波的吸收特性而進行的定性、定量的分析技術,是20世紀90年代以來發展最快、最引人注目的光譜分析技術。化學計量學可視為數學、統計學、計算機科學與化學化工的“接口”,支持向量機(Support Vector Machine,SVM)是20世紀90年代Vapnik基于統計學習理論提出的一種新的機器學習方法[5-7]。它以統計學習理論為基礎,采用結構風險最小化準則和VC維理論,根據有限數據信息在模型的復雜度和學習能力之間尋找最佳折衷,從而獲得最好的推廣能力;能較好地解決小樣本、非線性、高維數和局部極小點等實際問題[8-10]。
本研究將基于支持向量的集成算法與近紅外光譜結合,以研究羊毛、羊絨的定性和定量分析。通過選取不同的羊毛、羊絨標準樣品,測量其紅外光譜圖,經數據預處理后使用基于支持向量機的集成算法建立分析模型,對羊毛、羊絨進行定性分析。選取不同含量的羊毛、羊絨標準混合樣品,通過測量其紅外光譜圖,經數據預處理后使用基于支持向量機的集成算法建立分析模型,對羊毛、羊絨進行定量分析。該方法與目前常用的羊毛、羊絨測定方法相比,具有無需化學試劑、樣品無需預處理、制樣簡單、檢測速度快,準確性高等特點,可為開發一種可靠、高效、無損的羊毛羊絨檢測手段奠定基礎。
定性分析樣品:不同產地的羊絨30份,羊毛纖維30份(內蒙古自治區鄂爾多斯,遼寧丹東,吉林白山,山東臨沂,河北滄州等產地)。定量分析樣品:將收集到的羊絨與羊毛纖維按質量分數稱重,羊絨質量分數從0%到100%,間隔2%,共51份樣品,每份樣品均重0.4g,精確到0.000 1g。
儀器設備:Antaris II近紅外光譜儀(美國賽默飛世爾公司);積分球檢測器。
將樣品置于樣品池中,采用反射模式采集樣品光譜。光譜采集條件為波數范圍12 000~4 000cm-1,對每份樣品進行32次掃描,所有樣品均重復采集4次光譜。由于羊絨與羊毛的物質組成和化學結構幾乎相同,其內部的化學基團對近紅外光的吸光度相近,在同一譜圖上表現為譜形相似,吸收峰值一致,而且近紅外光譜區域的峰較寬,峰與峰常常重疊;因此直接通過譜圖很難鑒別羊絨與羊毛,需要對原始光譜進行合理的處理,減弱甚至消除各種非目標因素對光譜信息的影響,為穩定、可靠的校正模型的建立奠定基礎。對光譜求導可以消除基線平移,強化譜帶特征,克服譜帶重疊,是常用的光譜預處理方法。本研究采用對原始譜圖求取二階導數的方法,以去除與波長線性相關的漂移,強化光譜信號。
在使用支持向量機進行分類時,對訓練結果影響最大的參數組是(C,σ),過大或過小都會使誤差增大。C是懲罰因子,它控制對錯分樣本的懲罰程度,C越大表示對錯誤的懲罰越大,σ是核函數的寬度。最初將C和σ分別在C=2-1,20,21,22,23,…,210,σ=2-1,20,21,22,23,…,210之間調整,對所有(C,σ)組,支持向量機使用訓練集訓練之后,都要經預測集預測一下精度。經過這樣一個循環,就可得到最佳的參數區間組(C1,σ);然后在(C1,σ)附近調整(C,σ),再尋找最佳的參數區間組(C2,σ);然后在(C2,σ)附近調整(C,σ),經過這樣幾個循環可得到C和σ的最佳值。隨機選取24個羊毛和24個羊絨樣品作為訓練集,其余的樣品作為預測集,對羊毛羊絨進行分類,在支持向量機的目標輸出中,“1”表示羊毛,“-1”表示羊絨。經過調試,C為10,σ為2時,預測效果最好。預測結果如表1所示,預測結果全部正確。

表1 定性模型預測結果
在使用支持向量機回歸時,對訓練結果影響很大的參數組是(σ,C),過大或者過小都會使誤差增大。ε是不敏感損失函數,太小易產生過擬合現象,太大易產生欠擬合。C是懲罰因子,它控制對錯分樣本的懲罰程度,C越大表示對錯誤的懲罰越大,σ是核函數的寬度。根據經驗將σ,C分別在0.1-512之間調整,以尋找最佳的參數組(σ,C),使得回歸有最好的預測能力。選用41個混合樣品為訓練集,其余10個樣品為預測集,經過調試ε為0.01,C為274,σ為3時其預測效果最好。預測結果如表2所示。

表2 定量模型預測結果
由表2可見,對大部分樣品預測模型具有較好的預測結果,對個別樣品的預測值和真實值的結果偏差較大,這可能與樣品的混勻程度有關。
以不同產地的羊絨與羊毛纖維為研究對象,采用近紅外光譜技術并結合支持向量機所建立的羊毛、羊絨定性和定量分析模型,被用于對未知樣品進行預測。可得出的結論是,定性分析模型能夠準確地鑒別出羊絨與羊毛纖維,定量分析模型具有較好的預測結果;驗證了近紅外光譜技術用于羊絨、羊毛定性及定量分析的可行性,為開發一種可靠、高效、無損的羊絨、羊毛檢測手段奠定了基礎。
本研究中建立的數學模型還具有一定的局限性,如果要將近紅外光譜技術真正應用到實際檢測工作中,還需要進一步考慮的方面是:收集更多不同產地、不同種類的羊絨和羊毛樣品,不斷充實數據庫,完善定性分析模型;增加羊絨和羊毛混合比數量,擴充定量分析模型的樣品量;設計更為有效的混紡工具,盡量減少因纖維混合不均勻對模型預測產生的影響,盡可能減少實驗誤差。
[1] 李維紅,席 斌,郭天芬,等.綿羊毛與山羊絨的鑒別[J].湖北農業科學,2011,50(3):544-545.
[2] 彭偉良,蔣耀興,袁長泰.山羊絨和細綿羊毛纖維的形態特征分析[J].上海紡織科技,2005,33(11):11-12.
[3] 王柏華,胡志宇,葛順順,等.基于光鏡條件下綿羊毛與山羊絨的鑒別[J].毛紡科技,2011,39(4):42-45.
[4] 王學琳,孫淑萍,鐵 梅.傅立葉變換近紅外光譜進展[J].現代儀器,1999,(6):1-3,7.
[5] Luinge H J,Van der Maas J H,Visser T.Partial least squares regression as a multivariate tool for the interpretation of infrared spectra[J].Chemometrics and Intelligent Laboratory Systems,1995,28(1):129-138.
[6] Belousov A I,Verzakov S A,Von Frese J.A flexible classification approach with optimal generalisation performance:support vector machines[J].Chemometrics and Intelligent Laboratory Systems,2002,64(1):15-25.
[7] Vapnik V N.統計學習理論[M].許建華,張學工,譯.北京:電子工業出版社,2004.
[8] Li S T,Kwok J T,Zhu H L,etal.Texture classification using the support vector machines[J].Pattern Recognition,2003,36(12):2 883-2 893.
[9] 陳念貽,陸文聰,武海順,等.支持向量機算法在氮化鋁薄膜生長過程控制中的應用[J].計算機與應用化學,2002,19(6):726-728.
[10]Burbidge R,Trotter M,Buxton B,etal.Drug design by machine learning:support vector machines for pharmaceutical data analysis[J].Computers and Chemistry,2001,26(1):5-14.