田 靜,王曉娟,齊文良,梁振楠,陳 斌*
(1.江蘇大學 食品與生物工程學院,江蘇 鎮江 212013;2.寧波海關技術中心,浙江 寧波 315048)
隨著塑料化工技術的迅速發展,塑料制品在生活中的應用愈發廣泛,食品和藥品會直接接觸到大量塑料制品,因此塑料制品的安全性將會直接影響消費者身體健康[1-3]。聚乙烯(Polyethylene,PE)和聚丙烯(Polypropylene,PP)是最廣泛應用于食品、藥品直接接觸的塑料制品,但由于PE和PP的耐熱性和拉伸強度等性質相差較大,故兩者的適用場合和成本差異較大。不法廠商為節約成本,使用不符合國家標準的塑料制品作為食品和藥品的內包裝材料,嚴重威脅消費者健康,因此對食用級塑料包裝材料的鑒別尤為重要。
目前,對塑料制品種類的判別方法有燃燒法、溶解法、靜電法、光學法、熱分析法等[4-6],但這些方法在時間、工序及成本上存在很多不足。近紅外光譜技術具有快速、綠色、無損、成本低等優點,被廣泛應用于聚合材料以及農產品的品質檢測[7]。近紅外光譜區是含氫基團(C—H、N—H、O—H)的倍頻與合頻吸收區,利用該區域的吸收信息可進行含氫基團物質的定性定量檢測[8],將近紅外光譜與化學計量學方法結合建立定性定量模型,可快速判別塑料原料的種類和制品品質[9-10]。本研究基于近紅外漫反射光譜分析技術,對食品和藥品的外包裝常用塑料材料PE和PP進行定性判別,通過選取不同波長范圍、不同光譜預處理方法,在主成分分析的基礎上,采用多種模式識別算法,建立了定性校正模型,并通過比較各個模型性能的預測效果,優選出最佳預測模型,以期為塑料及塑料制品材質的種類快速鑒別提供參考。
塑料樣品(包括PP和PE)共100個,由寧波市檢驗檢疫局提供。其中,PP新生料17個,PP再生料15個,PE新生料36個,PE再生料32個,樣品分類情況見表1。

表1 塑料樣品類別個數統計表Table 1 Statistical table of plastic sample categories
S450近紅外光譜分析儀(上海棱光技術有限公司),儀器內置聚四氟乙烯參比模塊,可自動完成參比校正和波長監控,并配有聚四氟乙烯積分球漫反射系統和樣品旋轉裝置,適合粉末狀、顆粒狀樣品的測量。
在室溫(25 ℃)條件下,將裝有塑料樣品的樣品杯置于采集窗口進行光譜采集(波長范圍900~2 500 nm),取每個塑料樣品掃描3次的平均光譜進行后續數據分析,共采集100個樣品的近紅外光譜。
塑料樣品采用Kennard-Stone(K-S)方法進行樣品集劃分,校正集與預測集比例為70∶30。
在采集塑料樣品光譜圖的過程中,為減少塑料樣品密度與形態不同以及表面特征不均勻等因素的影響,并降低干擾因素產生的噪聲,通常需對光譜進行預處理,以提高定性校正模型的預測精確性。采用矢量歸一化、標準正態變量變換(Standard normal variate transformation,SNV)、中心化、滑動均值濾波(Moving average filtering,MAF)、多項式平滑濾波(Savitzky-Golay filtering,SGF)、一階微分方法對光譜預處理[11-16]。
使用江蘇大學近紅外研究小組自主開發的NIRSA4.5數據處理軟件進行光譜預處理和定性校正模型的建立。
采用主成分分析結合簇類的獨立軟模式方法(Soft independent modeling of class analogy,SIMCA)、貝葉斯判別(Bayes discriminant analysis,BDA)、K-近鄰(K-Nearest neighbor,KNN) 3種方法建立兩類塑料樣品的定性校正模型。主成分分析是通過線性變換來提取近紅外光譜中主要特征分量的數據降維方法,SIMCA方法是一種建立在主成分分析基礎上的模式識別方法,根據模型的擬合結果對其判別歸類。貝葉斯判別是通過計算總體各自出現的概率大小,對未知類別樣品進行歸類,將未知樣品歸屬于出現概率最大的一類。K-近鄰是直接利用已有的帶有類別標記的樣本集(稱為訓練樣本集)分類待分樣本(訓練樣本集中觀察到的鄰近樣本)。正確識別率(CRR,%)是用于評價定性校正模型精度的指標,CRR越高(越接近100%)表明模型的判別精度越高,具體計算公式為:CRR=m1/m2×100%,式中m1為正確識別樣品數,m2為樣品總數。

圖1 塑料樣品的原始近紅外光譜圖Fig.1 Raw NIR spectra of plastic samples

圖2 原始光譜前10個主成分的累計貢獻率趨勢圖Fig.2 Cumulative contribution rate trend of the first 10 principal components extracted from the original spectrum
2類4種PP與PE塑料樣品的近紅外漫反射原始光譜圖如圖1所示。由圖可見,PE和PP塑料的新生料近紅外光譜圖無太大差異,均在1 213 nm和1 394 nm處有較強吸收峰,這可能由樣品中C—H基團、C—H2基團的倍頻和合頻振動造成。但兩類塑料的再生料與新生料在1 000~1 800 nm 波段范圍內的原始光譜吸光度相差較大,可能由于再生料因反復使用夾帶了一定的雜質。因兩類塑料的吸收峰形和位置均較為相似,無法通過近紅外圖譜直觀鑒別,需將樣品的光譜數據結合化學計量學方法進行分析及判別。
在主成分提取中,累計貢獻率能夠反映前n個主成分對原始數據的信息表征能力,塑料樣品近紅外光譜的前10個主成分(PC1~PC10)的累計貢獻率趨勢圖見圖2,圖中可見前3個主成分(PC1、PC2、PC3)的累計貢獻率為99.22%,已接近100%,表明前3個主成分已可表征大部分光譜信息,因此數據分析均選取塑料樣品前3個主成分數建立各種判別定性校正模型。
2.3.1 波段對定性校正模型判別精度的影響不同的波長范圍所含有的塑料樣品屬性信息不同,建立的定性校正模型判別精度也不同。塑料樣品原始光譜選取不同波長區域的3種分類方法建立的模型預測結果見表2。由表中數據可見,在不同波長區間內,3種方法建立的定性校正模型均在1 050~1 550 nm波長范圍內的效果較好,此區域內SIMCA方法校正集和預測集的正確識別率分別為91.4%和86.7%,貝葉斯判別的校正集和預測集的正確識別率分別為74.3%和63.3%,K-近鄰方法的校正集和預測集的正確識別率分別為100%和100%。

表2 原始光譜不同波長區間的3種分類定性模型分類錯誤的樣品數統計分析Table 2 Statistical analysis of the number of wrong samples of three classification qualitative models with different wavelength intervals in the original spectrum

(續表2)
2.3.2 預處理方法對定性校正模型判別精度的影響在優化得出的最優波長區域內,使用SIMCA方法和貝葉斯判別2種識別方法結合不同預處理方法建立定性校正模型,比較不同光譜預處理方法對定性校正模型判別精度的影響,進一步提高模型的判別精度。表3為1 050~1 550 nm波段范圍采用不同光譜預處理方法的上述2種方法定性校正模型的統計分析結果。由表中數據可見,SIMCA方法結合SNV+5點MAF平滑、SNV+5點SGF平滑或者SNV+5點SGF平滑預處理方法預測模型判別精度最好,預測模型精度得以顯著提高,樣品校正集和預測集的正確識別率分別為95.7%和93.3%,表明該預處理方法可提取樣品近紅外光譜中的有效信息,減少了噪音干擾,提高了預測模型精度;貝葉斯判別結合SNV+5點MAF平滑光譜預處理的預測模型判別精度最好,其中樣品校正集和預測集的正確識別率分別為97.1%和93.3%。

表3 不同預處理方法的2種分類定性模型的分類錯誤的樣品數統計分析Table 3 Statistical analysis of the number of wrong samples of two classification qualitative models with different pretreatment methods
表4為3種分類方法在不同波段范圍、不同預處理方法下得到的最優定性校正模型的各類樣品分類錯誤的樣品數統計。由表4數據可見,在1 050~1 550 nm波段范圍內,SIMCA方法采用SNV+5點MAF平滑或者SNV+5點SGF平滑光譜預處理方法的預測模型對于PP新生料與再生料樣品區分效果較好;貝葉斯判別采用SNV+5點MAF平滑預處理方法的預測模型對于PP新生料與再生料區分效果較好;K-近鄰方法采用原始光譜建立的預測模型對2類4種PP與PE塑料樣品的分類效果最好。

表4 3種分類方法的最優定性校正模型分類錯誤的樣品數統計Table 4 Statistics of the number of misclassified samples of the optimal qualitative correction model under the three classification methods
本研究采用主成分分析法結合3種不同模式識別方法(SIMCA、貝葉斯判別、K-近鄰)建立了PP和PE定性校正模型,結果顯示:3種模式識別方法在1 050~1 550 nm波長內建立的定性模型判別精度最好;采用矢量歸一化、標準正態變量變換、中心化、滑動均值濾波、多項式平滑濾波、一階微分6種光譜預處理方法和上述3種模式識別方法對塑料樣品近紅外光譜進行數據處理發現,在1 050~1 550 nm范圍內未經光譜預處理,前3個主成分空間下的K-近鄰定性校正模型判別精度最好,樣品校正集和預測集的正確識別率均接近100%。該檢測方法具有結果準確、耗時短、無損等優點,可為食品包裝材料聚乙烯、聚丙烯的快速鑒別提供新方法。