萬順寬, 呂 波, 張洪明*, 何 梁, 符 佳, 計華健, 王福地, 賓 斌, 李義超
1. 中國科學院合肥物質科學研究院等離子體物理研究所, 安徽 合肥 230031 2. 中國科學技術大學, 安徽 合肥 230026 3. 南華大學核科學與技術學院, 湖南 衡陽 421001
近紅外(near infrared, NIR)光譜分析技術[1-3]具有方便、 快速、 高效、 結果準確, 不破壞樣品, 不消耗化學試劑和不污染環境等優點, 受到越來越多的關注。 便攜式NIR光譜儀無法配備溫控模塊, 環境溫度的差異會對樣品的吸收或反射光譜產生較大影響, 因此必須要建立包含環境溫度修正項的預測模型, 以降低環境溫度的差異造成檢測結果的誤差。 目前, 國內外已經開展了一些關于近紅外光譜的溫度修正研究。 孫彥華等利用自主研制的手持式近紅外光譜儀采集玉米樣品的近紅外光譜, 研究樣品溫度變化對模型預測結果的影響, 可以實現樣品的快速無損檢測[4]。 Thamasopinkul等基于近紅外光譜儀(Spectra-StarTM 2500, Unity Scientific, Milford, MA, USA) 利用標準正態變量變換的擬最小二乘回歸建立了三種恒溫(25, 35和45 ℃)校正模型, 并建立了具有溫度補償的校正模型模擬了蜂蜜的近紅外光譜受樣品溫度變化的影響[5]。
上述研究是針對不同種類的含水分樣品開展了溫度修正模型研究, 而特種柴油中的水含量可以忽略, 目前環境溫度差異對無水柴油的檢測結果的影響尚不明確, 阻礙了利用近紅外分析方法對特種柴油進行現場快檢應用的發展[6]。 柴油的凝點是柴油的重要指標之一, 對貯存, 運輸和使用都有重要影響。 柴油的凝點與其結構組成有著密切關系, 鏈羥結構對柴油的凝點貢獻起著決定性作用, 近紅外光譜在分析C—H結構方面有著獨特的優勢[7]。 因此基于便攜式近紅外光譜儀對無水的特種柴油開展溫度修正模型的研究, 通過引入溫度修正項, 得到了修正后的預測模型, 結果表明該模型可以有效降低環境溫度對預測結果的影響。
首先在室溫T0=25 ℃條件下測量了特種柴油樣品的光譜, 并采用偏最小二乘(PLS)[8-10]建立了該柴油的凝點預測模型[11]
c=b0+b1A1+b2A2+…+bnAn
(1)
式(1)中,A1—An是樣品各個波長處的吸光度,b0—bn為不同波長處光強的權重系數,c為樣品的理化指標, 在本研究中c為柴油樣品的凝點值。
在各環境溫度條件下(-10, 0, 10, 20, 30, 40和50 ℃)測量了樣品的吸收光譜, 再將這些溫度條件下的光譜數據帶入25 ℃條件下的預測模型, 以分析環境溫度(TE)差異對預測結果帶來的影響
Δc(TE)=c(TE-T0)-c0
(2)
其中,c(TE)為利用TE環境溫度下測量光譜數據得到凝點預測值,c0為采用國標方法(GB/T510)得到的柴油凝點標準值。
利用偏最小二乘法將每個環境溫度下預測結果與標準值之間的差異對環境溫度TE進行一次函數擬合, 得到
Δc=f1(TE-T0)
(3)
其中,f1為環境溫度TE變化對預測結果產生的修正項系數, 以修正環境溫度差異帶來的測量誤差,T0為25 ℃。
最后得到了帶有溫度修正項的預測模型
cm=b0+b1A1+b2A2+…+bnAn+f1(TE-T0)
(4)
式(4)中,cm修正模型得到的柴油樣品凝點修正值。
采用遼寧方圓國家標準樣品油有限公司提供的特種無水柴油樣品, 樣品凝點值分別為-54.0, -48.0, -44.0, -36.0, -33.0, -28.0, -24.0, -16.0, -12.0, -8.0和-3.0 ℃共計50種柴油, 每個凝點值同時包括數個其他指標不同的樣品。 所有樣品的凝點均采用國標方法GB/T510進行測定。
使用基于德州儀器(Texas Instruments Inc)DMD芯片的透射式近紅外光譜儀[12], 掃描模式可通過控制界面設置, 為列掃描模式, 波長數據點設置為228個, 通過6次掃描取平均值。
實驗步驟: (1) 將恒溫箱調整至25 ℃, 等待30 min后, 把按照1—50編號的比色皿(光程10 mm)依次放入光譜儀樣品池, 待溫度恒定后進行空比色皿的參考光譜采集; 然后將柴油樣品按照1—50進行標號, 并依次裝入對應編號的石英比色皿中, 將盛有柴油樣品的比色皿依次放入光譜儀樣品池, 在箱內溫度恒定后依次進行數據采集。 考慮此款光譜儀在900~950和1 650~1 700 nm波長范圍內的測量誤差較大, 本實驗僅采用950~1 650 nm波長范圍內的光譜數據如圖1(a), 采集到的波長點數由原來的228減少到197。 (2) 將恒溫箱溫度分別設定為-10, 0, 10, 20, 30, 40和50 ℃, 然后依次重復上面的測量步驟, 即可得到不同溫度條件下柴油樣品的吸收光譜數據。

圖1 溫度環境為25 ℃條件下柴油樣品的(a)原始吸收光譜和(b)預處理后的吸收光譜數據
利用在25 ℃條件下測量的吸收光譜數據建立了柴油凝點的預測模型。 首先對原始數據進行預處理[13], 預處理方法包含了歸一化, 標準正態化和差分二階求導, 以降低噪聲對最終結果的干擾。 預處理后的光譜數據如圖1(b)所示, 由圖中可以看出柴油在950~1 650 nm波長范圍內有兩組主要的吸收譜帶, 即1 100~1 260 nm范圍內的二級倍頻吸收以及1 300~1 500 nm范圍內的合頻吸收。 對各級倍頻或合頻, 主要有三種基團的典型吸收, 即芳環中C—H、 甲基C—H、 和亞甲基C—H吸收。 因為此柴油樣品為無水柴油, 譜線中無水吸收峰。
根據馬氏距離法[14], 計算出50種樣本的馬氏距離, 剔除馬氏距離較大的點, 為了避免對查找出的異常樣本產生誤判, 將實際并非異常那個點的樣本判定為異常點, 需要對查找的樣本可以進行二次檢驗, 最后剔除了異常點4個, 將剩下46個樣品的光譜數據分成校正集和獨立驗證集兩個數據集合, 校正集與獨立驗證集分別包含37個和9個樣品的光譜數據, 其中9個獨立驗證集分別隨機選擇9個凝點不同的樣品數據。 利用偏最小二乘法基于校正集數據建立凝點值的預測模型, 并將獨立驗證集數據代入模型, 以計算獨立驗證集的殘差RMSEP, 可以計算出RMSEP隨模型維度的變化關系[15], 如圖2(a)所示, 在p=9條件下(p為PLS的主因子數), RMSEP取得最小值0.100 3。 因此, 在本模型中選擇維度p=9來建立預測模型。 模型預測值與凝點國標測量值間的關系如圖2(b)所示。

圖2 (a)校正集殘差(RMSEC)和檢驗集殘差(RMSEP)隨PLS維數的變化關系; (b)環境溫度為25 ℃條件下柴油樣品凝點值的預測曲線
依次將另外7個環境溫度條件下測量到的光譜數據在相同的馬氏距離異常點剔除法和預處理之后代入上述模型進行凝點值預測。 圖3(a)給出了Δc隨環境溫度TE的變化關系。 可以發現預測偏差Δc隨TE的上升而有明顯的線性上升趨勢。 根據式(3), 利用最小二乘法對圖中數據進行擬合, 可以得到凝點值誤測偏差Δc隨TE-T0的一次擬合系數f1=-0.019 8。 再根據式(4)即可得到基于溫度修正模型的預測值
cm=3.521 8+3.405 5A1-6.124 4A2+…-
12.787 1A197-0.019 8(TE-25)
(6)
其中TE為環境溫度;cm為修正模型得到的柴油樣品凝點修正值。
圖3(b)給出了基于溫度修正模型的凝點值預測偏差, 可以發現由環境溫度變化趨勢產生的整體上升趨勢得到消除, 顯著降低了環境溫度變化對預測結果產生的影響。

圖3 基于(a)無溫度修正模型和(b)溫度修正模型的凝點預測值偏差對比
根據前面溫度修正做馬氏距離法剔除異常點時, 10 ℃下所用的46個樣本, 分別給出了環境溫度為10 ℃條件下溫度修正前后的凝點值預測模型的預測值與國標法測量值之間的關系如圖4(a)和(b), 可以明顯觀測到溫度修正后的樣品凝點值更向國標法所測量得凝點值收斂, 說明溫度修正后的凝點值更精確, 預測值偏差得到明顯改善。

圖4 基于(a)無溫度修正模型和(b)溫度修正模型對環境溫度為10 ℃條件下柴油凝點的預測值對比
為了證明溫度修正后的效果, 在所有樣品中隨機抽出一個樣本, 凝點為-54.0 ℃, 此樣品在不同溫度下的溫度修正前后的變化關系如圖5所示, 可以看出在經過溫度修正后, 樣品的預測凝點值受溫度影響的效果明顯減少。 數據測量時已經將空比色皿和光譜儀的溫飄作為參考光扣除了, 光譜儀的影響可以排除。 近紅外模型的好壞可以由兩個參數相關系數和殘差來證明, 檢驗集的相關系數越大, 殘差越小, 模型越好。 表1給出了多個環境溫度條件下的預測集殘差RMSEP與相關系數r在密度修正前后的數值對比, 在經過溫度修正后預測集相關系數相對增大, 預測集殘差相對減小, 由此證明溫度修正方法對溫度引起的預測偏差起到了消除作用。r數值相對偏小的原因可能是由于在實驗時開關恒溫箱箱門更換樣品過程中箱內溫度急劇變化導致比色皿表面起霧引入的一些誤差。 總體結果顯示出了此溫度修正方法對溫度引起的預測偏差的消除作用。

圖5 不同溫度下凝點值為-54.0 ℃的樣品在溫度修正前后的對比
利用基于DMD的便攜近紅外光譜儀采集了不同環境溫度條件下的柴油油品樣品在的近紅外波段的吸收光譜, 研究了樣品溫度變化對模型預測結果的影響。 通過分析發現樣品吸光度光譜與溫度之間存在線性關系, 在環境溫度高于建立模型的環境溫度時, 模型的預測偏差高于實際值。 利用這一關系提出了溫度修正模型, 并通過試驗結果證明該溫度修正方法可以對光譜進行修正, 利用修正后的光譜代入已建立好的模型預測結果有了很大的改善。 最后使用10 ℃下46個樣本對溫度修正理論進行了檢驗, 均方根誤差分別為~14.6和~8.8。 本研究顯示基于此溫度修正模型, 可以顯著降低建模過程的工作量, 在25 ℃條件下建立預測模型后將此溫度修正項帶入模型即可用于在其他環境溫度條件下進行柴油凝點值預測, 而不需要在其他多個溫度條件下分別建立預測模型。 此方法顯著提高了建模效率和便攜式近紅外光譜快速檢測的溫度適應性。