王 欣,張冠男,朱 軍,萬一夫,姜 紅,劉占芳
(1. 中國人民公安大學 偵查學院,北京 100038;2. 公安部物證鑒定中心,北京 100038)
縱火是引發火災的一個重要原因,也是造成生命和財產損失的重要原因。對可燃液體等助燃劑的檢測鑒別對縱火案件的調查至關重要。隨著石油工業的發展和汽車的普遍使用,汽油逐漸成為人們日常生活中極其常見的一類物質,也是十分常見的可燃液體助燃劑。汽油是一種重要的煉油混合產物,大多數煉油廠通過轉化其他餾分來增加汽油的產量,過程包括化學轉化和重新配方,如高真空蒸餾、催化裂解、異構化、烷基化和加氫處理等。煉油廠所采用的工藝各不相同,因此汽油是不同煉油工藝的復雜混合物[1],對汽油進行研判分析一直是研究的熱點。Balabin等[2]嘗試用近紅外光譜法對汽油試樣進行檢測,結合多元分類方法,包括K最近鄰法、支持向量機法、概率神經網絡法,實現了汽油的質量控制和摻假識別。Li等[3]將拉曼光譜法與局部加權LSSVM算法相結合,在選擇相鄰樣本時既考慮了歐氏距離又考慮了相關系數,所得汽油型號的分類效果顯著。目前,在汽油的儀器分析方法中,使用最多的是美國測試和材料學會(ASTM)制定的GC-MS方法[4]。與國內GB/T 18294.5—2010[5]相比,ASTM標準更趨向于實驗室鑒定標準,主要通過視覺模式識別總離子色譜(TIC)圖、提取離子流色譜(EIC)圖并結合目標化合物的存在進行分析,而GB/T 18294.5—2010只是一個單純的方法型規范,未進行細致的分類。目前,通過GC-MS檢測可燃液體的方法主要是基于TIC[6-9]、選定的質譜離子[10]或雙向GC-MS數據[11]進行鑒定或分類。
本工作同時使用兩臺GC-MS檢測儀對汽油試樣進行分析,結合SIMCA14.1軟件,使用化學計量學方法(主成分分析(PCA)和偏最小二乘判別分析(PLS-DA))對GC-MS數據進行處理,根據型號、地域、廠家對汽油試樣進行分類分析。
從東北、西北、華南、中部等地區的各省市主要煉油廠收集89#,92#,95#,98#汽油試樣共一百余種,部分試樣來源和所屬區域信息如表1所示。每個汽油試樣取10 μL,用乙醚稀釋至1 mL,制成含量為1%(φ)的試樣,存放至實驗室防爆柜中。

表1 部分汽油試樣的來源和所屬區域Table 1 Sources and areas of some gasoline samples
Agilent公司7010型GC-MS檢測儀:DBWAX色譜柱(30 mm×0.25 mm×0.25 μm);柱箱起始溫度40 ℃,保持時間2 min,以5 ℃/min的速率升溫至80 ℃,保持2 min,再以10 ℃/min的速率升溫至300 ℃,保持10 min;進樣口溫度280 ℃;進樣量1 μL;進樣分流比20∶1;淬滅氣(He)流量4 mL/min,碰撞氣(N2)流量1.5 mL/min,電子轟擊電離源,電離能量70 eV;全掃描模式,掃描間隔0.2 s,m/z=40~500;離子源溫度250 ℃;溶劑延遲時間2.05 min。
Shimadzu公司GCMS-QP2010 SE型GC-MS檢測儀:DB-5ms色譜柱(30 mm×0.25 mm×0.25 μm);柱箱起始溫度40 ℃,保持時間2 min,以5 ℃/min的速率升溫至80 ℃,保持2 min,再以10 ℃/min的速率升溫至300 ℃,保持10 min;進樣口溫度280 ℃;進樣量1 μL;全掃描模式,掃描間隔0.2 s,m/z=15~500;離子源溫度250 ℃;溶劑延遲時間2.5 min。
通過結合SIMCA14.1軟件,將抽象的色譜數據轉化為可分析的向量。PCA是一種常用的多元變量分析方法[12-14],通過數據降維提取特征分量,從原始空間中順序地找一組相互正交的坐標軸,新的坐標軸的選擇與數據本身密切相關。PLS-DA是一種數學優化技術[15-17],通過將預測變量和觀測變量投影到一個新空間,以構建一個線性回歸模型。它通過最小化誤差的平方和找到一組數據的最佳函數匹配,用最簡單的方法求得一些絕對不可知的真值,從而令誤差平方之和為最小。PCA方法難以區分的數據在PLS-DA模型中更易于區分。
本實驗通過兩臺GC-MS檢測儀相互驗證,佐以SIMCA14.1軟件結合化學計量學,對汽油試樣進行研判分析。
2016年,我國推進成品油質量升級,全國施行國Ⅴ標準,根據抗爆性能(即辛烷值含量)汽油可分為89#,92#,95#,98#。隨機挑選各類試樣采用Agilent公司和Shimadzu公司的GC-MS檢測儀進行分析,所得譜圖經基線校正后,將數據信息導入SIMCA14.1軟件中建立工程,對數據信息進行預處理,采用自動擬合模型進行分類分析,結果如圖1~3所示。
由圖2和圖3可知,兩臺儀器數據穩定,排除了儀器污染、調諧不合格等儀器誤差;同時也保證了同一批試樣進樣分析,排除了移液帶來的試樣誤差。同一批試樣在兩臺儀器上親疏距離的差異可能是由于使用兩臺儀器進行檢測時,在試樣瓶轉移前后,試樣濃度因揮發發生了細微的變化。由圖1~3的分類結果可以看出,隨機試樣的型號都得到了良好的區分,從而驗證了構建的PLS-DA和PCA的多元變量分析模型可用于檢測汽油的型號。

圖1 不同型號汽油試樣的Agilent PCA分類結果Fig.1 Agilent PCA classification results of different types of gasoline samples.

圖2 不同型號汽油試樣的Agilent PLS-DA分類結果Fig.2 Agilent PLS-DA classification results of different types of gasoline samples.

圖3 不同型號汽油試樣的Shimadzu PLS-DA分類結果Fig.3 Shimadzu PLS-DA classification results of different types of gasoline samples.
汽油發動機在運轉時,吸進來的通常是汽油與空氣的混合氣,在壓縮過程中活塞上行,擠壓混合氣使體積縮小,同時也發生渦流和紊流。發動機的壓縮比越高,它的性能越好,但當壓縮比升高時,油氣燃燒所產生的能量就會更多地轉化為動能,氣缸壁受到的壓力就越大,對材料的要求也會提高。據調查顯示,目前發動機壓縮比為8.6~9.9的汽油汽車最常見,而92#汽油適用于這一類汽車。因此,以92#汽油為控制變量,隨機抽選東北、西北、華南、中部四個不同地域的汽油試樣,采用Agilent公司的GC-MS的檢測儀,分別進行PLS-DA和PCA分析,結果如圖4~5所示。

圖4 不同地域92#汽油試樣的Agilent PCA分類結果Fig.4 Agilent PCA classification results of 92# gasoline samples in different regions.
由圖4和圖5可看出,不同地域的測試集基本上可以實現聚類區分,但中部地區和華南地區的部分試樣親疏距離較為接近,為了解其中的差異性和相似性,以2#試樣和3#試樣為例,使用Python構建特征峰比較模型。創建DataDrame的分布式數據對象,合并后作為concat輸入,通過iloc函數調取并比較響應值強度,從而篩選出差異較大的出峰時間并集,并在GC-MS譜圖中觀察所得出峰時間處的響應程度,觀察的譜圖差異如圖6所示。

圖5 不同地域92#汽油試樣的Agilent PLS-DA分類結果Fig.5 Agilent PLS-DA classification results of 92# gasoline samples in different regions.
由圖6(a)可看出,在2.226,3.048,3.401 min處2#試樣的烷烴響應結果比3#試樣強,而其他時間3#試樣的響應結果均明顯強于2#試樣;而由圖6(b)可看出,2#試樣的芳烴響應結果大體上強于3#試樣。通過分析EIC譜圖,可以清楚地區別2#試樣和3#試樣在烷烴和芳烴出峰時間和出峰強度上的差異,從而實現訓練集的區分。

圖6 2#試樣和3#試樣的EIC譜圖Fig.6 Extraction ion current chromatography of sample 2# and sample 3#.
同一地域有多個煉油廠,在精煉過程中,汽油的最終產物是一種復雜的碳氫化合物混合物,它的具體成分主要由它的物理性質決定,如蒸汽壓、研究法辛烷值和發動機辛烷值。目前廣為共識的汽油主要化學成分是C4~C12的烷烴、芳烴(包括烷基苯、茚滿、萘系物)和含氧化合物(如乙醇、甲基叔丁基醚和乙基叔丁基醚)。然而,不同的煉油廠所采用的原油和煉制工藝不同,煉油流程隨著時間的推移也會發生變化。同一地域不同煉油廠的92#汽油試樣的分類結果如圖7和圖8所示。

圖7 同一地域不同煉油廠的92#汽油試樣的Agilent PCA分類結果Fig.7 Agilent PCA classification results of 92# gasoline samples from different refineries in the same region.

圖8 同一地域不同煉油廠的92#汽油試樣的Agilent PLS-DA分類結果Fig.8 Agilent PLS-DA classification results of 92# gasoline samples from different refineries in the same region.
由于化學成分基本相似,PCA和PLS-DA均不能給予明確清晰的區分。使用Python構建特征峰比較模型,分析TIC譜圖中特征峰出現的時間,將每兩個試樣在同一響應時間對應的不同出峰強度進行響應值分析和比值運算,并對運算結果進行逆序排列,發現1#試樣相較于其他試樣在3.0~3.6 min處出峰強度更弱,同樣對3#試樣響應值進行計量分析,順序排列后發現3#試樣在2.3~2.4 min處出峰強度明顯強于其他試樣。
將運算結果帶回TIC譜圖,進行譜圖分析,結果如圖9所示。由圖9可見,1#試樣在前15 min出峰強度較高,僅在2.444,3.397,11.4~11.7 min處的峰較弱或不出峰,在15~18 min出峰情況不明顯,經質荷比分析,原因是芳烴含量較少。2#試樣在前11 min出峰強度都處于最強或較強的水平,直到11 min后強度減弱,經質荷比分析,原因是烷烴含量較多而芳烴含量較少。3#試樣和4#試樣來自同一廠家,兩者整體出峰情況相似,在2.118,3.979,11.4~11.7 min處出峰較弱或不出峰,而兩者相比較,4#乙醇汽油試樣在一些時間的出峰強度更強。5#試樣只在前5 min保持一個較高的響應值,而在2.347 min也不出峰,在5~18 min都保持一個較低的響應值。13#試樣在前7 min的出峰強度總體較強,僅在個別時間點不出峰或響應值較弱,如2.247 min和5.896 min,但在后10 min出峰強度整體偏弱。14#試樣和15#試樣都來自東北油化廠,但14#普通汽油試樣整體響應值均大于15#乙醇汽油試樣,這可能與工藝流程和采用的填料等有關。

圖9 同一型號同一地域不同廠家的8個汽油試樣的TIC譜圖Fig.9 Total ion chromatography of eight same type gasoline samples from different manufacturers in the same region.
而6#試樣和7#試樣按照PLS-DA方法的判別結果與其他試樣差距很明顯,兩者之間也存在一定距離。經分析計算結果和觀察譜圖,發現兩者雖來自同一煉油廠,但6#試樣的烷烴響應值卻普遍低于7#試樣。而具體是哪一種烷烴是兩種汽油試樣的區分依據,則需要使用更高分辨率的儀器進行下一步探索。
1)運用兩臺GC-MS檢測儀交叉驗證,克服了普通GC-MS方法在試樣制備中移液帶來的偶然誤差。構建的PLS-DA和PCA多元變量分析模型可以在色譜中更為直觀地觀察到汽油型號的差異。
2)在對汽油地域特征的研判分析中,建立了一種將PLS-DA、程序運算、TIC譜圖和EIC譜圖相結合的方法。實驗結果表明,在2.226,3.048,3.401 min處華南地區汽油試樣的烷烴響應結果比中部地區汽油試樣強;而在其他時間,中部地區汽油試樣的響應結果均明顯強于華南地區的汽油試樣。從整體看,華南地區汽油試樣的芳烴響應結果大體上強于中部地區汽油試樣。通過分析EIC譜圖,可以清楚地區別不同地域試樣在烷烴和芳烴出峰時間和出峰強度上的差異,從而實現訓練集的區分。
3)在控制變量下對不同廠家進行研判分析時,按所構建的模型得到的結果具有一定的差異性。但同一地區的不同煉油廠在煉油過程中采用的填料相近、工藝流程大體相同,需要精確度更高的儀器進行離子定量分析。