劉一江 閆春華 李茂剛 張天龍 湯宏勝 李 華,
(1.西安石油大學 化學化工學院,西安 710065;2.西北大學 化學與材料科學學院,合成與天然功能分子教育部重點實驗室,西安 710127)
石油焦是由原油中的重質碳氫化合物經高溫分解后形成的,在工業中扮演著重要的角色。隨著化工市場規模持續擴大,重油加工業的需求急劇增長[1],導致石油焦(作為渣油延遲焦化的重要副產物[2])的產量顯著上升。這是一種堅硬而易碎的多孔材料[3],主要由90%~97%的碳和1.5%~8.0%的氫組成,還含有少量的氧、氮、硫和微量金屬[4]。2020年,我國石油焦產量達到了2 517萬t,消耗量高達3 488萬t[5]。目前,大部分石油焦已被廣泛應用于石墨生產、電解鋁、煉制等化工領域。
石油焦高碳含量、高熱值、低灰分和低成本等特性使其成為電解鋁工業的重要原料之一[6]。然而石油焦在生產和運輸過程中往往會帶入微量元素,例如Fe、Cu等。這些微量元素對于陽極的質量乃至電解出的鋁都可能會帶來危害,它們會增加鋁的電阻率,降低鋁的機械性能和純度。尤其是Cu,它的含量每增加0.1%,鋁的電阻率就會增加0.4%[7-8]。因此,準確快速地測定石油焦中微量元素的含量在支持降低石油焦中微量元素含量并提高陽極質量方面非常重要。
對石油焦中微量元素的傳統測定分析方法包括火焰原子吸收光譜法(Flame atomic absorption spectrometry,FAAS)[9]、原子吸收光譜法(Atomic absorption spectrometry,AAS)[10]、波長色散X射線熒光光譜法(Wavelength dispersive X-ray fluorescence spectrometry,WD-XRF)[11]和電感耦合等離子體原子發射光譜(Inductively coupled plasma atomic emission spectroscopy,ICP-AES)[12]法等。這些方法可以對石油焦中微量元素的含量進行測定,并可以提供極為準確的結果。但它們也有各自的不足。當使用AAS、FAAS和ICP-AES時,需要將石油焦溶解至試劑中進行檢測,而溶解方法如高溫溶解或微波消解不僅過程復雜、成本高和耗時長,還只能由有經驗的分析師在實驗室中進行。這樣大量的預處理工作還可能導致較大的實驗誤差。GAZULLA等[13-14]均用WD-XRF方法來確定石油焦樣本中微量元素的含量,其測定結果優于美國材料與試驗協會的標準ASTM-D 6376,然而石油類產品的組成具有極高的復雜性和差異性,仍能觀察到這些因素對該方法產生的干擾。因此,急需一種可快速、準確且無需對樣本進行復雜處理的分析方法,以實現樣本的無損或微損檢測。
激光誘導擊穿光譜(LIBS)技術是一種激光作為激發源的全新物質元素分析技術。該技術使用激光脈沖照射待測物體表面,激發樣本產生等離子體。通過獲取等離子體在產生到消亡過程中發出的光信號得到LIBS光譜,從而進行定性和定量分析。與傳統的分析方法相比,激光誘導擊穿光譜技術具備以下顯著優勢:無需繁瑣的樣本預處理、可實現微損或無損檢測、能夠進行快速的實時在線分析、適用于惡劣環境,如深空和高輻射區域中的遠距離測量以及具備多元素同時分析的能力。這些特點使得LIBS技術在科學研究、工業應用以及其他領域中備受歡迎。因此,LIBS技術已在古董鑒定和評估、土壤重金屬分析、冶金過程分析、太空和軍事探測、生物醫學、爆炸物檢測等領域廣泛應用[15-20]。
盡管LIBS在元素分析中具有顯著的優勢,但它仍然面臨一些挑戰。例如,對于定量分析,需要建立準確的標定方法,以將LIBS光譜與元素濃度相關聯。但由于激光能量波動、樣本表面不均勻以及外部環境等因素的影響,使得直接定量分析困難。化學計量學方法,如偏最小二乘(PLS)、嶺回歸(Ridge regression)、隨機森林(Random forest,RF)和卷積神經網絡(Convolutional neural networks,CNN)等對LIBS光譜數據進行復雜的多元分析,處理噪聲、校準光譜信號,并建立精確的濃度模型,幫助識別和定量分析樣本中的化學成分。LIBS和化學計量學結合能夠更準確和穩定地用于各種定量分析任務[21]。
本文擬探究LIBS技術結合PLS算法用于石油焦中Fe和Cu定量分析的可行性。首先,采集了石油焦實際樣本的LIBS光譜,并基于LIBS光譜構建用于石油焦中Fe和Cu定量分析的PLS校正模型。其次,考察了不同光譜預處理方法對PLS校正模型預測性能的影響。然后,在最優的光譜預處理基礎上優化并使用變量選擇算法建立PLS校正模型。最后,比較基于兩種不同變量選擇算法的PLS模型的預測性能,并選擇最優結果作為石油焦中Fe和Cu定量分析的最優預測模型。
從某石化公司獲得了19個實際的石油焦樣本塊。首先使用球磨機(南京萊步科技QM-3SP2行星式球磨機)將這些樣本研磨成粒徑小于75 μm的粉末,并經過74 μm(200目)篩分。然后取出一定量的石油焦樣本粉末,在110 ℃下干燥2 h,待冷卻至室溫后,將每個樣本依次稱取1.2 g(精確至0.000 1 g)粉末置于離心管中備用。使用壓片機(Pinchuang Technology,PC-24)以30 MPa的壓力維持5 min,制備Φ20 mm×4 mm的樣片。每個石油焦樣本制備一個樣片。采用ICP-MS對19個石油焦樣本中Fe和Cu進行檢測,將所測得的真實值作為參考值。石油焦中Fe和Cu的參考值如表1所示。

表1 石油焦樣本中Fe和Cu含量的參考值
使用自行搭建的激光誘導擊穿光譜采集裝置(圖1)進行光譜采集。采用Q-switched Nd:YAG激光器(Dawa300,鐳寶光電技術有限公司)作為激發光源,激發波長為1 064 nm,激光脈沖電壓為720 V,激光頻率為5 Hz。將19個石油焦樣本依次放置于三維可調樣本臺上進行LIBS光譜采集。激光束通過50 mm的透鏡聚焦在石油焦樣本表面,激發等離子體。與激光束45°的石英準直透鏡收集等離子體產生的光譜信號,通過光纖傳輸至三通道光譜儀(Ocean optics,MX2500,波長200~550 nm),延遲時間為3 μs,門寬為2 ms。在標準大氣壓下進行光譜信號的采集。為了減少誤差,在每個樣本上隨機選擇100個不同的位置進行光譜采集。每個樣本獲得100條光譜。

圖1 激光誘導擊穿光譜實驗裝置示意圖Figure 1 Schematic diagram of the laser-induced breakdown spectroscopy experimental setup.
光譜采集過程中由于基體效應的影響或外部環境等因素的干擾,會導致LIBS光譜異常。這些異常光譜的存在會影響模型的魯棒性和可靠性,因此剔除異常光譜對于獲得高質量的分析結果非常重要。
作為常用的多元統計技術,主成分分析(Principal component analysis,PCA)的優勢在于降維、數據可視化和探索多維數據集等。其主要目標是通過線性變換,在新的坐標系中將原始數據投影,從而使得數據的方差最大化,捕捉到數據的主要變化方向。另一方面,馬氏距離(Mahalanobis distance,MD)考慮了特征之間的相關性和協方差矩陣,能夠更準確地測量多維數據空間中點之間的距離。這使得MD在多變量數據中能夠更好地識別離群點。綜合使用PCA和MD可以有效剔除異常光譜。將每個樣本的光譜數據轉換到PCA降維后的特征空間中,通過MD評估數據點與其他數據點的關系是否偏離了正常的數據分布,設定閾值對每個樣本的100條光譜進行異常光譜剔除。剔除后,得到剩余光譜的平均值,使每個樣本得到1條光譜。19個樣本共獲得19條光譜。
圖2為石油焦樣本的LIBS光譜圖。通過與NIST的光譜數據庫對比,對采集到的LIBS光譜進行譜線的識別分析。從圖2中可以看出,石油焦的LIBS光譜圖中包含了C、Mg、Cu、Fe等元素的特征譜線,其中Fe和Cu的特征譜線主要集中在200~300 nm波段內。為了保證模型的穩定性和普遍性,在建立PLS模型時使用200~500 nm的全波段建模。

圖2 石油焦#3樣本的LIBS光譜圖(a.200~500 nm;b.210~255 nm;c.272~278 nm;d.255~265 nm)Figure 2 LIBS spectrum of petroleum coke #3 samples(a.200—500 nm;b.210—255 nm;c.272—278 nm;d.255—265 nm).
2.2.1 潛變量優化
基于原始光譜(RAW)構建用于化學計量學分析的PLS模型時,正確選擇潛變量(Latent variables,LVs)的數量可以確保模型具有良好的預測性能并避免過度擬合。通過留一交叉驗證對PLS模型的潛變量個數進行優化。圖3為不同潛變量個數對應的交叉驗證R2cv和RMSEcv(均方根)值。從圖3可以看出,對于Fe,潛變量為7時對應最佳的R2cv和RMSEcv值分別為0.897 2、14.365 0 mg/kg;對于Cu,潛變量為4時對應最佳的R2cv和RMSEcv值分別為0.819 7、9.581 8 mg/kg。
2.2.2 光譜預處理方法選擇
由于原始光譜模型獲得的交叉驗證準確度較低,本節進一步研究不同預處理方法對PLS校正模型預測性能的影響。表2展示了不同光譜預處理方法[歸一化(Normalization,Nor)、多元散射校正(Multiple scattering correction,MSC)、標準正態變換(Standard normal variate,SNV)、一階導數(First derivative,D1st)和二階導數(Second derivative,D2nd)]對PLS模型預測性能的影響。從表2可以看出,對于Fe,D2nd(平滑點數n=9)對應最優的R2cv和RMSEcv。Fe的R2cv從0.795 8(原始光譜)提升至0.938 0,RMSEcv從25.405 7 mg/kg(原始光譜)降至14.446 5 mg/kg。對于Cu,使用MSC方法時模型預測效果最好,R2cv從0.815 7提升至0.882 8,RMSEcv從12.818 6 mg/kg降至10.361 5 mg/kg。
基于光譜預處理,模型預測性能得到進一步提升,但全譜中仍然包含大量的冗余信息,可能會影響PLS模型的預測性能。因此,分別使用PSO和VIP兩種變量選擇算法對原始光譜進行篩選,以進一步提升PLS模型的預測性能。
2.3.1 粒子群優化算法(PSO)
首先,基于五折交叉驗證對PSO的參數進行優化,發現當粒子群數量為20、迭代次數為200、慣性權重為0.7、學習因子C1和C2均為2時對應最優的性能。表3展示了兩種元素在各自最優的光譜預處理方法后再使用PSO進行變量選擇的結果。從表3可以看出,對于Fe,使用PSO進行變量選擇之后,Fe的R2cv從0.938 0(D2nd)提升至0.964 0,RMSEcv從14.446 5 mg/kg(D2nd)降至10.703 3 mg/kg。對于Cu,R2cv從0.882 8(MSC)提升至0.955 3,RMSEcv從10.361 5 mg/kg(MSC)降至6.330 0 mg/kg。因此,基于最優預處理和PSO構建的PLS校正模型與僅使用光譜預處理方法構建的PLS校正模型相比有較大提升。

表3 基于PSO的PLS校正模型的五折交叉驗證結果Table 3 Five fold cross-validation results of PSO-based PLS calibration models
2.3.2 變量重要性投影(VIP)
VIP算法中合適的閾值k的選擇有助于降低數據維度,提高模型訓練和預測的效率,并減少過擬合的風險。用五折交叉驗證對閾值k進行優化,如圖4所示。從圖4可以看出,Fe的閾值為0.22時模型最佳,Cu的閾值為0.75時模型最佳。基于Fe和Cu兩種元素再各自最優光譜預處理和各自最佳閾值VIP的PLS校正模型預測性能結果如表4所示。由表4可知,對于Fe,R2cv為0.966 7,RMSEcv為10.282 1 mg/kg,結果與基于PSO的PLS模型相比有所提升;對于Cu,R2cv為0.911 4,RMSEcv為9.075 7 mg/kg,結果與基于PSO的PLS模型相比卻有所下降。由此可知,選擇適當的模型和方法非常重要,不同的元素和樣品類型可能需要不同的分析策略,這會影響到模型的預測性能。

圖4 VIP閾值k優化圖(a) Fe;(b) CuFigure 4 Optimization of VIP threshold k(a) Fe;(b) Cu.

表4 基于VIP的PLS校正模型的五折交叉驗證結果Table 4 Five fold cross-validation results for VIP-based PLS calibration models
基于最優的光譜預處理和變量選擇方法,構建用于石油焦中Fe和Cu元素分析的定量模型對預測集樣本進行分析。圖5(a)和5(b)展示了Fe和Cu元素各自的校正模型對預測集樣本預測結果的線性擬合。從圖5可以看出,對于Fe,基于D2nd和VIP的PLS模型預測集R2p為0.863 8,RMSEp為14.507 8 mg/kg,MRE為0.075 8;而對于Cu,基于MSC和PSO的PLS模型預測集R2p為0.926 9,RMSEp為7.650 2 mg/kg,MRE為0.068 7。預測集樣本的模型預測值與參考值之間具有良好的線性關系。

圖5 變量選擇之后的PLS模型預測結果的散點圖(a) Fe;(b) CuFigure 5 Scatter plot of PLS model prediction results after feature selection(a) Fe;(b) Cu.
利用LIBS結合PLS算法,對石油焦中微量元素Fe和Cu進行定量分析。首先,基于LIBS光譜構建用于石油焦中Fe和Cu定量分析的PLS校正模型并優化潛變量個數。然后,考察了不同光譜預處理以及變量選擇算法對PLS校正模型預測性能的影響。研究結果顯示,對于Fe基于D2nd和VIP的PLS模型獲得了最優的預測結果,R2cv從原始光譜的0.795 8提升至0.966 7,RMSEcv從25.405 7 mg/kg降至10.282 1 mg/kg,預測集R2p為0.863 8,RMSEp為14.507 8 mg/kg;對于Cu,基于MSC和PSO的PLS模型獲得了最優的預測結果,R2cv從原始光譜的0.815 7提升至0.955 3,RMSEcv從12.818 6 mg/kg降至6.330 0 mg/kg,預測集R2p為0.926 9,RMSEp為7.650 2 mg/kg。綜上,LIBS結合變量重要性投影的PLS模型和粒子群優化的PLS模型具有良好的預測性能,該研究成果可為石油焦中微量元素的快速檢測提供理論依據和技術參考。