謝佳寧,胡曉光*,姜紅,章欣,黃凱
差分拉曼光譜結合化學計量學對白色購物紙袋的檢驗研究
謝佳寧1,胡曉光1*,姜紅2*,章欣3,黃凱3
(1.中國人民公安大學 偵查學院,北京 100038; 2.甘肅警察職業學院 刑事偵查系,蘭州 730046;3.南京簡智儀器設備有限公司,南京 210049)
建立差分拉曼光譜用于無損識別白色購物紙袋的方法。對收集到的60種不同品牌、不同規格的白色購物紙袋進行拉曼光譜測定,對樣品的拉曼光譜圖進行預處理,根據光譜圖對樣品進行初步分類,并結合化學計量方法對樣品進行分組。應用Fisher判別分析方法對分類結果進行驗證。最后應用RBF模型對未知樣本進行分類判別。結合樣品中所含的碳酸鈣、滑石粉、硫酸鋇的不同,可初步將白色購物紙袋樣品分為五大類,采用-均值聚類方法繼續細分,通過Fisher判別方法對樣品分結果進行驗證,判別準確率為100%。應用神經網絡RBF模型對未知樣本進行判別分析,準確率達到89.48%。該方法簡便易行,為白色購物紙袋的分類提供了科學的依據,也為公安基層工作的開展提供了便捷的辦法。
白色購物紙袋;差分拉曼光譜;化學計量學;系統聚類
白色購物紙袋是一種環保美觀且耐用的綠色產品,其主要材質為紙漿,可以按材質、用途、封底方式等分為多種多樣的款式品種。在日常生活中,紙袋價格便宜,使用方便,承重能力大,是許多市民出行購物的必備物品。環保是紙袋的最大優勢,可以在微生物、水、氧氣等自然作用下很快降解成無害的物質。紙質物證的檢驗方法主要有高光譜法[1]、差分拉曼光譜法[2-3]、紅外光譜法[4]、X射線熒光光譜法[5-6]等。在先前檢驗紙類材料的方法研究中光譜法前處理簡單、檢材用量少、快速無損、特征性強;色譜法分離效能高、選擇性好、出樣速度快;質譜法可準確測定分子量、靈敏度高、能對混合物進行分析。實驗采用差分拉曼光譜儀器,較之以往實驗器材具有無標記、快速簡便的優點,可有效去除干擾峰得到純凈的光譜圖。在公安實際刑偵工作中,犯罪嫌疑人可能利用紙袋進行包裝或收納相關涉案物證,因此紙袋這類重要物證可能是公安機關進行偵查破案的關鍵點。本文通過化學計量學方法建立對白色購物紙袋的檢驗分類方法,對紙類相關物質的檢驗分析具有一定的基層實踐意義。
實驗儀器:差分拉曼光譜儀(南京簡智儀器設備有限公司)。
實驗條件:激光功率為250 mW,積分時間為3 s,掃描范圍250~2 800 cm?1。
不同品牌的白色購物紙袋60個,樣品參數見表1。
表1 白色購物紙袋樣品

Tab.1 Samples of white shopping paper bag
將白色購物紙袋裁剪為0.5 cm×0.5 cm的待測樣品,用無水乙醇棉簽輕擦白色購物紙袋樣品,待表面風干后對白色部位進行測試。
重復性實驗:在上述實驗條件下,隨機選取27#樣品對同一部位進行平行測試10次。
樣品均勻性實驗:隨機選取15#樣品,在同一實驗條件下對樣品上、下、左、右、中間這5個不同部位進行測試。
由實驗結果可得,27#樣品在同一部位的拉曼光譜圖基本一致,表明差分拉曼光譜儀穩定性良好。15#樣品的不同部位的拉曼光譜圖基本相同,表明樣品成分均勻,實驗數據準確可靠。
白色購物紙袋的主要成分是纖維素,為了滿足購物紙袋不同的性能要求,在生產過程中會添加不同填料。紙袋中的主要填料有滑石粉、碳酸鈣、硫酸鋇等,滑石粉可以提高紙張的光澤度、平滑度和白度;碳酸鈣價格低廉,能提高紙張的不透明度和吸油墨性能,具有很好的阻燃效果;硫酸鋇可以改善紙張的白度、光澤度、平滑度和印刷適印性。常見物質的主要拉曼特征峰見表2。
大部分紙袋成分都含有纖維素,因此纖維素不能有效作為分類的判斷標準,故考慮其他填料。通過拉曼光譜圖的篩選對比,可以發現280、711、1 085 cm–1是碳酸鈣的拉曼特征峰;996、1 115、1 148 cm–1是硫酸鋇的拉曼特征峰;370、430、502 cm–1是滑石粉的拉曼特征峰[7]。依據拉曼光譜圖中特征峰的不同,可將60個樣本分為五大類,具體分類結果見表3。第Ⅰ類樣本含有碳酸鈣和滑石粉,以2號樣本為例(見圖1);第Ⅱ類樣本含有硫酸鋇,以48號樣本為例(見圖2);第Ⅲ類樣本含有碳酸鈣、硫酸鋇和滑石粉,以1號樣本為例(見圖3);第Ⅳ類樣本含有滑石粉,以59號樣本為例(見圖4);第Ⅴ類樣本不含有碳酸鈣、硫酸鋇和滑石粉,以56號樣本為例(見圖5)。
對檢測得到的拉曼光譜數據用化學計量學的方法處理,可以進一步對樣品進行分類。由于拉曼光譜數據有信息量龐大的特點,因此使用主成分分析方法對光譜數據進行降維分析。主成分分析法是借助于一個正交變換,將其分量相關的原隨機向量轉化為其分量不相關的新隨機向量。在代數形式上表現為將原隨機變量的協方差矩陣變換為對角矩陣,在幾何形式上表現為將原坐標系變換成新的正交坐標系,使原隨機向量指向樣本點分散開的個正交方向。然后對多維變量系統進行降維處理,再構造適當的價值函數,進一步把低維系統轉化為一維系統[8]。
本實驗中,樣品數量為60個,拉曼光譜數據有2 048維。通過計算光譜數據的協方差矩陣和樣品矩陣求出樣品的主成分。選取主成分數量的標準有碎石圖、累計方差貢獻率和KMO檢驗等。KMO檢驗的結果顯示為0.996,水平上呈現顯著性,即表明各變量間具有相關性,主成分分析結果是有效的。選取累計方差貢獻率作為篩選標準,一般要求大于90%,將樣本數據的2 048個變量降維為16個變量,方差累計貢獻率為99.076%,降維后的數據用于后續處理(見表4)。
表2 常見物質的拉曼光譜特征峰

Tab.2 Raman characteristic peaks of common fillers
表3 樣品分類

Tab.3 Sample classification

圖1 第Ⅰ類2#樣品的拉曼光譜圖

圖2 第Ⅱ類48#樣品的拉曼光譜圖

圖3 第Ⅲ類1#樣品的拉曼光譜圖

圖4 第Ⅳ類59#樣品的拉曼光譜圖

圖5 第Ⅴ類56#樣品的拉曼光譜圖
-均值聚類方法是基于樣本集合劃分的聚類算法,主要是將樣本集合劃分為個子集,構成個類,將個樣本分到個類中,每個樣本到其所屬類的中心距離最小,每個樣本僅屬于一個類。首先,采用歐氏距離平方作為樣本之間的距離(x,x):

然后定義樣本與所屬樣本中心之間的距離總和為損失函數,即:
表4 總方差解釋

Tab.4 Interpretation of total variance
選擇值為5,將60個白色紙袋樣本進行-均值聚類,得到分類結果(見表5)與樣品填料分類結果進行對比,發現按照填料分類第Ⅰ類的2#號樣本被分到了-均值聚類的第Ⅱ類,28號樣本被分到了第Ⅴ類;填料分類第Ⅱ類的22號和39號樣本被分到了第Ⅴ類;填料分類第Ⅴ類的8號樣本被分到第Ⅰ類。分析原因為-均值聚類分析方法對變量的方差齊次性的要求較高,同時初始聚類中心的隨機性也會對聚類中心發生影響,因此導致分類差異。除去這5個樣本數據,其余樣本數據與按照填料分類結果一致,說明分類結果具有一定科學性。
利用Fisher判別函數分析-均值聚類法對60個白色購物紙袋樣品分析結果的準確性和科學性。以降維后的16個變量為研究對象來建立Fisher判別函數,根據Fisher判別函數計算樣品得分并將其劃入得分高的組別。通過分析建立了3種判別函數,檢驗判別結果見表6[11]。

圖6 不同K值對聚合系數的影響
表5-均值聚類樣品分類

Tab.5 K-means clustering sample classification
表6 Wilk的Lambda檢驗

Tab.6 Wilk's Lambda test

圖7 判別函數聯合分布圖
Wilks' Lambda可以用來判定函數有無價值,由表6得3個函數的顯著性水平都小于0.05,因此具有統計意義。方差百分比可以解釋判別函數反映的方差變異程度的大小,函數1的方差百分比為78.5%,函數2的方差百分比為20.1%,說明函數1對判別分析的貢獻更高。函數1和函數2的累計貢獻率達到了98.6%,攜帶的信息可以解釋大部分變量,遠超于其他函數,綜上選取函數1和2作為模型的判別函數,并建立樣本的二維聯合分布圖(見圖7)。可以看到5組樣品在空間區域上區分效果明顯,并通過次模型對分類結果進行預測,表7顯示其正確判別率為100%,說明-均值聚類分類結果具有一定的準確性和科學性。
近年來,機器學習的方法在法庭科學領域的應用范圍逐漸變廣泛,常用來預測不同的物證,模型通過訓練來預測樣品的種類。依照先前的分類數據,通過構建模型來驗證樣品分類的準確性和可靠性。多層感知器神經網絡也叫人工神經網絡,是一種全局逼近的由一組并行的多個感知器構成的神經網絡,其可以為單層或多層結構,見圖8。神經網絡模型由輸入層、隱藏層、輸出層組成,外部信息通過輸入層進行模型,由隱藏層進行數據處理,再由輸入層進行信息輸出[12-13]。
表7 Fisher模型分類預測結果

Tab.7 Classification prediction results by Fisher model

圖 8 RBF神經網絡結構
實驗采用RBF模型來實現對未知樣本的模型構建與分類。在RBF模型中選擇樣品的波長作為輸入層神經元,選擇正態化徑向基函數作為隱藏層激活函數[14-15]。以60個差分拉曼光譜數據為基礎,構建RBF模型并將樣本按70%和30%的比例分為訓練集和測試集,進行位置樣品的判別訓練。共有42個樣本作為訓練集,18個樣本作為測試集,具體分類預測結果見表8。由表8可得,訓練集的正確率可以達到94.66%,測試集的正確率有84.3%,其總體正確率為89.48%。由此說明了神經網絡模型分類方法是準確可靠的,可與均值聚類結果相互印證,并且可在已知樣品分類組別基礎上,構建未知樣本的模型構建,實現對未知樣本的分類。
表8 RBF模型中的分類結果

Tab.8 Classification results in RBF model
本文通過差分拉曼光譜法與化學計量學相結合對白色購物紙袋進行分類檢驗,根據填料不同初步分為五大類,隨后應用-均值聚類方法繼續細分,將每組樣品有效區分開來,并且通過Fisher判別方法對分類結果進行驗證,準確率為100%,證明了分類結果的準確性。采用RBF模型對未知樣本進行判別分析,模型總體準確率可以達到89.48%。因此采用差分拉曼光譜法結合化學計量學是可以對白色購物紙袋進行有效分類的。本文為實際案發現場中遺留下的紙類證據檢驗分類工作提供了新的思路,以期能夠更高效、更準確地進行偵查破案。
[1] 林凡琦, 姜紅, 張文宇. 高光譜結合多元統計分析鑒別一次性紙杯樣品[J]. 化學研究與應用, 2021, 33(10): 1949-1955.
LIN F Q, JIANG H, ZHANG W Y. Hyperspectral Analysis Combined with Multivariate Statistical Analysis to Identify Disposable Paper Cup Samples[J]. Chemical Research and Application, 2021, 33(10): 1949-1955.
[2] 陳維娜, 國中正, 李開開, 等. 顯微共聚焦拉曼光譜技術結合化學計量法鑒別靜電復印紙[J]. 光譜學與光譜分析, 2022, 42(7): 2033-2038.
CHEN W N, GUO Z Z, LI K K, et al. Micro Confocal Raman Spectroscopy Combined with Chemometrical Method for Forensic Differentiation of Electrostatic Copy Paper[J]. Spectroscopy and Spectral Analysis, 2022, 42(7): 2033-2038.
[3] 劉津彤, 張嵐澤, 姜紅, 等. 差分拉曼光譜結合支持向量機模型對便簽紙的鑒別分析[J]. 化學通報, 2022, 85(2): 259-263.
LIU J T, ZHANG L Z, JIANG H, et al. Identification of Note Paper by Differential Raman Spectroscopy Based on Support Vector Machine[J]. Chemistry, 2022, 85(2): 259-263.
[4] 周貫旭, 姜紅, 胡曉光, 等. 紅外光譜結合主成分分析對紙質快遞文件袋的分類研究[J/OL]. 包裝工程: 1-8 [2023-04-09]. https://kns.cnki.net/kcms2/article/abstract?v= ZJxhFRRmSIg0z3jdxRX_CHS2JMnC20X8f7LbeMRNkfdYycqW_59-9vcOcwgAFBr1I-HkNJNhQRFf3AAzsfw8vP8hoGcTCYR8VfEPP0nNPN_ipD_nWI0U6OHjDDBLVkEKh2hWjkZ5CPc=&uniplatform=NZKPT&language=CHS
ZHOU G X, JIANG H, HU X G, et al. Classification of Paper Express Delivery Document Bags Using Infrared Spectroscopy Combined with Principal Component Analysis[J/OL]. Packaging Engineering: 1-8 [2023-04-09]. https://kns.cnki. net/kcms2/article/abstract?v=ZJxhFRRmSIg0z3jdxRX_CHS2JMnC20X8f7LbeMRNkfdYycqW_59-9vcOcwgAFBr1I-HkNJNhQRFf3AAzsfw8vP8hoGcTCYR8VfEPP0nNPN_ipD_nWI0U6OHjDDBLVkEKh2hWjkZ5CPc=&uniplatform=NZKPT&language=CHS
[5] 賈鎮, 姜紅, 李晟全, 等. X射線熒光光譜法結合多元統計學對熱敏紙的檢驗研究[J]. 化學研究與應用, 2021, 33(4): 749-754.
JIA Z, JIANG H, LI S Q, et al. X-Ray Fluorescence Spectrometry Combined with Multivariate Statistics for Thermal Paper[J]. Chemical Research and Application, 2021, 33(4): 749-754.
[6] 姜紅, 王欣, 顧安舟. XRF結合多元統計學對熱敏紙的分類研究[J]. 中國造紙, 2020, 39(12): 93-96.
JIANG H, WANG X, GU A Z. Study on the Classification of Thermosensitive Paper by XRF Combined with Multivariate Statistical Analysis[J]. China Pulp & Paper, 2020, 39(12): 93-96.
[7] 郭鵬, 姜紅. 拉曼光譜檢驗煙用內襯紙的研究[J]. 中華紙業, 2016, 37(12): 53-58.
GUO P, JIANG H. A Study on Analysis of Inner Liner for Cigarette by Raman[J]. China Pulp & Paper Industry, 2016, 37(12): 53-58.
[8] 朱曉晗, 胡越寧, 何歆沂, 等. 基于主成分分析法對一次性紙杯的拉曼光譜檢驗研究[J]. 中國造紙, 2020, 39(9): 38-42.
ZHU X H, HU Y N, HE X Y, et al. Detection of Disposable Paper Cup by Raman Spectroscopy and PCA[J]. China Pulp & Paper, 2020, 39(9): 38-42.
[9] 王欣, 姜紅, 劉峰, 等. 差分拉曼光譜結合系統聚類法區分檢驗熱敏紙[J]. 化學研究與應用, 2020, 32(12): 2153-2157.
WANG X, JIANG H, LIU F, et al. Differential Raman Spectroscopy Combined with System Cluster Analysis for the Detection of Thermosensitive Paper[J]. Chemical Research and Application, 2020, 32(12): 2153-2157.
[10] 付鈞澤, 姜紅, 劉峰, 等. 差分拉曼光譜結合系統聚類檢驗香煙水松紙[J]. 化學研究與應用, 2020, 32(11): 1973-1978.
FU J Z, JIANG H, LIU F, et al. Discrimination of Cigarette Tipping Paper by Differential Raman Spectroscopy Combined with System Clustering[J]. Chemical Research and Application, 2020, 32(11): 1973-1978.
[11] 張進, 姜紅, 劉峰, 等. 差分喇曼光譜結合化學計量學檢驗煙用內襯紙[J]. 激光技術, 2021, 45(1): 61-66.
ZHANG J, JIANG H, LIU F, et al. Differential Raman Spectroscopy Combined with Stoichiometry for Inspection of Cigarette Liner[J]. Laser Technology, 2021, 45(1): 61-66.
[12] LEE J, JIANG H. Analysis of Indole and Indazole Amides Synthetic Cannabinoids by Differential Raman Spectroscopy Based on ANN[J]. Journal of Forensic Sciences, 2022, 67(6): 2242-2252.
[13] AVAKYANTS L P, OBRAZTSOVA E D. Investigation of Mechanical Strains in Porous Silicon by Difference Raman Spectroscopy[J]. Journal of Applied Spectroscopy, 1988, 49(4): 1045-1047.
[14] NIKITIN A P, GAVRILYUK O M, ISMAGILOV Z R. Structure of Industrial Coal Tar Pitch: Raman Spectroscopic Analysis[J]. Coke and Chemistry, 2022, 65(12): 602-606.
[15] 楊夢恩, 姜紅, 陳琿, 等. 差分拉曼光譜和統計學方法在食品包裝紙分類中的應用[J]. 理化檢驗-化學分冊, 2022, 58(11): 1303-1308.
YANG M E, JIANG H, CHEN H, et al. Application of Differential Raman Spectroscopy and Statistical Methods in Food Packaging Paper Classification[J]. Physical Testing and Chemical Analysis (Part B: Chemical Analysis), 2022, 58(11): 1303-1308.
Differential Raman Spectroscopy Combined with Chemometrics for the Detection of White Shopping Paper Bags
XIE Jianing1, HU Xiaoguang1*, JIANG Hong2*, ZHANG Xin3, HUANG Kai3
(1. School of Investigation, People's Public Security University of China, Beijing 100038, China; 2. Criminal Investigation Department, Gansu Police Vocational College, Lanzhou 730046, China; 3. Nanjing Jianzhi Instrument Equipment Co., Ltd., Nanjing 210049, China)
The work aims to establish a method for non-destructive identification of white shopping paper bags by differential Raman spectroscopy. 60 white shopping paper bags of different brands and specifications were collected and detected by Raman spectroscopy. The Raman spectra of the samples were preprocessed, and the samples were preliminarily classified based on the spectra. The samples were grouped by stoichiometric methods. In addition, Fisher discriminant analysis method was applied to verify the classification results. Finally, the RBF model was applied to classify and distinguish unknown samples. Based on the difference in calcium carbonate, talc powder, and barium sulfate contained in the samples, the white shopping paper bag samples could be preliminarily divided into five categories. K-means clustering method was used for further subdivision, and Fisher discriminant method was used to verify the sample classification results, with a discriminant accuracy of 100%. The application of neural network RBF model for discriminative analysis of unknown samples achieved an accuracy of 89.48%. This method is simple and easy to implement, which provides a scientific basis for the classification of white shopping paper bags, and also provides a convenient way for the development of grassroots public security work.
white shopping paper bag; differential Raman spectroscopy; chemometrics; systematic clustering
O657.37
A
1001-3563(2024)01-0215-08
10.19554/j.cnki.1001-3563.2024.01.025
2023-05-08
中國人民公安大學刑事科學技術雙一流創新研究專項(2023SYL06)