張清華,楊 旭,羅儀文,孫其然,王雅晨,施少培,徐 徹
(司法部司法鑒定科學技術研究所,上海200063)
打印文件的偽造與篡改在各類案件中時有發生,其來源與真偽的鑒別已成為法庭科學領域的重要研究內容。墨粉作為激光打印文件的重要組成部分,其化學組成主要為樹脂、染料、電荷調節劑、輔助添加劑、磁粉/載體等[1]。不同廠家、不同型號的打印機所使用的墨粉化學成分及相對含量存在一定差異,通過分析墨粉的化學組成從而判斷打印文件的來源具有良好的有效性[2]。
紅外光譜法分析墨粉,最初采用的是溴化鉀壓片傅里葉變換紅外分析技術[3],隨著顯微紅外技術的發展顯微紅外光譜法成為常用分析方法[4]。由于墨粉是一種由樹脂、染料等多種物質組成的混合物,采用紅外光譜分析獲得是多組分混合光譜信息,在傳統比對檢驗中難以確定不同墨粉差異的規律性特征。化學計量學[5-6]是一種集化學、統計學、線性代數及計算機技術為一體的化學信息處理方法,廣泛應用于化學信息的整合、提取與再分析,從而揭示樣本間的相關關系與本質差異,國內采用紅外光譜技術結合化學計量學方法來研究墨粉及打印機種類的研究還未見報道。
本文采用顯微紅外光譜技術結合化學計量學方法對不同品牌、不同型號的激光打印原裝黑色墨粉進行比較分析,根據特征信息的提取探討不同墨粉間的本質差異,同時針對黑白與彩色激光打印原裝黑色墨粉的光譜特征進行總結,為墨粉的進一步區分與鑒別提供依據。
Nicolet Continum iN10顯微紅外光譜儀(美國Thermal-Fisher公司),配有150X紅外顯微鏡,MCT/A檢測器;EZ4D顯微鏡(德國Leica公司)。
收集市售10個品牌不同型號激光打印機共31臺,其中16臺為黑白激光打印機,15臺為彩色激光打印機,打印機信息見表1。

表1 不同品牌、不同型號激光打印機信息列表
采用1.1表1中的激光打印機分別打印制備31份樣品材料,其中彩色激光打印機選用灰度打印模式。將兩片2 mm厚石英玻璃置于待測樣本兩側,采用預熱到200℃的電熨斗加熱2 min,使墨粉轉移到石英玻璃后利用手術刀片刮取適量墨粉進行金剛石壓片顯微紅外光譜分析。
顯微紅外光譜儀器,常溫透射模式,掃描范圍為4000~400 cm-1,分辨率16 cm-1,累計掃描次數64次。
1.4.1 主成分分析
主成分分析(Principal Component Analysis,PCA)[5,7]是一種常用的多元統計分析方法,通常用于數據信息的提取或者變量維數的壓縮。其基本原理是將一組相關變量通過線性變換后得到一組維數不變而相互正交的變量,即為主成分。主成分根據信息量的多少依次排序,前幾個主成分包含了絕大部分的信息,選擇前幾個主成分進行數據再分析不會導致主要信息的丟失。主成分分析過程的實現,常選用奇異值分解(Singular Value Decomposition,SVD)[8],它主要基于如下線性代數原理:對任意的n×m階量測數據矩陣X(其中n為樣本數,m為變量數,且n>m)分解為三個矩陣的乘積:

其中S收集了所有特征值,U和Vt分別為每個特征值對應的特征變量所組成的標準列正交與標準行正交矩陣,記 T=US,P=V,有

在多元統計分析方法中,T和P通常稱為得分矩陣與載荷矩陣。當X為訓練集數據Xtrain時,T與P分別記為Ttrain、Ptrain。Ttrain前幾列收集了訓練集數據的大部分信息,選擇前兩列或者三列數據做得分投影圖,構建標準投影空間可以直觀的實現訓練集樣本 “物以類聚”的效果;而載荷矩陣Ptrain前幾列值反映了原有變量在分類過程中的相關關系,其絕對值的大小反映了原有變量對于聚類貢獻率的大小。當X為測試集數據Xtest時,根據線性代數運算法則有

其中Ttest表示測試集數據的得分矩陣,選擇相應的得分值投影到標準投影空間從而實現測試集數據的投影預報。
1.4.2 系統聚類法
系統聚類法(Hierarchical cluster analysis,HCA)[9]是一種經典的多元統計分析方法。其基本思路是:首先將所有n個樣本各自看做一個類,即共有n類;其次計算n類樣本之間的距離,把距離最小的兩類合并為一類,并計算出新類的坐標值,再用相同的方法合并距離相近的類,重復此過程,直到所有分類歸為一類為止。系統聚類通常采用圖形的形式來表達聚類過程,稱為聚類圖。實現系統聚類最關鍵的是計算樣本間與類間距離,樣本間的距離計算方法有:歐式距離、馬氏距離、曼哈坦距離,藪爾格距離,本文選用的是最常用的歐式距離法,其公式如下:

式中A,B分別代表兩個樣本,DAB為兩樣本間的距離,m為變量數。類間距計算有:平均距離法、重心距離法、最短距離法以及最小距離法,本文選擇的是最短距離法,其定義Gi與Gj兩類樣本間的距離為:

式中dab為樣本xa與xb之間的距離。
根據激光打印機原裝黑色墨粉紅外光譜的主要差異,31個樣品可分為兩類(見表2):第I類為 S7、S8、S29 3臺黑白激光打印機與S19、S20 2臺彩色激光打印機,其墨粉的紅外光譜整體相似,均反映了1 608 cm-1,1 583 cm-1,1 510 cm-1處苯環對位取代后的骨架振動,831 cm-1處對位取代苯環上相鄰兩個氫原子的C-H面外彎曲振動,1 721 cm-1處羰基伸縮振動,731 cm-1,1 272 cm-1處對苯二甲酸的特征吸收,1 249 cm-1處芳香-脂肪醚Ar-O-C的反對稱伸縮振動以及1 115 cm-1處C-O對稱伸縮振動(見圖1)。第II類包括13臺黑白激光打印機與13臺彩色激光打印機,其墨粉的紅外光譜與第I類墨粉的紅外光譜不同,主要表現為755 cm-1,699 cm-1處的苯環單取代吸收;1 602 cm-1,1 160 cm-1,1 494 cm-1,1 451 cm-1處的苯環骨架振動吸收譜帶以及1725cm-1處的羰基伸縮振動吸收(見圖2)。
根據以上實驗結果,所有墨粉樣品的紅外光譜主要反映了樹脂的紅外特征吸收,這是由墨粉本身的性質所決定的:樹脂作為墨粉的重要組成部分,是一類有較強的紅外特征吸收的有機物,并且在墨粉組成中占有較高比例(約為60%~80%)。另外,兩類墨粉樣品紅外光譜間的差異主要源于不同的樹脂,第I類墨粉使用的樹脂是聚對苯二甲酸/環氧樹脂,而第II類墨粉為聚苯乙烯/甲基丙烯酸甲酯樹脂。兩類樹脂均是生產黑白與彩色激光打印墨粉的常用原料,因此難以通過墨粉樹脂的種類實現黑白與彩色激光打印機的區分。

表2 基于樹脂種類的原裝墨粉分類表

圖1 聚對苯二甲酸/環氧樹脂類墨粉紅外光譜圖

圖2 聚苯乙烯/甲基丙烯酸甲酯類墨粉紅外光譜圖
根據不同的顯影方式,墨粉具有雙組份和單組份之分,雙組份墨粉除含有顯影碳粉外還需要載體(通常為鐵屑)作為起電劑,而單組份墨粉又分為單組份磁性墨粉與非磁性墨粉,單組分磁性墨粉中含有黑色的鐵氧化物,在墨粉的生產使用過程中具有染色與運載墨粉的功能[1,10]。
實驗表明,樣本 S1~S6、S21、S24~S26、S28、S30 與S31共13臺黑白激光打印機墨粉的紅外光譜在568cm-1處有一中等強度的鐵氧化物寬峰,表明此類墨粉為單組份磁性墨粉;其余3臺黑白激光打印機和15臺彩色激光打印機墨粉的紅外光譜中未出現鐵氧化物的特征吸收峰,表明相應墨粉為雙組份或者單組份非磁性墨粉。
對于黑白激光打印機,S7,S8和S29(見圖 1)與其余13臺黑白激光打印機(見圖2-a)墨粉紅外光譜存在明顯差異,前者基線斜率較低(起點透射率通常高于30%),主要表現為聚對苯二甲酸/環氧樹脂特征吸收,同時在568 cm-1處未發現鐵氧化物的紅外吸收峰;后者基線斜率偏高(起點透射率通常低于30%),主要表現為聚苯乙烯/甲基丙烯酸甲酯特征吸收,同時在568 cm-1處檢出有鐵氧化物的特征吸收。對于彩色激光打印機,S19、S20號打印機墨粉主要為聚對苯二甲酸/環氧樹脂類墨粉,其余13臺打印機墨粉主要為聚苯乙烯/甲基丙烯酸甲酯類墨粉,就整體而言彩色激光打印墨粉的紅外光譜基線斜率偏低,同時不含有鐵氧化物特征吸收。因此,在檢案過程中可以依據墨粉紅外光譜基線斜率的大小、樹脂成分以及是否檢出鐵氧化物特征吸收峰綜合判斷激光打印機的類型:若墨粉紅外光譜基線的斜率偏高,且檢出有鐵氧化物吸收峰,則該樣品為黑白激光打印形成;若墨粉紅外光譜基線斜率較低,樹脂為聚苯乙烯/甲基丙烯酸甲酯,并且未檢出鐵氧化物特征吸收,則該樣品為彩色激光打印形成;若墨粉紅外光譜基線斜率較低,樹脂為聚對苯二甲酸/環氧樹脂,并且未檢出鐵氧化物特征吸收,則無法判斷該樣品為黑白還是彩色激光打印形成,比如S7、S8、S29三臺黑白激光打印機與S19、S20兩臺彩色激光打印機的墨粉紅外光譜較為相似,難以通過紅外光譜的直接比較分析實現其區分與識別,如圖1所示。
2.4.1 基線校正
理想情況下,待測樣品沒有吸收的光譜區域被視為整張光譜的基線,基線的透過率應該是100%,即吸光度為0。但是在實際檢測中由于受樣品粒徑、壓片厚度、雜質等光散射光吸收的影響,使光譜基線出現傾斜現象。為了比較分析墨粉的本質差異,本文采用多項式曲線擬合法[11]對樣本的紅外光譜進行基線校正(見圖3),校正后譜峰位置沒有發生變化,而傾斜程度獲得明顯改善,有利于后續數據分析與信息提取。

圖3 基線校正前后的墨粉紅外光譜圖
2.4.2 不同型號打印機原裝墨粉的PCA投影分析
在31個樣本中隨機選擇25個樣本作為訓練集數據,其余6個樣本作為測試集數據。采用自編軟件中的PCA方法對基線校正、標準正態變量變換(Standard Normal Variate Transform,SNV)后的訓練集數據進行主成分分析,提取前兩個主成分構建標準投影空間(圖4A),不同樹脂成分的墨粉樣本聚類效果明顯,但是黑白與彩色激光打印墨粉未能獲得良好區分;當選擇前三個主成分構建標準投影空間時,發現不同樹脂成分墨粉獲得良好區分的同時,同種樹脂成分的黑白與彩色激光打印墨粉也獲得了良好區分,包括直接比較分析不能區分的S7、S8、S29黑白激光打印墨粉與S19、S20彩色激光打印墨粉(見圖4B)。

圖4 不同激光打印墨粉的得分投影圖
選擇載荷矩陣前三個主成分數據分別對波數做圖(見圖5A,B,C)。第一主成分提取信息主要源于聚苯乙烯/甲基丙烯酸甲酯的光譜信息;第二主成分信息主要表現為聚對苯二甲酸/環氧樹脂的特征吸收;第三主成分主要為568cm-1處鐵氧化物的光譜信息,它是區分黑白與彩色激光打印墨粉的關鍵組分。前三個主成分總共解釋了63.3%的方差,剩余信息基本為噪聲信息(見圖5D)。

圖5 不同激光打印墨粉的載荷曲線圖
6個測試集樣本經基線校正與SNV數據變換后投影到三維標準投影空間(見圖6),投影預報結果準確,表明采用主成分投影預報方法能夠快速直觀區分黑白與彩色激光打印墨粉。

圖6 測試集墨粉樣本的投影預報
2.4.3 不同型號打印機原裝墨粉的HCA分析
主成分分析能夠直觀的反映墨粉樣本的整體分類關系,為了更進一步研究各樣本間的距離關系,以主成分分析得分值為基礎采用系統聚類法構建不同種類墨粉樣本間的聚類圖(見圖7)。所有現有樣本形成了三個大類:聚苯乙烯/甲基丙烯酸甲酯樹脂類黑白激光打印墨粉樣本為一類;聚苯乙烯/甲基丙烯酸甲酯樹脂類彩色激光打印墨粉為另一類;聚對苯二甲酸/環氧樹脂類黑白與彩色激光打印墨粉,由于紅外光譜較為相似,整體歸為一類,就局部而言兩者距離各自相近,形成 S19、S20(彩色激光打印)與 S7、S8、S29(黑白激光打印)兩個子類,與主成分聚類效果分布一致。

圖7 不同激光打印機墨粉的系統聚類圖
本文采用紅外光譜法研究了31臺不同品牌、不同型號激光打印機原裝黑色墨粉間的光譜差異。根據墨粉紅外光譜圖的比較分析,實現了聚對苯二甲酸/環氧樹脂類墨粉與聚苯乙烯/甲基丙烯酸甲酯樹脂類墨粉的區分與識別;采用主成分分析結合系統聚類法完成了同種樹脂不同激光打印類型墨粉的聚類分析與建模預報,方法可行、結果準確可靠。
參考文獻:
[1]張志才,靜電復印技術與設備[M].北京:中國計量出版社,1999:26.
[2]Cantu,A.A.,Analytical Methods For Detecting Fraudulent Documents.Analytical Chemistry,1991,63(17):847A-854A.
[3]Egan,W.J.,et al.,Forensic discrimination of photocopy and printer toners II.Discriminant analysis applied to infrared reflection-absorption spectroscopy[J].Analytical&Bioanalytical Chemistry,2003,376(8):1279-1285.
[4]Almeida Assis,A.C.,et al.,Diamond cell Fourier transform infrared spectroscopy transmittance analysis of black toners on questioned documents[J].Forensic Science International,2012,214(1-3):59-66.
[5]梁逸曾.復雜體系儀器分析-白、灰、黑分析體系及其多變量解析方法[M].北京:化學工業出版社,2012:
[6]許祿,邵學廣.化學計量學方法[M].第2版.北京:科學出版社,2004.
[7]Billard,L.E.Diday.Principal Component Analysis,in Symbolic Data Analysis[J].John Wiley&Sons,Ltd.2007:145-187.
[8]Jackson,J.E.Singular Value Decomposition:Multidimensional Scaling I,in A User's Guide to Principal Components.John Wiley&Sons,Inc,2004:189-232.
[9]Murtagh,F.,P.Contreras.Algorithms for hierarchical clustering:an overview[J].Wiley Interdisciplinary Reviews:Data Mining and Knowledge Discovery,2012,2(1):86-97.
[10]王英強,馮計民,汪聰慧.傅立葉變換紅外光譜法檢驗靜電復印墨粉[J].刑事技術,2004,(4):3-7.
[11]馮昕韡,朱仲良,沈夢潔,等.基于多項式擬合的拉曼光譜基線漂移校正方法[J].計算機與應用化學,2009,(6):759-762.