姜 紅 王 欣 顧安舟
(中國(guó)人民公安大學(xué),北京,100038)
在犯罪現(xiàn)場(chǎng)中,常常能提取到超市的收銀小票、銀行的取款憑證等證物,因此,現(xiàn)場(chǎng)遺留紙張的分析檢驗(yàn)是法庭科學(xué)研究的重要課題之一。刑事技術(shù)人員經(jīng)過(guò)檢驗(yàn)分析現(xiàn)場(chǎng)提取的紙張,如熱敏紙等,可以從中獲取違法犯罪分子的人群特征、行蹤動(dòng)向和經(jīng)濟(jì)狀況等。充分利用這些信息可以刻畫(huà)違法犯罪分子的特征,縮小偵查范圍,為偵查破案和庭審服務(wù)提供便利。熱敏紙是一種加工紙,指涂布了含有成色材料、經(jīng)熱信號(hào)激勵(lì)可自身顯色的信息記錄紙。目前,紙張的檢驗(yàn)方法主要有紅外光譜法、掃描電子顯微鏡/能譜法和拉曼光譜法等[1-3]。本研究利用X射線熒光光譜儀(XRF)對(duì)收集到的31 種熱敏紙樣品進(jìn)行檢驗(yàn),依據(jù)熱敏紙樣本所含元素種類及其含量的差異,對(duì)樣品進(jìn)行區(qū)分;選用SPSS 22.0 統(tǒng)計(jì)分析軟件,結(jié)合主成分分析法和系統(tǒng)聚類分析法,對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行處理和驗(yàn)證,得到了較為滿意的結(jié)果。
X 射線熒光光譜儀(XRF,X-MET7500 型,英國(guó)),Rh靶,電壓45 kV,電流50 μA,測(cè)試時(shí)間110 s。
31 個(gè)不同來(lái)源的熱敏紙樣品,樣品信息如表1所示。

表1 熱敏紙樣品表
分別剪取31 種樣品,按上述實(shí)驗(yàn)條件進(jìn)行XRF檢驗(yàn),獲取光譜數(shù)據(jù);樣品尺寸為10 mm×10 mm,每個(gè)樣品進(jìn)行3次平行實(shí)驗(yàn)。
根據(jù)XRF 檢測(cè)31 種熱敏紙樣品的結(jié)果可知,其中含有的主要元素有Ca、Ti、Fe、Ni、Cu、Zn、Sn、Sb、Pb 等,其中元素Ca、Ti、Fe 的含量最多,其主要原因是紙張常用填料為碳酸鈣,因此所含Ca 元素含量較多[4-5];此外,為增強(qiáng)紙張機(jī)械強(qiáng)度、白度和光澤度,造紙過(guò)程中常使用的復(fù)鹽、漂白劑等會(huì)引入Ti、Fe元素[6-7];另外,在紙張的殺菌抑菌、防腐劑和阻燃劑的添加及印刷過(guò)程中,往往會(huì)引入Ni、Zn 和Pb 等元素[8]。不同品牌、系列及批次的熱敏紙樣品由于原料和加工工藝不同,所含元素種類和含量會(huì)有所區(qū)別,因此,可以將各樣本中所含元素種類和含量作為鑒定樣品的依據(jù)。
通過(guò)比較分析熱敏紙樣品中所含元素種類、含量以及元素含量比可以對(duì)樣本進(jìn)行初步分類,但僅憑以上方法無(wú)法對(duì)樣本進(jìn)行較為精確的分類;同時(shí),當(dāng)樣本數(shù)量較大時(shí),人工進(jìn)行比較和分類耗時(shí)耗力,因此,尋求一種更為精確、便捷的分類方法是十分必要的。主成分分析法是一種常用的分析方法,旨在利用降維的思想,把多指標(biāo)轉(zhuǎn)化為少數(shù)幾個(gè)綜合指標(biāo)[9-10]。表2所示為利用主成分分析法得到的31種熱敏紙的特征方差貢獻(xiàn)率。

表2 主成分分析特征方差貢獻(xiàn)率
主成分分析法中,通常選擇特征根大于1 且累積方差貢獻(xiàn)率大于85%的主成分作為代表性特征。由表1 可知,本實(shí)驗(yàn)僅提取了1 個(gè)主成分。但是由于成分之間的相關(guān)性較大,1 個(gè)主成分無(wú)法準(zhǔn)確映射出各樣品在三維矢量空間的具體分布情況,分類結(jié)果并不理想。因此,需要借助其他分析方法進(jìn)行進(jìn)一步探究。
近年來(lái),聚類分析法被廣泛應(yīng)用于理化檢驗(yàn)領(lǐng)域。系統(tǒng)聚類又稱為凝聚性層次聚類,主要是根據(jù)數(shù)據(jù)之間的距離,合并相近程度最高的兩簇成一個(gè)新簇,不斷重復(fù)此過(guò)程,直到所有個(gè)體都?xì)w為一個(gè)簇[11-12]。判別分析法是用一種根據(jù)已有的數(shù)據(jù)集去分析新的數(shù)據(jù)類別的方法,可以通過(guò)此方法建立預(yù)測(cè)模型[13-15]。本研究嘗試將兩種分析方法相結(jié)合,以期實(shí)現(xiàn)對(duì)熱敏紙的準(zhǔn)確檢驗(yàn)。
本研究采用組間平均連接法度量類間距離,選擇平方歐氏距離度量區(qū)間表征樣品之間的差異,再進(jìn)行系統(tǒng)聚類,譜系圖如圖1所示。當(dāng)并類距離最小(為0)時(shí),樣本可分為6類;當(dāng)并類距離為2時(shí),樣品可分為4類;當(dāng)閾值達(dá)到25時(shí),停止凝聚,所有樣品并為一類。隨機(jī)選擇1#、12#、31#樣品的3 次重復(fù)實(shí)驗(yàn)結(jié)果進(jìn)行分析,在排除實(shí)驗(yàn)誤差的情況下,以同一樣本重復(fù)實(shí)驗(yàn)結(jié)果為一類來(lái)確定并類距離。根據(jù)譜系圖分析可知,當(dāng)并類距離最小(為0)時(shí),將樣品分為6類是最科學(xué)合理的。

圖1 31種熱敏紙聚類分析結(jié)果
選用SPSS22.0統(tǒng)計(jì)分析軟件中的判別分析模塊,采用 Fisher’s 函數(shù)系數(shù),選擇 Box’s M 描述統(tǒng)計(jì)量,將檢測(cè)數(shù)據(jù)作為自變量,用F檢驗(yàn)的概率決定變量是否加入函數(shù)或被剔除,得到了判別函數(shù)特征值(見(jiàn)表3)和6 類樣品在所建立的兩個(gè)判別函數(shù)上的聯(lián)合分布圖(見(jiàn)圖2)。

表3 判別式函數(shù)摘要

圖2 31種熱敏紙的聯(lián)合分布圖
本研究在分類過(guò)程中建立了4 個(gè)判別函數(shù),其特征值如表3 所示。其中,判別函數(shù)1 和判別函數(shù)2 特征值的方差貢獻(xiàn)率分別為93.7%和5.1%,累積方差貢獻(xiàn)率分別為93.7%和98.7%,所攜帶的信息量遠(yuǎn)大于后面的判別函數(shù)。判別函數(shù)1 和判別函數(shù)2 的規(guī)范相關(guān)性系數(shù)分別為0.996和0.935,表明被分類的組別在判別函數(shù)1 和判別函數(shù)2 上差異顯著。因此,選擇判別函數(shù)1和判別函數(shù)2作為判別軸建立聯(lián)合分布圖。
由圖2 可以看出,6 類樣品重心區(qū)別明顯,與判別函數(shù)2 的判別軸相比,判別函數(shù)1 的判別軸區(qū)分情況更加顯著。通過(guò)判別分析建立預(yù)測(cè)模型,可以預(yù)測(cè)新紀(jì)錄,即可以區(qū)分新數(shù)據(jù)的所屬類別。用樣品初始數(shù)據(jù)進(jìn)行檢驗(yàn),正確率可達(dá)95.7%。
本研究基于X射線熒光光譜分析法,將無(wú)監(jiān)督的系統(tǒng)聚類法與有監(jiān)督的判別分析法相結(jié)合,對(duì)31 種熱敏紙樣品進(jìn)行了多角度的分析,當(dāng)并類距離最小(為0)時(shí),可將樣品分為6類;驗(yàn)證的同時(shí)進(jìn)行了判別分析,總體預(yù)測(cè)正確率為95.7%。該方法快速、準(zhǔn)確且無(wú)損,適用于法庭科學(xué)領(lǐng)域。但該方法在定量分析上仍有不足,后期將引入新的數(shù)據(jù)處理方法或驗(yàn)證算法,以提高模式識(shí)別的廣度與深度。