李 磊
(河北科技工程職業(yè)技術(shù)大學(xué),河北 邢臺 054035)
我國中藥材種植面積廣泛,種類眾多,中藥材富含復(fù)雜的化學(xué)成分決定了其特殊的藥性和醫(yī)療作用,因此中藥材類別配比需要執(zhí)行嚴(yán)苛的質(zhì)量標(biāo)準(zhǔn),以防出現(xiàn)中藥相克、藥性下降等質(zhì)量問題。受限于我國目前制藥工業(yè)水平的發(fā)展,在一些地區(qū)中藥材的類別檢測往往依靠人工肉眼檢測,存在檢測效率低、勞動強(qiáng)度大、誤檢率高等問題,與日本、韓國等先進(jìn)的自動化檢測工藝相比差距非常明顯。由于不同種類中藥材其內(nèi)部結(jié)構(gòu)中的無機(jī)元素的化學(xué)成分存在差異,可在近紅外或中紅外光譜的照射作用下,呈現(xiàn)出不同的光譜特征,因此建立基于機(jī)器視覺的中藥材類別紅外光譜檢測模型,根據(jù)光譜特征差異鑒別不同種類的中藥材,該方法對于提高制藥業(yè)工業(yè)自動化水平具有重要意義。
選用高穩(wěn)定輸出的紅外燈珠作為機(jī)器視覺系統(tǒng)的光源,可產(chǎn)生近紅外和中紅外,搭配紅外相機(jī)來捕獲不同種類中草藥光譜特征,光譜特征圖像經(jīng)圖像采集卡轉(zhuǎn)換為數(shù)字信號輸入計算機(jī)進(jìn)行圖像處理。
機(jī)器視覺中相機(jī)在采集藥材紅外光譜特征時,會引入背景基線、噪聲等干擾信號,導(dǎo)致基線偏離、信噪比下降。因此需要對數(shù)據(jù)進(jìn)行去噪處理,將背景基線從高維的、非零變量的復(fù)雜數(shù)據(jù)中濾除,提取有用信號,提高數(shù)據(jù)的潛在價值[1]。本文使用一種逐步逼近的自適應(yīng)迭代加權(quán)懲罰最小二乘法(airPLS)[2],引入調(diào)節(jié)曲線平滑度和保真度的參數(shù),從而得到減去背景的光譜。
(1) 懲罰最小二乘法
假設(shè)x 為樣本向量,z 為基線向量,其長度為m,z 對x 的保真度可用兩者之間的總體方差和表示:
向量z 的粗糙度可用其相鄰兩項差的平方和表示:
保真度和平滑度的平衡可用保真度加上粗糙度的懲罰表示:
其中可以調(diào)整參數(shù)λ實現(xiàn)保真度和平滑度的平衡,λ越大,基線向量越平滑。
上式對z 求偏導(dǎo)數(shù)并令其等于零,得到一個簡單的線性系統(tǒng)方程:
其中I 是單位矩陣。引入保真度的權(quán)重向量w,并將其在有峰段處置于零,則z 對x 的保真度修正為:
從而線性系統(tǒng)方程變?yōu)?w+λD′ D) z=wx。根據(jù)該方程得到基線向量:z=(w+λD ′ D)-1wx。
(2)自適應(yīng)迭代加權(quán)
設(shè)計自適應(yīng)權(quán)重,并添加控制擬合背景的平滑度的懲罰項,即
中藥材紅外光譜原始圖像如圖1 所示,經(jīng)過airPLS 算法處理后的圖像如圖2 所示。對比可見處理后的光譜數(shù)據(jù),有效地消除了干擾,光譜曲線的細(xì)節(jié)特征更加突出。

圖1 中藥材紅外光譜原始圖像

圖2 airPLS 算法處理后的圖像
系統(tǒng)聚類分析模型是一種對樣本進(jìn)行分類的方法,屬于Q 型聚類。其核心算法為層次系統(tǒng)歸類和k-means 均值法。
層次系統(tǒng)歸類與計算類與類之間的距離有關(guān),具體步驟如下:
(1)計算n 個樣本點兩兩之間的距離,記為矩陣。本文用兩個變量的Pearson 相關(guān)系數(shù)表現(xiàn)距離,其中:
(2)構(gòu)造n 個類,每類中只包含一個樣本點,且平臺高度均為0;
(3)合并距離最近的兩類為新類,將兩類間距作為聚類圖中的平臺高度;
(4)計算新類與當(dāng)前各類的距離,當(dāng)類個數(shù)值為1,執(zhí)行下一步,否則返回上一步;
(5)畫聚類圖;
(6)決定類的個數(shù)和類。
基于k-means 均值聚類的算法步驟為[3]:
(1)隨機(jī)選擇k 個樣本作為聚類初始中心;
(2)計算樣本Xi 到k 個聚類中心的距離并將其分到距離最小的聚類中心所對應(yīng)的類;
(3)針對每個類別aj,重新計算它的聚類中心;
(4)重復(fù)(2)(3)操作,直到達(dá)到某個中止條件。
利用MATLAB 中的linkage 函數(shù)和cluster 函數(shù)建立中藥材紅外光譜數(shù)學(xué)模型。根據(jù)藥材樣本的中紅外光譜數(shù)據(jù)層次聚類樹狀圖,將樣本分為3 類,得到層次聚類樹狀圖如圖3 所示,每類中藥材的光譜曲線圖如圖4、5、6 所示。

圖3 層次聚類樹狀圖

圖4 第一類中紅外光譜曲線圖

圖5 第二類中紅外光譜曲線圖

圖6 第三類中紅外光譜曲線圖
針對生產(chǎn)線上中藥材人工類別檢測效率低、勞動強(qiáng)度大、誤檢率高等問題,建立基于機(jī)器視覺的中藥材類別紅外光譜檢測模型。首先通過機(jī)器視覺獲取紅外光譜特征,然后使用自適應(yīng)迭代加權(quán)懲罰最小二乘法去除干擾噪聲,最后利用層次系統(tǒng)歸類和k-means 均值法實現(xiàn)對不同種類的藥材進(jìn)行檢測分類。對于提高制藥精度和自動化程度,具有重要工程實用價值。