石 杰, 李長濱, 吳擁軍, 黃 偉, 嚴會會, 王麗杰
(1.鄭州大學 化學系 河南 鄭州 450001; 2.鄭州大學 公共衛生學院 河南 鄭州450001)
不同廠家冬凌草片的近紅外光譜主成分聚類分析
石 杰1, 李長濱1, 吳擁軍2, 黃 偉1, 嚴會會1, 王麗杰1
(1.鄭州大學 化學系 河南 鄭州 450001; 2.鄭州大學 公共衛生學院 河南 鄭州450001)
利用近紅外光譜對不同廠家的冬凌草片進行鑒別歸屬,并進行快速分類.采集不同廠家不同批次冬凌草片樣品的近紅外漫反射光譜,通過不同計量學方法進行處理.結合主成分聚類分析法對不同廠家冬凌草片進行聚類判別分析,分類識別正確率達100%,從而推斷出不同廠家冬凌草片成分及生產工藝上的差別.結果表明,該方法準確、快速、簡便,可用于不同廠家冬凌草片的分類鑒別和質量控制.
近紅外光譜; 主成分; 聚類分析; 冬凌草片
作為一種新興的檢測手段,近紅外漫反射光譜技術可用于對樣品的直接測定,無需破壞樣品及制樣,操作簡便、快速.近紅外光譜(NIRS)技術是利用全譜或部分波段的光譜數據進行定性或定量分析的無損檢測技術,廣泛應用于煙草[1]、食品[2]、石油化工[3]等領域.近年來,近紅外光譜技術已發展成為中藥定性判別和定量分析的新興方法[4-6].由于不同廠家的生產工藝和原輔料組成均存在差異,反映在近紅外光譜圖上使得對其進行分類鑒別成為可能.
冬凌草為唇形科香茶屬多年生草本或亞灌木,自然分布于太行山南部.其味甘苦,性微寒,具有清熱解毒、消炎止痛、健胃活血之功效,對急慢性咽炎、扁桃體炎、口腔炎有顯著療效[7].冬凌草片由冬凌草浸膏制成,收載于衛生部藥品標準.作者采用近紅外光譜結合主成分聚類分析法,實現了對不同廠家冬凌草片快速、準確的分類鑒別,對于冬凌草生產工藝的改進和假藥的判別有一定的借鑒意義.
1.1儀器與樣品
Antaris 6700型近紅外光譜儀(美國Thermo Nicolet公司),配有銦鎵砷 (InGaSn)檢測器、積分球漫反射采樣系統、樣品旋轉器和石英樣品杯;石英研缽;OMNIC光譜采集軟件和TQ 8.0分析軟件;德國Bruker公司開發的OPUS 5.5分析軟件;藥典篩;BP210S型萬分之一分析天平(德國賽多利斯公司).
河南省濟源市濟世藥業有限公司生產的冬凌草片(糖衣片)22批和冬凌草片(復方含片)22批,河南省安陽市華安藥業有限公司生產的冬凌草片23批,河南省安陽市路德藥業有限公司生產的冬凌草片25批,河南廣宇博科生物制藥有限公司生產的冬凌草片6批,共計98個批次.
1.2實驗方法
分別取不同批次的冬凌草片劑20片,磨碎并過100目藥典篩,混勻后取8 g放入測量杯,扣除背景采集其近紅外光譜.采樣方式為積分球漫反射,光譜范圍為12 000~4 000 cm-1,分辨率為8 cm-1,掃描次數為32次,溫度25~27 ℃,相對濕度45%~50%.每個樣品重復測定3次,求其平均值作為樣品的標準光譜.每次掃描前都要對樣品進行混勻,并用同一重物壓實以保證每次的密實程度一致.預處理方法為一階導數+矢量歸一化,聚類方法為Ward算法.98個批次冬凌草片的近紅外原始光譜疊加圖和一階導數光譜疊加圖見圖1.


圖1 98個批次冬凌草片的近紅外原始光譜(A)及一階導數光譜(B)Fig.1 The original NIR spectrum (A) and first derivative spectrum (B) of donglingcao tablets of 98 batches
2.1建模波段的選擇
建模前對光譜波段進行篩選,既可避免引入過多冗余信息,也可避免由于波段選擇較窄而丟掉一些有用的信息.冬凌草片的光譜曲線在高頻段噪聲較大,通過譜區比較,發現譜圖在7 283~4 008 cm-1范圍內信息量豐富,各種特征信息表現明顯,故取此波段進行數據處理.
2.2光譜預處理方法的選擇
高頻隨機噪聲、基線漂移、樣本不均勻、光散射等因素都會對模型的預測準確性和穩定性產生較大的影響,因此需要對光譜進行預處理以消除這種影響對預測帶來的誤差.由圖1可知,對樣品的原始譜圖進行一階導數處理可以有效地消除樣品由于顏色差別引起的基線漂移,使譜圖特征信息更加明顯地表達出來.通過比較樣品的近紅外原始光譜及一階導數光譜,發現一階導數光譜的鑒別效果優于原始光譜.矢量歸一化用以消除光程變化或樣品顆粒大小、密實程度等變化對光譜產生的影響,選擇樣品的近紅外譜圖9點平滑一階導數+矢量歸一化方法進行優化處理.
3.1主成分分析
為了充分利用光譜信息,必須對光譜數據進行降維處理.主成分分析是常用的有效降維方法,保留多少主成分取決于保留部分的方差和在方差總和中所占的百分比(即累積貢獻率) ,它標志著前幾個主成分概括信息的多寡[8].本實驗對一階導數+矢量歸一化法處理后的光譜數據進行主成分分析,主成分數對光譜的影響見表1,可以看出,不同主成分數對鑒別結果起著關鍵的作用,前5個主成分的累積貢獻率已經達到98.08%,主成分數增加到6,累積貢獻率幾乎不變.綜合考慮選擇前5個主成分來概括表示樣品近紅外光譜的主要信息,此時可以把不同廠家的樣品區分開,分類結果與實際歸屬一致.

表1 主成分數與累積貢獻率和錯判例數的關系
3.2聚類分析
將98份樣品中的76份作為校正集用于建立判別分析模型,其余22份作為驗證集用于檢驗所建模型的性能.校正集樣品的原始光譜經過一階導數+矢量歸一化法處理后,結合判別分析在7 283~4 008 cm-1波段內建立判別分析模型,并對驗證集進行判別預測.結果表明,該模型對校正集樣品的判別和驗證集樣品的預測鑒別都與實際分類完全一致,判別分析結果見圖2.
聚類分析是一種無管理模式識別方法,常用于目標觀測對象的分類,即利用表征觀測對象的一組變量對目標進行分類[9].因此,在主成分分析的基礎上引入聚類分析,可排除眾多化學信息中相互重疊的部分而又不丟失原始數據信息,使聚類分析的計算簡化.本實驗采用Ward算法對冬凌草片進行聚類分析,結果5個廠家的冬凌草片被清晰地聚為5類.由此可見,建立的模型性能較好,能夠準確、快速地判別不同廠家的冬凌草片.由樹狀圖可知,聚類分析能夠通過光譜間距離的大小,準確地把同一廠家的樣品先聚為一類,然后再把與此廠家光譜性質相近的樣品聚類,最后與其他廠家的產品聚類,依次進行聚類直至把所有產品聚類完成.圖3中冬凌草片的聚類分析結果與實際分類結果一致.通過聚類分析,找出不同廠家樣品之間的信息特征,從而達到了鑒別的目的.

圖2 冬凌草片的判別分析圖Fig.2 Discriminate analysis diagram of donglingcao tablets

圖3 冬凌草片的聚類分析圖Fig.3 Clustering analysis diagram of donglingcao tablets
1)中藥的化學成分比較復雜,且由于絕大部分中藥輔料都含有淀粉、糊精、蔗糖等,成分相似,NIRS信息重疊嚴重,各樣品的特征信息很難從峰位、峰形、峰強等方面直觀鑒別,因此,必須借助于化學計量學的方法對譜圖進行優化處理,突出樣品之間化學成分的細小差異,從而達到鑒別的目的.不同廠家的冬凌草片由于其化合物的種類和含量、藥品采集以及制備方法存在差異,結合近紅外光譜技術和計量學處理技術,使得不同廠家的樣品分類判別成為可能.
2)外界環境和外部因素對光譜的重現性影響比較大,因此,測樣時間要盡量集中并保持外部環境一致.作者對藥品顆粒度、裝樣量、密實程度進行了統一處理,以增強不同廠家樣品光譜間的可比性,減少了外部因素引起的實驗誤差.
3)NIRS聚類分析結果與實際分類完全吻合,說明NIRS分析技術具有較好的重現性和可靠性.實驗通過將NIRS與主成分聚類分析法相結合,建立了鑒別不同廠家冬凌草片的新方法.結果表明,該方法準確、快速、無損,可用于不同廠家冬凌草片的判別分析,同時對冬凌草片生產工藝的改進和冬凌草片假藥的初步判別也有一定的借鑒意義.
[1] 張鼎方.近紅外技術應用于成品卷煙的內在質量穩定性控制[J].福建分析測試,2009,18(2):39-44.
[2] 孫通,徐惠榮,應義斌.近紅外光譜分析技術在農產品/食品品質在線無損檢測中的應用研究進展[J].光譜學與光譜分析,2009,29(1):122-126.
[3] 錢平,孫國琴,張存洲.基于近紅外光譜技術的石油組分定量分析新方法[J].光譜學與光譜分析,2008,28(12):2851-2854.
[4] 李艷英,白雁,陳志紅,等.近紅外漫反射光譜法測定不同廠家一清顆粒的含量[J].藥物分析雜志,2009,29(7):1126-1129.
[5] 吳擁軍,李偉,相秉仁,等.近紅外光譜技術用于白芷類中藥的鑒定研究[J].中藥材,2001,24(1):26-28.
[6] 聶黎行,王剛力,李志猛,等.近紅外光譜法在中藥輔料質量控制中的應用[J].中國中藥雜志,2009,34(17):14-17.
[7] 劉俊鵬,于玲,王亞娟.冬凌草片質量標準研究[J].藥物研究,2008,46(13):31-32.
[8] 王麗,何鷹,王顏萍,等.近紅外光譜技術結合主成分聚類分析判別海面溢油種類[J].海洋環境科學,2004,23(2):58-60.
[9] 劉木清,周德成,徐新元,等.聚類算法用于中藥材的近紅外光譜分析[J].光譜學與光譜分析,2007,27(10):1985-1988.
ClusteringAnalysisforPrincipalComponentsofDonglingcaoTabletsfromDifferentManufacturersbyNearInfraredSpectroscopy
SHI Jie1, LI Chang-bin1, WU Yong-jun2, HUANG Wei1, YAN Hui-hui1, WANG Li-jie1
(1.DepartmentofChemistry,ZhengzhouUniversity,Zhengzhou450001,China;2.CollegeofPublicHealth,ZhengzhouUniversity,Zhengzhou450001,China)
Near infrared spectroscopy (NIRS) was used in the identification and rapid classification of donglingcao tablets from different manufacturers. NIRS technology was employed to collect near infrared spectra of donglingcao tablets. Different chemometrics methods and clustering analysis for principal components were used to discriminate donglingcao tablets. The correct classification rate was 100%,and it could be concluded that the composition and production process of donglingcao tablets were different. The results indicated that the method was accurate,rapid,simple,and it could be applied to classification and quality controlling of donglingcao tablets produced by different manufacturers.
near infrared spectroscopy;principal component;clustering analysis;donglingcao tablet
O 657.3
A
1671-6841(2011)04-0067-04
2011-04-29
國家自然科學基金資助項目,編號J0830412;河南省重大公益科研項目,編號081100912500.
石杰(1950- ),男,教授,主要從事食品與藥物分析研究,E-mail:shijie@zzu.edu.cn;通訊作者:李長濱(1983- ),男,碩士研究生,主要從事近紅外技術在藥物分析和新藥開發方面的研究,E-mail:lichangbin911@163.com.