桂林市食品藥品檢驗所,廣西 桂林 541012
多變量數值分析法是把具有時間和空間分布的信息向著符號所作映射的模式識別,其目的和作用在于面對某一具體事物時將其正確地歸入某一類別[1]。常用的多變量數值分析法有主成分分析法、聚類分析法、判別分析法、因子分析法、灰色關聯分析法和人工神經網絡分析法。將常規的檢測方法(如色譜法等)分析得到的數據信息,用模式識別轉化為統一的量化數據,再借助統計軟件的分析和評價,從而達到藥材的真偽鑒別、分類和質量評價的目的。目前其理論和方法已廣泛應用于中藥質量控制方面,為中藥的真偽鑒別和質量評價提供了科學依據。本文就近10年來常用的多變量數值分析法在中藥質量控制方面的研究報道作綜述性研究。
將研究多個指標化為少數互相無關的綜合指標的統計方法叫做主成分分析[2]。主成分分析法利用降維思想,將多指標轉化為具有代表性的少數指標,化繁為簡的同時又能使轉化后的少數指標盡可能地反應原來多個指標所能反應的信息,因而具有顯著的優勢。郝燕等[3]對10批次不同產地的當歸指紋圖譜的37個多維多息特征參數進行主成分分析,結果發現了4個主成分能夠反應中藥色譜指紋圖譜信息的規律,證實主成分分析能達到降維目的,使繁多的求解目標簡化。李曉紅等[4]基于主成分分析的骨碎補藥材乙醇和環己烷提取物的高效液相色譜指紋圖譜,該法全面地反應了骨碎補藥材的化學成分信息,并能從定性和定量兩方面控制骨碎補藥材的內在質量。陳蓉等[5]使用主成分分析結合聚類判別所建立的不同產地芡實HPLC指紋圖譜及定量分析方法均具有快速穩定的特點。用主成分分析結合支持向量機方法對三種冰片的分類鑒別準確率均為100%[6]。姚超等[7]報道16批梔子樣品的指紋圖譜經主成分分析,發現京尼平龍膽雙糖苷、西紅花苷Ⅰ和西紅花苷Ⅱ含量差異較大,為浙江道地梔子的質量控制及品質評價提供了更全面的參考。羅益遠等[8]應用主成分分析法發現何首烏中二苯乙烯苷的量及結合蒽醌的總量在厚片曬干中最高,游離蒽醌的總量在厚片70 ℃烘干中最高,兒茶素的量在薄片40 ℃烘干中較高,而且厚片曬干綜合評價指數明顯高于其他加工樣品,可根據目標成分優選何首烏適宜產地加工方法。據統計[9]92批11種不同來源的陳皮中橙皮苷、川陳皮素和橘皮素含量通過主成分分析,發現紅橘與茶枝柑的3種黃酮類成分含量比值相近,為廣陳皮的道地性鑒別提供了新的研究思路。另外,從礦質元素角度,李金玲等基于主成分分析了30份天麻資源,發現貴州、云南天麻藥材質量較好[10]。
聚類分析又稱群分析,它是研究(樣品或變量)分類問題的一種多元統計方法,所謂類,通俗地說,就是指相似元素的集合[2]。王晶娟等[11]報道用近紅外光譜與聚類分析相結合的方法可以達到90%的識別復方中藥牽正散。利用南北五味子中五味子醇甲、五味子醇乙、五味子酯甲、五味子甲素和五味子乙素含量的顯著性差異,可聚為兩大類,完全區分南北五味子[12]。朱雪梅等[13]用紅外光譜結合聚類分析法對牛蒡子生品和炮制品進行分析,結果識別率和拒絕率達到97%以上,預測正確率可達100%。為了取得更好的預期效果,通常聯合主成分分析、回歸分析、判別分析等方法進行分析。蔡君龍等[14]采用HS-SPME-GC-MS方法并結合主成分分析及聚類分析法,能有效區分4個產地的丁香。鄭孟凱等[15]通過HPLC梯度洗脫建立了28批不同地區市售麻黃藥材的指紋圖譜,然后結合主成分分析和聚類分析,結果,所有批次麻黃藥材共分為3類,可對麻黃藥材的質量進行客觀、有效地評價。楊沮勤等[16]結合主成分分析和聚類分析,發現去氫木香內酯和木香烴內酯在不同煨制方法的川木香中含量差異較大,從而區分川木香生品和煨品。李琦等[17]通過HPLC法測定廣西不同產地的12批余甘子中5種多酚類成分的含量,結合主成分分析和聚類分析,從而發現廣西產余甘子質量的優劣和產地的規律性。
判別分析是判斷樣本歸屬類型的一種統計方法。吳偉建等[18]對33個不同來源的海龍乙醇提取物的紅外指紋圖譜進行了判別分析等模式識別,該法鑒別正品海龍和偽品海龍的正確率達98%以上,可快速、準確地區分不同種類的海龍。王璠等[19]應用聚類分析法、主成分分析法和判別分析法對33批蒼術藥材的氣相色譜-質譜指紋圖譜進行了模式識別,結果能很好地區分道地茅蒼術、非道地茅蒼術和北蒼術。陳粲文等[20]通過主成分分析、聚類分析和判別分析法發現12批安胎丸中阿魏酸、黃芩素等5個成分差異較大。陳文靜等[21]應用主成分分析和聚類分析法對11批毛訶子藥材的HPLC指紋圖譜數據進行了模式識別研究。該法將樣品分為3類,并結合判別分析法發現毛訶子樣品的5個標志性成分。
因子分析法采用與主成分分析相似的降維模式,可將錯綜復雜的變量關系轉化為代表性的少數因子,同時這些代表性的少數因子還可對復雜的變量進行分類。多杰扎西等[22]利用模型的因子得分證實不同產地枸杞子中所含的復雜微量元素與藥效之間存在相關性。在黃連及其炮制品鑒別研究中采用判別因子分析模型進行區分識別,正確判別率為100%[23]。周霞等[24]在黃連及其炮制品的鑒別研究中采用判別因子分析模型進行區分識別,正確率達100%。黃勤挽等[25]運用電子舌技術對10味附子炮制品的判別因子分析模型三維圖譜辨別效率可達99%。
灰色系統理論作為新興的邊緣學科,是對因素、關系、結構和作用原理不明了的系統進行內在關系的梳理,找出系統內的相互關系和規律。李少泓等[26]通過灰色關聯分析法,發現21份不同產地的當歸藥材樣品的質量評價結果與道地藥材的基本內涵相符合。李碩等[27]采用灰色關聯度法,發現不同商品來源的防風質量評價結果與商品等級劃分相符。許俊潔等[28]報道15批次神農香菊的GC-MS指紋圖譜中15個共有色譜峰與抗氧化活性均存在一定的關聯度。王勝男等[29]用灰色關聯度分析了不同加工方法對玄參藥材中多元功效成分含量的影響,結果顯示陰干法和完整藥材蒸后烘干的樣品綜合質量較好。呂偉奇等[30]基于灰色關聯度分析了云南10個不同地區的滇龍膽樣品,結果發現大理鶴慶的質量最優。
人工神經網絡分析法可以模擬大腦的神經網絡,可將大量的基本單元連接成復雜的神經網絡,簡化大量的抽象信息,提取得到樣本特征,最終達到全面反應樣品原始數據大量信息的目的。目前,在中藥材產地鑒別[31]、品種鑒別[32-33]、真偽鑒別[34]等方面取得了很好的效果。
常用的多變量數值分析法在中藥質量控制方面取得了較好的效果。筆者認為今后可在以下三個方面加強和深入研究:第一,中藥種類繁多、成分復雜,同科屬中藥材不同藥用部位所含藥效成分種類、含量也不盡相同。傳統的分析方法往往只是對中藥中某一成分進行定性、定量分析,而結合多變量數值分析的模式識別,更貼合中藥的復雜性,可更全面地分析多組分間的質量差異及相互關系,為今后中藥質量控制評價體系的建立提供新的思路。第二,現有的中藥指紋圖譜研究能借助大型精密儀器的檢測,從而獲得專屬性好的方法,但是普遍存在指紋圖譜與藥效研究相脫節的問題。在建立中藥指紋圖譜時,對獲取的指紋圖譜量化特征和相關藥效學數據,可采用合適的多變量數值分析法(如灰色關聯分析法)來分析各組分間復雜的相互作用,這種關系分析符合中藥總體效應的研究模式,更符合中醫理論體系的研究特點。第三,隨著多變量數值分析法的不斷運用和發展,一些新的研究模式不斷涌現,如借助數理統計的標準差,可客觀確定灰色關聯分析法中的分辨系數,給出了一種確定權重的新方法[35],為多變量數值分析法的完善提供了新的參考和理論基礎。