劉春龍 陳 龍 孫慧穎 胡 濱 韓玉霞 陳寶榮△
臨床生化檢驗反應面法中的統(tǒng)計學介紹*
劉春龍1陳 龍2孫慧穎1胡 濱1韓玉霞1陳寶榮1△
臨床生化檢驗各項目的測量結果受到很多因素的影響,尤其在酶學測量領域,如波長、溫度、濕度、pH、孵育時間、延遲時間、測量時間等都會對最終檢驗結果有不同程度的影響。這些影響因素的一個或多個發(fā)生變化時,都會影響到最終檢驗結果的準確性,因此,在方法學性能研究時,一般需進行實驗條件的摸索,研究各種因素對檢驗結果的影響,并使各影響因素處于最佳狀態(tài)是方法學研究的主要目的。檢驗界常常習慣于采用固定其他條件,變化一種影響因素來判斷變化因素的最佳測量條件,即單因素分析法。然而單因素分析法的前提條件是各影響因素之間不存在交互作用。然而,幾乎每一個測定程序都存在各因素間的交互作用。臨床生化檢驗反應面法(RSM)能夠很好地反應各影響因素的交互影響,是一種經典的多因素分析方法,可作為傳統(tǒng)的單因素分析法的補充。在IFCC公布的參考測量程序中,幾乎每個測量程序均有RSM分析的結果和等高線圖,RSM的重要意義可見一斑。本文從RSM及相關術語的介紹、RSM的建模原理、RSM模型的擬合及預測性能評價、RSM模型的優(yōu)化四個方面進行闡述并對RSM中的統(tǒng)計學進行介紹。
RSM是通過實驗數(shù)據的識別分析,建立合適的反應面模型的多因素分析方法,其需要統(tǒng)計學實驗設計的基礎、回歸模型的技術和因素優(yōu)化的方法[1]。RSM由數(shù)學和統(tǒng)計學技術結合實驗數(shù)據,通過建立一階或者多階函數(shù),直至反應條件得到優(yōu)化[2]。RSM常與響應、影響因子、因子水平、最速上升路徑法等緊密相關。在臨床生化檢驗中,響應是指檢驗結果,檢驗結果是對各個測量條件的響應;影響因子即影響因素,是對檢驗結果的最終判定產生作用的測量條件,如某個測量程序中的波長、溫度、pH、緩沖體系等;因子水平是指影響因子的取值,取值一般應成一定的比例。影響因子的數(shù)量和因子水平數(shù)直接關系到RSM設計方式的選擇,進而影響最終建立模型的預測性能。最速上升路徑法又稱爬坡實驗,由于反應曲面擬合方程只有在考察的臨近區(qū)域里才能充分近似真實情況,所以應先找到其最佳區(qū)域,即通過各影響因子不同水平的取值,在最短的路徑下到達響應值附近。
假設某臨床生化檢驗項目的測量結果為y,對y起決定作用的重要影響因子有n個,分別為x1、x2、x3、…、xn。影響因子的確定可以根據經驗,若不能確定各因子的影響大小,可采用單因素分析法進行實驗后判定其是否為該項目的重要影響因子[3]。確定了影響因子后,即可進行實驗設計。假設進行了m次實驗。實驗數(shù)據表示為:
第1次試驗:y1?x11,x21,…,xn1
第i次試驗:yi?x1i,x2i,…,xni
第m次試驗:ym?x1m,x2m,…,xmm
根據實驗結果,建立RSM模型,即建立測量結果與影響因子之間的關系。任何函數(shù)都能用多項式擬合來近似,并且只要多項式的次數(shù)適當,近似的準確度就能達到最佳,因此測量結果與影響因子之間的關系必然可以采用多項式來進行模擬。
欲找出反應和獨立變量之間適當?shù)慕坪瘮?shù),通常利用獨立變量在一些范圍里的低階多項式近似,即為一階模型(first-order model),如果系統(tǒng)中有曲率,則必須利用較高階的多項式,如二階模型(second-order model)。當二階模型仍不具有較好的擬合度時,可采用三階以上模型進行擬合。在臨床生化檢驗中,一般采用二階模型即可。其函數(shù)式分別表示為:
得到回歸方程后,通過對x1、x2、x3、…、xn的合理取值求得y最佳值,即達到RSM分析的目的。建立了各種影響測量的因素(x1、x2、x3、…、xn)如pH、溫度、波長等與測量結果的函數(shù)關系。RSM不僅考慮了各影響因子對曲線線性的影響,也考慮了不同影響因子間的交互作用和曲率影響。這種多項式擬合法有一個缺陷,即當因素較多時,如果所選多項式次數(shù)較高,會導致計算量很大、需要的實驗數(shù)據很多。常用的RSM設計方式有3k因子設計,Box-Behnken實驗或中央合成設計實驗(central composite design,CCD)[4]。
對于RSM模型的性能評價,一般可以分為兩方面,一方面是模型中參與擬合的所有實驗點的擬合度;另一方面為對未進行實驗的實驗結果的預測準確度。
關于RSM模型的擬合度一般通過決定系數(shù)R2來進行判斷,R2越靠近1則表示擬合效果越好。目前在建立模型時,一般采用SAS、Minitab等軟件,檢驗水準α一般設置為0.01或0.05等,擬合時應注意觀察分析結果中的失擬項的P值,失擬項的P值應大于等于0.05,否則應增加實驗,進行二次因子設計。建立RSM模型的目的是為了預測其他實驗條件組合下的測量結果,為評價模型的準確度,必須通過驗證實驗進行判斷,即按一定規(guī)律選取若干條件,使用RSM模型進行理論值預測,同時進行實際值的測量(至少包含高、中、低三水平),再將兩者進行比較。一般認為,若相關系數(shù)R2和失擬項的P值滿足條件,且驗證實驗符合實驗室要求,則認為成功建立了該項目的RSM模型。特別說明的是,符合上述標準,仍然是比較粗的預測,若要進一步細化,還需要進行假設檢驗。但由于生化反應本身的復雜性,如基質效應的存在等,在生化檢驗項目的條件摸索中,筆者認為通過比較模型的決定系數(shù)R2,失擬項的P值及驗證實驗是否成功即可判斷模型的優(yōu)劣。
在臨床生化檢驗方法學開發(fā)研究中,RSM模型成功建立后,最重要的是依據該模型對實驗條件進行優(yōu)化,以達到最佳的響應。假設檢驗結果y越小越好,選擇一個中心點,并在其附近取多個實驗點進行實驗,得到相應的測量結果,建立回歸方程,通過求導的方式得到一個向量(方向),實驗點沿該方向變化時(沿該方向再取很多實驗點),響應值變小的最快;當響應值開始變大時,取前一個實驗點為第二個設計點,再重復上面過程,最終得到使y最小的實驗點(因素的水平組合)。這是二次因子設計的基礎,重復該過程,直到優(yōu)化后的條件滿足實驗室的預期測量要求。在SAS、Minitab等軟件中均有設計好的優(yōu)化器,通過在優(yōu)化器中設置相應的參數(shù),即可得到優(yōu)化后的預測結果,但值得注意的是,此時確定影響結果的條件后,應再次進行驗證實驗,以確定預測誤差在實驗室可接受范圍內。
RSM作為經典的多因素分析法,已在國外臨床生化檢驗領域發(fā)揮舉足輕重的作用,但在我國檢驗領域,其應用仍不多見。在新方法、新技術的研發(fā)中,RSM可以節(jié)約大量的人力、物力、財力。本文對RSM進行了全面的介紹,尤其對RSM中的統(tǒng)計學進行了介紹,旨在幫助讀者合理采用RSM進行方法學性能研究,特別是實驗條件的摸索,建立適合自己實驗室各檢驗項目測量程序的RSM模型。
[1]Raymond H,Douglas C,Christine M,et al.Response surface Methods OLOGY.America:A John Wiley & Sons inc,2009:1-6.
[2]Bezerra MA,Santelli RE,Oliveria EP,et al.Response surface Methods ology(RSM)as a tool for optimization in analytical chemistry.Talanta,2008,76(5):965-977.
[3]Bota A,Gella FJ,Canalias F.Optimization of adenosine deaminase assay by response surface Methods ology.Clin Chim Acta,2000,290(2):145-157.
[4]劉春龍,金仁玲,孫慧穎,等.臨床生化檢驗反應面法(RSM)及其常用設計方式淺析.臨床檢驗雜志,2014,32(4):317-318.
(責任編輯:郭海強)
*國家高技術研究發(fā)展863計劃(2011AA02A111);國家質檢總局公益項目(201210066)
1.北京航天總醫(yī)院檢驗科(100076)
2.北京航天科技集團有限公司
△通信作者:陳寶榮,E-mail:jyk711@sina.com