摘 要:利用傅立葉變換紅外光譜(FTIR)結合衰減全反射(ATR)技術和單點回歸方法建立人體血液血紅蛋白定量分析的數(shù)學模型。以預測均方根偏差(RMSEP)和預測相關系數(shù)(RP)為目標進行模型優(yōu)選。結果表明:最優(yōu)單點模型的RMSEP、RP值分別達到5.40、0.859,為FTIR/ATR光譜技術應用于人體血紅蛋白的定量分析提供優(yōu)秀穩(wěn)定的數(shù)學模型。
關鍵詞:血紅蛋白 FTIR/ATR光譜 數(shù)學模型
中圖分類號:O657文獻標識碼:A文章編號:1674-098X(2011)01(b)-0214-02
利用傅立葉變換紅外光譜(FTIR)結合衰減全反射(ATR)技術(簡稱FTIR/ATR技術)分析某種待測量前必須先建立數(shù)學模型(關聯(lián)樣品光譜與待測量之間的數(shù)學關系),才能依據(jù)樣品的光譜通過數(shù)學模型確定待測量。因此FTIR/ATR光譜分析的關鍵是建立優(yōu)秀的數(shù)學模型,本文采用一元線性回歸方程建立血液血紅蛋白FTIR/ATR光譜分析的定標預測模型,本質(zhì)上是對數(shù)學模型的優(yōu)化過程,目標是為了尋找優(yōu)秀的數(shù)學模型。為將FTIR/ATR光譜技術應用于人體血液血紅蛋白快速定量測定提供優(yōu)秀的定量分析的數(shù)學模型。
1 FTIR/ATR光譜分析的框架
FTIR/ATR光譜分析是利用關聯(lián)算法將已知樣品的光譜數(shù)據(jù)與參考化學值相關聯(lián),建立定量或定性分析的數(shù)學模型,然后根據(jù)模型和未知樣品的光譜預測未知樣品的組成或性質(zhì),是一種間接測量技術。如圖1所示。因此,在測定樣品中某待測量前,必須首先建立相應的數(shù)學模型。
數(shù)學模型的建立具體可以分為定標和預測兩個過程。定標過程是選擇一批有代表性的樣品作為定標樣品集,分別用現(xiàn)行標準或傳統(tǒng)方法進行準確測定其FTIR/ATR光譜與各種待測量(稱為參考化學值),得到二維光譜矩陣與對應的二維化學值矩陣(預測樣品的FTIR/ATR光譜和參考化學值亦同樣取得)。然后以此作為建模數(shù)據(jù),運用化學計量學方法,建立光譜數(shù)據(jù)與參考化學值之間的關系式即定標模型(結合光譜預處理等);預測過程就是將預測樣品成分濃度的光譜數(shù)據(jù)代入定標過程求得的公式,計算預測樣品的成分含量(預測值)。然后,將預測集樣品的預測值與參考化學值比較,根據(jù)模型評價指標來確定預測精度。
2 實驗部分
本實驗的樣品是廣州市某研究所提供的人體全血樣品119個。所提供的119個人體血液樣品的血紅蛋白濃度是由傳統(tǒng)BC-3000Plus全自動血液細胞分析儀測定的,作為光譜定標的參考化學值。樣品的血紅蛋白濃度最大值為86.5g/L、最小值為42.5 g/L、平均值為67.2g/L、標準偏差為7.19 g/L。用蒸餾水溶血,每個樣品都配置成2倍的溶血液樣品用于光譜測定。
本實驗儀器是采用BRUKER公司的VERTEX 70型傅里葉變換紅外光譜儀(FTIR),選用SPECAC公司的水平衰減全反射(簡稱ATR附件)樣品測量附件。水平ATR的樣品槽為ZnSe晶體,45°入射角,3次反射。測量譜段在4000~600cm-1(共有1762個波數(shù)點),用衰減全反射方式獲得119個人體溶血液樣品的FTIR/ATR吸收光譜。每個樣品重復采集3次光譜,計算平均光譜。
3 單點回歸模型的優(yōu)選
單點回歸模型是只用一個光譜數(shù)據(jù)點和相應的化學值的線性關系建立光譜的回歸模型。本文大約按照定標集和預測集2∶1的比例來劃分這119個溶血液樣品。定標集預測集的樣品數(shù)分別設定為78、41個。建立每個波數(shù)點的定標預測模型,以RMSEP和RP為優(yōu)化目標,篩選最優(yōu)的單點模型。
首先,對定標集中的樣品在1762個波數(shù)點處建立一元濃度定標方程作為數(shù)學模型(定標模型),共有1762個模型。設分別為第個樣品在第個光譜點的吸光度,其血紅蛋白的濃度,則有:
其中i為定標樣品的個數(shù)。通過定標模型算出每個波數(shù)點處的回歸系數(shù),然后將每個預測樣品在每一個波數(shù)點處的吸光度和回歸系數(shù)代回相應的回歸方程反算出濃度,即得到41個預測樣品在1762個波數(shù)點處的所有預測值()。
將每一個預測樣品的參考化學值和在每一個波數(shù)點處的預測值代入預測均方根偏差(RMSEP)和預測相關系數(shù)(RP)公式,得到所有數(shù)學模型的預測效果的RMSEP和RP
其中為預測集中第i樣品的化學值;預測集中第i個樣品預測值;預測集中化學值的平均值;預測集中預測值的平均值;n為定標集的樣品數(shù);m為預測集的樣品數(shù)。
以預測均方根偏差(RMSEP)和預測相關系數(shù)(RP)為目標,進行模型參數(shù)的聯(lián)合優(yōu)化設計,經(jīng)過計算機數(shù)值實驗,在大范圍內(nèi)進行模型優(yōu)選,一方面使得RP盡可能大,一方面使得RMSEP盡可能小。經(jīng)篩選得出在1543cm-1附近,RMSEP比較低為5.40,而RP的相關系數(shù)比較高為0.859,如圖2所示。說明在1543cm-1處有良好且穩(wěn)定的預測效果。該波數(shù)點處的模型為最優(yōu)單點模型。
參考文獻
[1]曹干,譚中文,等.甘蔗蔗汁錘度和還原糖分傅立葉變換近紅外定量分析數(shù)學模型[J].華南農(nóng)業(yè)大學學報.2004,25(2):1-4.
[2]嚴衍祿.近紅外光譜分析基礎與應用[M].北京:中國輕工業(yè)出版社.2005.