高西婭,張朱珊瑩*,盧翠翠,蒙泳吉,曹匯敏,鄭冬云,張 莉,謝勤嵐
1.中南民族大學生物醫學工程學院,湖北 武漢 430074 2.認知科學國家民委重點實驗室,湖北 武漢 430074 3.醫學信息分析及腫瘤診療湖北省重點實驗室,湖北 武漢 430074
血紅蛋白、葡萄糖、白蛋白、乳酸等人體生理信息的檢測對疾病的預防和診斷具有重要的意義,因此各種生理參數的檢測技術被廣泛研究[1-3]。光譜學因為高靈敏度、高選擇性以及能夠檢測多種生物醫學參數應用比較廣泛[4],其中,紅外光譜技術是一種無損、快速用于分析生理參數的指紋技術[5]。但光譜數據背景復雜,有效信息微弱,建立一個精準的定量分析模型,需要提取盡可能多的有效信息并剔除無效和干擾信息,波長優選可以去除光譜中無關波長,提取測量樣品中與目標成分相關的有效信息,解決光譜重疊的問題,并且壓縮信息,提高檢測效率。通常波長選擇可以分為五個大類,分別為組合區間偏最小二乘法(synery interval patial least squares,SiPLS)、連續投影策略(successive projections algorithm,SPA)、波長區間、智能優化算法和模型集群分析策略。
SiPLS是間隔區間偏最小二乘法的改進算法,SiPLS是將光譜區間等間隔劃分為N個區間,對區間進行任意數量組合,通過交叉驗證均方根誤差(RMSECV)選擇最優組合方式從而實現波段優選,可以去除無效光譜并盡可能多的保留有效光譜信息。SPA算法通過計算波長的投影,把投影最大的波長選為特征波長[6-7],選出的特征波長解釋性好,增強定量模型的穩定性。
李明等[8]基于近紅外光譜原理,采用SiPLS-PLS模型選擇最佳波長對電子煙油中煙堿含量進行預測,與全譜PLS相比,提高了準確性。……