張 磊,丁香乾,宮會麗,吳麗君,白曉莉,羅 林
1.中國海洋大學信息科學與工程學院,山東 青島 266100 2.云南中煙工業有限責任公司技術中心,云南 昆明 650024
近紅外光譜分析作為光譜測量和化學計量學結合的分析技術,是近年來分析化學領域發展最迅速的高新分析技術,以其簡便、快速、低成本、綠色環保、涵蓋信息量大和多組分同時測定等優點,廣泛應用于煙草、石油、紡織、食品等領域的定量檢測和定性分析,是現階段開展廣域范圍、大規模樣品檢測最佳的技術手段[1]。然而,近紅外光譜由于變量維度高、包含眾多與測定量無關的冗余信息和高頻噪聲等,對其直接建模不但會增加模型的復雜度,同時也會影響模型的預測性能和泛化能力[2]。因此,如何從高維的光譜變量中篩選與預測指標密切相關的特征變量,從而構建準確、穩定、高效的預測模型就顯得尤為重要。
目前,許多學者參與到近紅外光譜的特征變量篩選研究當中,取得了一定成果。李倩倩等[3]應用無信息變量消除法(uninformative variables elimination,UVE)剔除了光譜中不含有效信息的光譜點,然后構建總氮和總糖的PLS定量模型。但由于過度依賴光譜和指標關聯關系,并且需要單個變量逐一提取,容易忽略光譜變量全局貢獻度。徐寶鼎等[4]應用粒子群算法(particle swarm optimization,PSO)進行近紅外光譜特征選擇,采用特征分層的方式劃分初始粒子群。但優化過程中只針對固定的初始粒子群內部進行優選,忽略了不同粒子群光譜之間的比較。
鑒于此,本文提出了基于改進和聲搜索(harmony search,HS)算法的光譜特征變量選擇方法。……