999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于拉曼光譜的廣陳皮年份檢測方法

2023-02-08 14:44:38李靜敏辛志昂聶青青羅甲白華高強
食品工業 2023年1期
關鍵詞:特征分析

李靜敏,辛志昂,聶青青,羅甲,白華,高強*

天津工業大學電子與信息工程學院(天津 300387)

自古以來,陳皮以其獨特的風味并作為一種藥材為大眾所熟知,而廣陳皮作為陳皮的優良品種更是享有美譽[1-2]*。廣陳皮具有豐富的藥用價值,可用于緩解胸腹脹滿、脾虛食欲不振等癥狀,還可燥濕化痰、利水通便,適當地食用廣陳皮對人體消化系統、呼吸系統、心血管系統和泌尿系統等多個系統器官都有正面作用[3-6]*。市面上的廣陳皮因年份不同,導致優劣質量也有所不同,而廣陳皮的質量會影響其藥用價值的發揮。因此需要研究如何有效鑒別陳皮年份,使陳皮能夠更好地投入使用。

為了對不同年份的廣陳皮進行分析研究,需要對其進行信息采集。拉曼光譜提供快速、簡單、可重復、無損傷的定性定量分析,而且可以對有機物及無機物進行分析,在中藥化學成分的鑒別中起著重要的作用。由于陳皮在陳化過程中,其化學成分、藥理作用均與貯藏年份呈正比[7]*,有著“陳久者良”的說法[8-11]*,而且相較于檢測時間長、樣品提取復雜、對試驗要求高的質譜法、色譜法,利用快速、簡便的拉曼光譜研究陳皮成分[12-14]*得到廣泛關注。

有研究通過拉曼光譜分析不同年份陳皮的化學成分[15-19]*,也有許多研究通過統計學分析或模式識別方法對乳制品、干細胞、血清等進行分析[20-24]*,但對于利用統計學分析或模式識別方法結合拉曼光譜實現陳皮年份鑒別方面的研究,卻鮮有報道。主成分分析法作為模式識別的一種,在統計學、數學建模、數理分析等學科中均有應用,是一種常用的多變量分析方法,且t檢驗作為統計學分析方法的一種,常用于判定2個平均數之間的差異是否顯著,因此使用t檢驗和主成分分析法結合拉曼光譜對陳皮年份進行鑒別,有著重要的研究意義。

試驗利用t檢驗的統計學分析方法對不同年份的廣陳皮拉曼光譜進行定量和定性研究,并使用主成分分析的模式識別法建立回歸模型,對廣陳皮的年份進行鑒別預測,有助于使陳皮更好地發揮自身的藥用價值。

1 數據采集與預處理

1.1 數據采集

試驗用Maya 2000便攜式拉曼光譜儀(美國海洋光學公司,激光器波長785 nm)采集樣本數據,使用的陳皮樣本來自于廣東新會陳皮。分別對2012,2015和2019年的廣陳皮進行拉曼光譜采集,將每一年份的陳皮分為9組樣本。考慮到實際檢測過程中陳皮放置方式的不確定性,故樣本分別在正面和反面采集數據(陳皮的內里為正面、外壁為反面,下同),以消除在檢測時陳皮放置方式對其成分的影響。每一年份采集3個陳皮樣本,每個陳皮樣本分為3瓣,每瓣在正面和反面分別采集3個點以消除誤差,共采集得到162組數據,正反面各81組,采集到的原始光譜數據如圖1所示。

通過觀察圖1中的原始拉曼光譜圖可知,隨著拉曼位移的變化,其對應的光譜強度也隨之發生變化,而所有陳皮的光譜中,強度在拉曼位移270 cm-1*前開始急劇上升,出現大量無效信息,故在后續的研究分析過程中只考慮拉曼位移270 cm-1*后的光譜信息。

圖1 不同年份廣陳皮原始拉曼光譜圖

1.2 數據預處理

光譜中普遍存在背景噪聲以及熒光,僅通過儀器的精度和準確度來消除檢測干擾受到儀器自身的限制遠遠不夠,因此采用去基線的方法對數據進行預處理。在光譜分析中,去基線能夠非常有效地提高譜圖信噪比,降低隨機噪聲的影響。

基于拉曼位移270 cm-1*前出現大量無效信息,故讀取原始數據后,選擇拉曼位移270~2 170 cm-1*作為特征波段,對這部分的數據進一步處理。使用PeakFit軟件對原始光譜去基線,找到光譜基線趨勢的拐點,選擇2nd-DerivZero,即通過不同方程(如線性、多項式、對數等)的方法,擬合光譜基線,圖2為去基線后的拉曼光譜圖。

圖2 去基線后的拉曼光譜圖

去基線后的拉曼光譜比原始拉曼光譜的拉曼特征峰更明顯一些,拉曼光譜的特征峰位反映物質化學鍵的振動或轉動頻率,因此不同位置的拉曼特征峰可以代表不同的化學鍵,從而反映出分子的結構信息。

無論是原始光譜圖還是去基線后的光譜圖,在不同年份正反面廣陳皮的光譜圖中,峰的絕對強度數值差別較大,為了更好地對廣陳皮中的化學成分進行定量和定性分析,對去基線后的拉曼光譜進行歸一化處理。歸一化可以校正由于微小光程引起的光譜變化,消除在測量過程中產生的數據在數量級之間的差異。通過觀察發現,在絕大部分廣陳皮的拉曼光譜中,拉曼位移492 cm-1*處的絕對強度最高,故將其作為參照值對其他特征峰進行歸一化,如式(1)所示。

式中:I’為歸一化后的相對強度;I為歸一化前特征峰對應的數值;I492nm是該組光譜數據中拉曼位移為492 cm-1*處測量得到的絕對強度。

由于采集的樣本組數偏少,且取均值的操作能夠大幅減小在試驗中的誤差,故對同一年份的同一片陳皮所采集的數據進行取均值處理,如式(2)所示。

式中:I’為新生成的光譜數據;n為某一片陳皮所采集的數據數;Xi(i=1,2,…,n)為第i組數據的光譜值。提到采集3個年份的陳皮數據,每年采集3個陳皮樣本,每個陳皮樣本分為3瓣,根據上述方法計算正面和反面每一年份的均值、每一個陳皮樣本的均值、每一瓣陳皮樣本的均值,分別生成6,18和54組數據,共生成新的78組廣陳皮數據,正、反面各39組,作為后續主成分分析模型的驗證數據,以驗證模型的準確性。

圖3為經過歸一化和取均值處理后的拉曼光譜圖,圖3(a)為反面光譜,圖3(b)為正面光譜,f表示反面,z表示正面,為了清晰起見,光譜垂直移動。經過預處理后拉曼位移相對強度在特定的區間0~1內,消除數量級的影響,便于后續數據的對比分析。

圖3 歸一化平均拉曼光譜

2 模型的建立及結果分析

2.1 拉曼光譜t檢驗

2.1.1 拉曼特征峰歸屬

拉曼光譜是一種無損的分析技術,該技術基于光和材料內化學鍵的相互作用,可以提供樣品化學結構、相和形態、結晶度及分子相互作用的詳細信息。一張拉曼光譜圖通常由一定數量的拉曼峰構成,每個拉曼峰代表相應的拉曼散射光的波長位置和強度。每個譜峰對應于一種特定的分子鍵振動,其中既包括單一的化學鍵,如C—C,C=C,N—O,C—H等,也包括由數個化學鍵組成的基團的振動,如苯環的呼吸振動、多聚物長鏈的振動及晶格振動等。

從廣陳皮去基線后的拉曼光譜圖(圖2)中可以看出,廣陳皮的拉曼光譜在不同年份的同一位置出現多個拉曼特征峰,對廣陳皮主要的特征峰進行歸屬[25-34]*,結果在表1中列出。

表1 廣陳皮拉曼峰歸屬表

在進行拉曼光譜定量分析時,由于拉曼光譜數據的信息量龐大,除特征峰之外的數據存在信息重疊問題,故將預處理后拉曼光譜中19個特征峰對應位置的峰強度進行統計,并進行相應的分析。

2.1.2 光譜統計學分析

據廣陳皮正面和反面的歸一化平均拉曼光譜(圖3)顯示,年份改變時,特征峰的位置和寬度沒有明顯變化,然而從圖3(a)可以明顯看出,在1 272和1 275 cm-1*處的峰值相對強度隨年份有所變化,表明可以選擇峰值相對強度作為檢測廣陳皮年份的特征。由于僅有幾個峰的強度在圖像上有明顯的變化,大部分峰強度的變化相對較小,因此采用t檢驗選取不同年份廣陳皮存在顯著差異的峰,從而找到對廣陳皮內部物質變化敏感的分子振動。

建立假設H0,2個年份之間某一特征峰無明顯差異;H1,2個年份之間某一特征峰存在顯著差異,用P值表征t檢驗的結果,P<0.05時說明有理由拒絕H0、接受H1,說明兩者之間存在差異,P值越小,說明差異越可靠。

接表2

由于廣陳皮正面和反面的化學物質含量不同,將正面和反面分開,對2012,2015和2019年廣陳皮兩兩之間分別進行t檢驗,得到的結果如表2所列。結果表明,陳皮正面僅有很少一部分的特征峰在不同年份之間存在顯著差異(P<0.05),而陳皮反面絕大部分的特征峰都表現出具有顯著差異,其中2012年和2015年、2015年和2019年之間幾乎全部的特征峰具有極顯著差異(P<0.001)。反面存在多個特征峰,3組數據全部都通過t檢驗,而正面不存在通過3組t檢驗的特征峰,這表明反面的拉曼光譜更能夠用于鑒別區分廣陳皮的年份。

表2 t檢驗得到的P值

從表2得出廣陳皮反面在418,768,869,1 154,1 272,1 374,1 479,1 553,1 598,1 725,1 831,1 864和2 124 cm-1*處的特征峰均通過3組t檢驗。圖4表示不同年份反面拉曼特征峰的相對強度比較,*表示在表2中的3組數據均通過t檢驗。在這些數據中,廣陳皮年份越久時,768 cm-1*處N-甲基甲酰胺的C—C伸縮振動、869 cm-1*處陳皮色氨酸、2 124 cm-1*處聚炔類化合物峰強度降低,1 598 cm-1*處黃酮類苯衍生物苯環伸縮雙峰的峰強度增加,因此可用這4個峰的強度來表征廣陳皮的年份。

圖4 反面不同年份間特征峰相對強度比較

2.2 拉曼光譜主成分分析

2.2.1 主成分分析基本原理

主成分分析是一種降維的思想,能夠在損失信息很少的前提下,利用正交旋轉變換將多個指標轉化為幾個綜合指標。轉化生成的綜合指標稱為主成分,其中每個主成分都是原始變量的線性組合,且各個主成分之間彼此獨立。經過分析得到的主成分按方差遞減的順序排序,并計算對應主成分的貢獻率,當累積貢獻率達到一定程度時,選取前幾個方差最大的主成分代替原變量,用這些主成分就能夠綜合反映原變量中所包含的主要信息,實現降維的效果。

2.2.2 模式識別模型的建立

在進行拉曼光譜的分析時,由于拉曼光譜的偏移范圍相差較大,會導致樣本的特征點之間存在信息重疊的問題,容易使分析結果出現偏差,因此需要對光譜數據通過主成分分析進行降維,提取出廣陳皮拉曼光譜中的主成分。

主成分分析在數學上的處理是將原始的p個變量作線性組合,作為新的變量。在2.1.2中證實廣陳皮反面的光譜數據有顯著差異,故采用不同年份廣陳皮反面拉曼光譜中出現的4個具有單調變化的拉曼特征峰作為主成分分析的指標,設這4個原始變量為x1、x2、x3、x4,由此可以得到4個主成分Z1、Z2、Z3、Z4。每個主成分的貢獻率和樣本前k個主成分的累積貢獻率定義為式(3)和式(4)。

式中:λ為主成分的特征值,p為主成分的個數。

2.2.3 結果和討論

采用MATLAB編程,對不同年份廣陳皮反面的拉曼光譜進行主成分分析,得出對應的主成分貢獻率,并計算累積貢獻率,得到的結果如表3所示。

表3 主成分特征值及貢獻率

各個主成分軸上的特征值代表該軸承載的方差量,通過將該軸的特征值除以所有軸的總方差和,所得比例即為該軸所解釋的方差比例。在表3中,PC1的特征值為2.980 7,解釋原有變量的方差比例為74.52%,累積貢獻率為74.52%,其他數據的含義以此類推。得到的前2個主成分累積貢獻率為87.87%,其他主成分的貢獻率均小于0.5%,故原則上只需取前2個主成分即可概括原有變量的大部分信息,信息丟失較少,主成分分析的結果較理想。

因此一般來講,如果很少的主軸(如第1軸和第2軸,記為PC1和PC2,分別對應第1主成分和第2主成分)承載大部分的方差,或者說解釋大部分差異,則表明通過PCA分析該數據是“合理”的。在后續描述數據特征時,只需通過這些主成分的特征即可有效表征原初數據的結構。對于廣陳皮具體年份的鑒別,還需建立回歸模型進行預測分析。

2.2.4 模型的驗證

將反面預處理后的81組拉曼光譜數據作為訓練集,取768,869,1 598和2 124 cm-1*處在不同年份間有顯著差異的特征峰作為數據,進行主成分回歸。主成分回歸將多個彼此相關、信息重疊的拉曼特征峰指標通過適當的線性組合,使之成為彼此獨立而又提取原始廣陳皮年份指標信息的主成分,建立拉曼特征峰與主成分的回歸關系式,將其還原為拉曼特征峰與廣陳皮年份之間的回歸方程,以建立廣陳皮年份的鑒別預測模型。

對數據進行多元線性回歸分析和共線性診斷,得到調整的判定系數R2*=0.174 4,說明模型總體擬合的效果一般。

共線性診斷得到的條件指數如表4所示。4個主成分的條件指數均小于10,表明自變量間不存在多重共線性,說明這4個自變量均為有效信息。考慮自變量為經t檢驗篩選后的拉曼特征峰,故不存在共線性。且這4個自變量在表3中的累計貢獻率為100%,因此在進行主成分回歸時,選取這4個變量作為主成分,進行主成分回歸,得到的回歸模型如式(5)所示。

表4 共線性診斷結果

式中:x1、x2、x3、x4分別為768,869,1 598和2 124 cm-1*處特征峰。根據回歸方程可看出,x1前面的系數為負,說明該處物質變化和廣陳皮年份呈反比,x2、x3、x4前面的系數為正,說明對應物質變化和廣陳皮年份呈正比。x4前面的系數最大,說明其對應物質黃酮類苯衍生物對廣陳皮年份的影響最大。

根據回歸方程建立鑒別預測模型,將數據代入回歸方程即可得到預測結果。用取均值后新生成的39組反面數據作為測試集對模型進行驗證,得到訓練集的預測精度為77.78%,測試集的預測精度為76.92%,實現3個年份廣陳皮樣本的鑒別預測。

3 結論

將拉曼光譜與模式識別分類方法結合,對年份為2012,2015和2019年,即10,7和3年的廣陳皮樣本進行研究。通過使用主成分分析法對拉曼光譜數據進行分析,建立模型進行鑒別預測,達到預期的效果。

考慮到廣陳皮在實際檢測時放置的方式不同,將樣本區分為正面、反面進行研究。拉曼光譜的試驗表明,在3個年份正面、反面的廣陳皮拉曼光譜圖中,均在320,418,594,667,768,869,974,1 048,1 154,1 272,1 374,1 479,1 553,1 598,1 725,1 831,1 864和2 124 cm-1*處出現拉曼光譜的特征峰,這些均為廣陳皮內部的主要營養物質,包括黃酮類化合物、糖類、色氨酸、纖維素等。

利用t檢驗的統計學分析方法,證明反面的拉曼光譜在不同年份之間差異更顯著,而對應N-甲基甲酰胺的C—C伸縮振動、陳皮色氨酸、黃酮類苯衍生物苯環伸縮雙峰、聚炔類化合物的768,869,1 598,2 124 cm-1*處特征峰均通過t檢驗(P<0.05),說明其含量在不同年份間存在顯著差異,且這些特征峰隨年份單調變化,說明可以利用這4個特征峰來鑒別廣陳皮的年份。

對樣本篩選后的拉曼光譜進行主成分分析后發現,4個主成分的條件指數均小于10,表明自變量間不存在多重共線性,說明這4個自變量均為有效信息,且這4個自變量的累計貢獻率為100%,故以這4個因子作為主成分對樣本建立回歸模型可實現廣陳皮年份的鑒別。為驗證模型的準確度,將采集的81組反面樣本作為訓練集建立主成分回歸模型,將取均值新生成的39組數據作為測試集對回歸模型進行驗證,樣本訓練集的預測準確率為77.78%,測試集的預測準確率為76.92%,初步實現對廣陳皮年份的鑒別,證明用主成分分析對廣陳皮年份鑒別的合理性。

試驗僅對廣陳皮拉曼光譜進行主成分分析模式識別法的研究,后續研究中可結合拉曼光譜與卷積神經網絡等機器學習的算法進行深入研究,以提高廣陳皮分類模型鑒別的準確率,對合理發揮廣陳皮的藥效提供參考價值。

猜你喜歡
特征分析
抓住特征巧觀察
隱蔽失效適航要求符合性驗證分析
新型冠狀病毒及其流行病學特征認識
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
抓住特征巧觀察
電力系統及其自動化發展趨勢分析
中西醫結合治療抑郁癥100例分析
在線教育與MOOC的比較分析
主站蜘蛛池模板: 狠狠亚洲婷婷综合色香| 日本一区二区三区精品视频| 成人毛片在线播放| 麻豆AV网站免费进入| 亚洲 欧美 中文 AⅤ在线视频| 中国国产高清免费AV片| 视频国产精品丝袜第一页| 亚洲无码A视频在线| 免费高清自慰一区二区三区| 丁香综合在线| 欧美yw精品日本国产精品| 亚洲国产天堂在线观看| 狂欢视频在线观看不卡| 中国美女**毛片录像在线 | 国产噜噜噜视频在线观看| 久久久久亚洲av成人网人人软件 | 尤物在线观看乱码| 粉嫩国产白浆在线观看| 视频一本大道香蕉久在线播放| 国产一区二区视频在线| 婷婷亚洲天堂| 亚洲无码高清一区| 伊人久久久久久久| 久草网视频在线| 69免费在线视频| 亚洲无码电影| 国产91全国探花系列在线播放| 免费视频在线2021入口| 亚洲区视频在线观看| igao国产精品| 亚洲国产av无码综合原创国产| 色婷婷色丁香| 国产情侣一区| 亚洲高清资源| yy6080理论大片一级久久| 素人激情视频福利| 99re这里只有国产中文精品国产精品| www.91在线播放| 国产亚洲精品精品精品| 婷婷色狠狠干| 9966国产精品视频| 97久久超碰极品视觉盛宴| 91精品国产情侣高潮露脸| 久久人体视频| 五月天丁香婷婷综合久久| 无码专区在线观看| 国产一区成人| 囯产av无码片毛片一级| 在线国产你懂的| 欧美一级99在线观看国产| 午夜一级做a爰片久久毛片| 久久精品中文无码资源站| 中文字幕在线日韩91| 91日本在线观看亚洲精品| 福利在线一区| 日韩欧美国产综合| 国产成人亚洲无码淙合青草| 国产成人无码AV在线播放动漫 | 国产女人18毛片水真多1| 91久久精品日日躁夜夜躁欧美| 国产成人麻豆精品| 欧美性久久久久| 一级黄色欧美| 在线观看91精品国产剧情免费| 国产另类乱子伦精品免费女| 在线欧美日韩| 欧美亚洲一区二区三区导航| 亚洲男人天堂2018| 国产一区二区三区在线精品专区| 国产黄网站在线观看| 亚洲综合精品第一页| 国产精品永久久久久| 亚洲第一色视频| 综合亚洲色图| 久草视频福利在线观看| 不卡视频国产| 2021国产精品自产拍在线观看 | 亚洲第一国产综合| 青青操视频免费观看| a欧美在线| 高清不卡毛片| 亚洲国产日韩欧美在线|