999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于隨機森林算法的煙草提取物類別識別模型研究

2023-11-29 01:42:32申濤榕張艷飛杜歡哲鄒小勇
分析測試學報 2023年11期
關鍵詞:煙草模型

丁 莎,申濤榕,張艷飛,杜歡哲,吳 榆,鄒小勇*

(1.湖南中煙工業有限責任公司技術中心,湖南 長沙 410007;2.中山大學 化學學院,廣東 廣州 510006)

目前煙草行業使用的同類不同來源的煙草提取物包括不同產地、不同生產工藝的提取物、精油、浸膏、凈油、精制物等,常用的分析檢測手段為氣相色譜-質譜聯用技術,包括氣相色譜-四極桿質譜(GC-Q MS)、氣相色譜-四極桿飛行時間質譜(GC-QTOF MS)[1]、氣相色譜-離子阱質譜(GC-IT MS)[2-3]和氣相色譜-三重四極桿串聯質譜(GC-QQQ MS)[4-5]等。其中GC-QTOF MS 的優勢在于:一方面高分辨飛行時間質譜具有分辨率高、掃描速度快等優勢,可通過與其他質譜串聯實現多級質譜分析的要求;另一方面GC-QTOF MS 結合了氣相色譜的高分離能力,極大地拓展了高分辨質譜在化合物定性分析上的應用范圍,非常適用于煙草提取物等復雜體系中目標化合物的提取與鑒定[6-8]。

隨機森林(Random forest,RF)[9-10]是一種基于多個決策樹的集成學習方法,具有高效、魯棒性好、易于實現等優點,已被應用于煙草中化學成分的測量和分析,為煙草的品質評價、加工工藝優化、香氣調控等提供了新的思路和方法。該方法可利用煙草易獲得的特征數據,建立煙草化學成分與特征數據之間的非線性關系模型,實現對煙草中化學成分的快速識別。郭東鋒等[11]使用隨機森林分類算法分析影響烤煙香型的關鍵因素,有效地對烤煙香型進行分類。賴燕華等[12]利用近紅外光譜技術和隨機森林算法,建立了一種煙葉霉變快速識別模型,對不同霉變程度的復烤片煙進行了有效判別。楊睿等[13]利用隨機森林方法對不同品種的鮮煙葉成熟度進行了判別。陳頤等[14]利用熱裂解/氣相色譜-質譜法和隨機森林方法,對加熱卷煙煙葉原料的化學成分和感官評價進行了分析,建立了煙葉原料適用性的預測模型,并篩選出影響適用性的重要化學成分。

本文采用GC-QTOF MS 技術和RF算法,獲取20種煙草提取物相關信息,對其進行了各成分分析,獲得二進制表征數據集。基于RF 模型,構建了提取物、油類物質和浸膏物質3 類物質,以及6 個地域產地煙草提取物的識別方法,相關研究未見報道。

1 實驗部分

1.1 儀器、材料與試劑

20種煙草提取物,按種類分為8種提取物、10種油類物質、2種浸膏物質;按地域分為7種(只對6地域產地分析),分別為2種A 煙草、3種B 煙草、5種C 煙草、2種D 煙草、3種E 煙草、3種F煙草、1種G煙草提取物和1種未知產地的油類提取物,具體如表1所示。

表1 20種煙草提取物信息Table 1 Informations of the 20 kinds of tobacco extract

1.2 實驗方法

用分析天平稱取0.100 0 g 單一煙草提取物樣品,分別加入10 mL 乙酸乙酯-甲醇(體積比1∶1)有機溶劑,振蕩,超聲提取15 min,用0.22 μm濾膜過濾,進樣1 μL上機分析。

色譜條件:在氣相色譜(Agilent 7890 A)分析儀上進行,色譜柱為DB-5MS(30 m × 0.25 mm × 0.25 μm)彈性石英毛細管柱;進樣口溫度為280 ℃;柱初始溫度為50 ℃(保持4 min),以8 ℃/min 升至180 ℃,再以20 ℃/min 升至250 ℃,保持3 min,最后以30 ℃/min 升至280 ℃,保持5 min;進樣量為1.0 μL;分流比5∶1;載氣為He;柱前壓力為22.44 kPa,流速為1.5 mL/min。

質譜條件:Xevo G2-XS QTOF MS 系統,采用大氣壓氣相色譜電離源(APGC+)模式;源溫度:120 ℃;錐孔氣:150 L/h;輔助氣:200 L/h;采集模式:MSE;高碰撞能量:5~30 V;采集質量范圍:50~800 Da。

1.3 隨機森林模型構建

RF 是一種屬于集成學習方法的機器學習算法。它通過組合多個分類樹,最終通過投票或取平均值,使得整體模型結果具有高的準確度和泛化性能。該算法不僅支持大數據集,而且可應對高維特征向量。基于Matlab 軟件中的“TreeBagger”函數執行RF 算法。按照[100∶100∶1 000]和2^[1∶1∶11],以及算法的默認參數,優化RF參數:森林中包含樹的數目和每一棵樹的葉節點選擇參數的數目。樣本隨機平均分成2 份,其中1 份用作測試集,剩余1 份用作訓練集。重復2 次,使2 份中的每一份均被作為測試集。最后,整合2 次重復的結果,評估模型性能。具體步驟如下:①利用Matlab 的xlsread函數讀取并裝載樣本對應的二進制特種向量;②將樣本隨機分為2 等份;③根據設置的隨機森林參數和Matlab 的“TreeBagger”函數,運行RF 算法;④基于2-折交叉驗證,采用預測精度(Accuracy)優化模型參數,并評估模型性能;⑤基于最優的參數組合,構建RF 模型;⑥根據構建的RF 模型,輸出識別結果。其中Accuracy 定義為:Accuracy=ni/Ni,其中Ni為第i類的樣本數目,ni為正確識別第i類的樣本數目。

利用Xevo G2-XS QTOF MS 系統,對20 種煙草提取物樣品進行GC-QTOF MS 分析,并獲取各煙草提取物成分,構建二進制表征數據集。由于G產地只有1種,采用RF模型,只對3種類(提取物、油類和浸膏類)和6地域產地(2種A、3種B、5種C、2種D、3種E、3種F)煙草提取物進行區分和識別。

2 結果與討論

2.1 成分分析及特征表征

對3 種類和6 地域產地的20 種煙草提取物進行了成分分析,涉及1-羥基-2-丙酮、2-甲基四氫呋喃-3-酮和法尼基丙酮等110個成分。以B 產地為例(其他類同),共有煙草提取物(B)、B 浸膏和煙草提取物(B精油)3種物質,煙草提取物(B)和B浸膏含有吡啶,對應二進制向量中的元素值為1,煙草提取物(B 精油)元素值為0;B 浸膏含有茄酮,元素值為1,其他2 個元素值為0;煙草提取物(B 精油)含有十八酸,元素值為1,其他2個元素值為0;煙草提取物(B)、B 浸膏和煙草提取物(B 精油)含有乙酸甲酯,元素值均為1;3種物質不含有乙酸異丁酯,元素值均為0。因此,構建了110 × 3維二進制向量數據集表(如表2)。

表2 產地B煙草提取物的二進制表征表Table 2 Binary characterization of tobacco extract from origin B

2.2 RF三類模式識別

將20種煙草提取物按照8種提取物、10種油類和2種浸膏劃分為3類。8種提取物標記為“1”,10種油類和2種浸膏分別標記為“2”和“3”,構建RF模型對香煙提取物進行三類模式識別研究。

構建了8 種提取物、10 種油類和2 種浸膏二進制向量數據集,維數分別為:110 × 8、110 ×10、110 ×2。采用構建的數據集,基于Matlab數學建模軟件中的“TreeBagger”命令進行判別分析。采用2-折交叉驗證方法評估模型的預測精度,并優化參數。

RF 參數(樹的數目和選擇特征的數目)優化結果如圖1 所示,混淆矩陣如圖2 所示,結果列于表3~表5。由圖2 可以看出,建立的RF 模型100%準確識別8 種提取物、10 種油類和2 種浸膏。由表3 可以看出,無論森林中樹的數目和每個節點選擇的特征數目如何改變,構建的模型始終能夠正確識別8 種提取物。對于10 種油類物質,當樹的數目為100,且選擇的特征數目為2 時,預測精度較低,但仍達到90%的正確識別率。對于2 種浸膏,由于樣本數目較少,只有當森林中樹的數目較大,且選擇的特征數目大于4時,構建的模型才能準確識別。結果表明,基于識別的特征成分,選擇優化參數,RF 模型能夠有效識別20種煙草提取物中8種提取物、10種油類和2種浸膏。

圖1 RF模型參數優化對8種煙草提取物(A)、10種油類提取物(B)和2種浸膏提取物(C)的預測結果Fig.1 Optimization of RF model parameters for prediction results of 8 tobacco extracts(A),10 oil extracts(B) and 2 extractums(C)

圖2 RF模型混淆矩陣Fig.2 Confusion matrix of RF model

表3 RF模型參數對8種煙草提取物的識別結果Table 3 Recognition results of 8 tobacco extracts using RF model from different parameter combination

表4 RF模型參數對10種油類提取物的識別結果Table 4 Recognition results of 10 oil extracts using RF model from different parameter combination

表5 RF模型參數對2種浸膏提取物的識別結果Table 5 Recognition results of 2 extractum using RF model from different parameter combination

2.3 RF六類模型

將20 種煙草提取物按照產地A、B、C、D、E和F 分別標記為“1”、“2”、“3”、“4”、“5”和“6”。構建RF 模型對煙草提取物進行六類模式識別研究。

構建的6 個地域產地(2 種A、3 種B、5 種C、2種D、3種E、3種F)二進制向量數據集,維數分別為:A:110×2、B:110×3、C:110×5、D:110×2、E:110×3、F:110×3。采用構建的數據集,基于Matlab 數學建模軟件中的“TreeBagger”命令進行判別分析。采用2-折交叉驗證方法評估模型的預測精度,并優化參數。

采用RF 算法構建模型開展識別研究,預測結果示意圖和混淆矩陣如圖3 所示。在圖3A 中,每個點表示樣本在三維空間中的分布,點的顏色與三維坐標數值相關,即坐標值越大顏色越淺。結果表明,RF 構建的模型能夠準確識別6 種煙草在高維空間的分布邊界;圖3B 縱坐標A、B、C、D、E 和F分別表示樣本的真實類別,橫坐標表示樣本的預測類別,方格中的數字表示樣本數目,顏色與樣本數目大小相關,即樣本數目越多顏色越深。結果表明,每一類樣本均被構建的RF模型準確識別,模型能夠100%識別每一地域產地的煙草。因此,RF 模型準確識別了2 種A 煙草、3 種B 煙草、5 種C 煙草、2種D煙草、3種E煙草、3種F煙草。

圖3 隨機森林最優模型對6種煙草提取物的預測結果示意圖(A)與混淆矩陣(B)Fig.3 Schematic diagram(A) and confusion matrix(B) of prediction results of six types of tobacco extracts based on RF optimized model

3 結 論

本文以不同產地的20 種煙草提取物為研究對象,采用GC-QTOF MS 作為樣本的高分辨表征手段,對同類不同來源的煙草提取物進行深入的成分剖析及其關鍵成分的定量研究等,有望獲得它們更多的化學信息。研究結果可為煙草提取物的質量標準制定奠定基礎,也為同類不同來源的天然香原料(包括煙草提取物)品控和分析提供科學依據,并為功能性香基模塊中天然香原料的溯源可行性提供理論依據。

猜你喜歡
煙草模型
一半模型
煙草具有輻射性?
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
煙草依賴的診斷標準
3D打印中的模型分割與打包
煙草中茄酮的富集和應用
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
煙草鏡頭與歷史真實
聲屏世界(2014年6期)2014-02-28 15:18:09
煙草品種的SCAR標記鑒別
主站蜘蛛池模板: 国产91全国探花系列在线播放| 五月六月伊人狠狠丁香网| 亚洲成人高清在线观看| 99re这里只有国产中文精品国产精品| 欧美福利在线| 在线免费观看AV| 亚洲无码高清免费视频亚洲 | 国产综合无码一区二区色蜜蜜| 国产亚洲成AⅤ人片在线观看| 久久综合色视频| 欧美性猛交一区二区三区| 亚洲免费福利视频| 国产精品久久精品| 青青草国产精品久久久久| 欧美特黄一级大黄录像| 中文字幕66页| 精品国产免费观看一区| 亚洲精品视频网| 91丝袜乱伦| 2022精品国偷自产免费观看| 亚洲天堂久久| 2020最新国产精品视频| 青青草国产免费国产| 国产成人无码播放| 国产成人一区| 欧美日韩精品一区二区视频| 91小视频在线| 欧美 亚洲 日韩 国产| 欧美区一区二区三| 午夜欧美在线| 中文字幕在线视频免费| 亚洲国产无码有码| 久草中文网| 538精品在线观看| 少妇精品在线| 精品无码日韩国产不卡av| 真人高潮娇喘嗯啊在线观看| 高清不卡一区二区三区香蕉| 久久久久国产精品免费免费不卡| 日韩小视频网站hq| 亚洲动漫h| 少妇极品熟妇人妻专区视频| 久久久久国色AV免费观看性色| 精品免费在线视频| 中文字幕在线一区二区在线| 国产菊爆视频在线观看| 一区二区三区精品视频在线观看| 999在线免费视频| 九九九久久国产精品| 欲色天天综合网| 日韩成人在线一区二区| 久无码久无码av无码| 欧美在线伊人| 怡春院欧美一区二区三区免费| 亚洲日韩精品综合在线一区二区| 国产精品一老牛影视频| 国产一区二区三区在线无码| 免费一级α片在线观看| 亚洲开心婷婷中文字幕| 日韩精品一区二区深田咏美| 成人噜噜噜视频在线观看| 制服丝袜 91视频| 男女性午夜福利网站| 亚洲欧洲日韩国产综合在线二区| 色噜噜狠狠狠综合曰曰曰| 欧美精品伊人久久| 欧美日韩在线亚洲国产人| 丁香综合在线| 日本一区二区三区精品国产| 91在线国内在线播放老师| 天天综合色天天综合网| 国产在线观看精品| 极品国产在线| 亚洲日韩精品欧美中文字幕| 国产成年无码AⅤ片在线| 中文字幕66页| 日本三级欧美三级| 玖玖精品在线| 色婷婷成人| 人与鲁专区| 91亚洲国产视频| 久久免费精品琪琪|