999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于XGBoost和SHAP的中藥寒熱藥性識別及寒熱特征標記可視化研究*

2022-03-28 02:31:46張喜科趙文華付先軍馬志慶魏國輝
世界科學技術-中醫藥現代化 2022年12期
關鍵詞:可視化中藥特征

張喜科 ,趙文華 ,付先軍 ,馬志慶 **,魏國輝 ,**

(1.山東中醫藥大學智能與信息工程學院 濟南 250355;2.山東中醫藥大學中醫藥經典理論教育部重點實驗室 濟南 250355)

中藥藥性理論是傳統中醫藥的重要組成部分,中藥寒、熱、溫、涼四性理論又是中藥藥性理論的核心內容之一。四性反映了中藥對人體寒熱變化的作用傾向,其中寒與涼、溫與熱只是程度上的差異并沒有本質上的區別。從本質屬性講,四性可以歸結為寒熱兩性[1-2]。臨床治療中,寒熱辨證是中醫辨別疾病病因病性最基本的綱領[3]。因此,正確識別中藥寒熱藥性對中醫辨證施治、組方遣藥具有重要意義。

相關研究表明:決定中藥寒熱藥性的主要依據是藥效,而藥效的基礎是其所含物質成分[4-12]。因此,中藥的物質成分是產生寒熱藥性的基礎。從中藥的物質成分角度研究中藥寒熱藥性識別主要包含兩方面的內容:一是如何表征中藥的物質成分;二是如何判別中藥的寒熱藥性。近年來,中藥寒熱藥性成為研究熱點[13]。研究者采用中藥物象[14]、中藥無機物質含量[15]、代謝組學[16]、三維熒光光譜[17]、中藥化學指紋圖譜[18-19]和中藥化合物分子描述符[20-22]等方式表征中藥的物質成分,之后通過構建人工智能模型識別中藥的寒熱藥性。薛付忠團隊選用中藥物象屬性表征中藥成分,使用人工神經網絡(Artificial Neural Network,ANN)、主成分-線性判別分析和偏最小二乘模型識別中藥寒熱藥性[23-25]。王振國團隊通過構建支持向量機(Support Vector Machine,SVM)模型研究發現中藥寒熱藥性與無機物質的種類和含量具有相關性[15]。聶斌等[16]采用中藥代謝組學數據表征中藥特征,構建隨機森林模型識別寒熱中藥。Long等[20]、Fu等[21]和 Wei等[22]應用分子描述符表征中藥的化合物成分并構建SVM、K近鄰(k-Nearest Neighbor,KNN)和極限學習機模型識別中藥的寒熱藥性。

筆者所在課題組研究發現中藥化學指紋圖譜可以用于識別中藥寒熱藥性,使用中藥紫外光譜數據結合距離度量算法對中藥寒熱藥性識別進行了嘗試[18-19],但識別效果一般。在此基礎上,本研究采用4種溶劑(無水乙醇、蒸餾水、氯仿、石油醚)提取中藥成分的紫外光譜數據。單溶劑不能提取中藥的全部物質成分,通過多溶劑提取中藥的物質成分更有利于對中藥寒熱藥性進行全面分析。但中藥紫外光譜數據大多具有樣本量偏小、特征偏多等特點,若繼續使用已有研究采用的經典分類器,則識別效果不好。經過大量實驗發現,集成學習算法可以很好地適應中藥紫外光譜數據的特點,已有研究將集成學習算法應用于基于氣味指紋圖譜的中藥鑒定,取得了不錯的效果[26]。本研究將新的集成學習算法引入基于中藥紫外光譜數據的寒熱藥性識別,通過設計大量驗證實驗,從多個方面證實了集成學習算法應用于中藥寒熱藥性識別的可行性。同時,本研究將一種全新的可視化方式引入中藥寒熱藥性研究,通過中藥寒熱特征標記可視化的方式探索了中藥寒熱特征標記與寒熱藥性識別結果的關系。

1 資料與方法

1.1 極端梯度提升(eXtreme Gradient Boosting,XGBoost)算法

與經典分類算法的目標函數只使用損失函數不同,XGBoost[27]算法的目標函數由損失函數和模型復雜度兩部分組成。中藥紫外光譜數據大多具有樣本量偏小等特點,大部分經典分類模型應用于中藥紫外光譜數據時會處于過擬合狀態。模型復雜程度越高,對于訓練集的識別效果越好(偏差小),但對于測試集的識別效果較差(方差大),模型的泛化能力較弱。XGBoost模型的目標函數如下所示,其中,第一部分用于衡量偏差的大小,偏差越大模型的識別效果越差;第二部分用于衡量方差的大小,模型的復雜程度越高,對于訓練集的擬合越好但在測試集上的表現差異大。因此,為了達到模型的整體最優,需要綜合考慮偏差和方差的影響。XGBoost算法在目標函數上的改變使其生成的模型不易發生過擬合,具有更強的泛化能力,可以更好地適應中藥紫外光譜數據的特點。

1.2 SHAP(SHapley Additive exPlanations)算法

SHAP[28-31]是一種模型事后解釋的算法,可以對復雜的機器學習模型的識別結果進行解釋。本研究以61味中藥的紫外光譜數據集作為模型的輸入,模型的輸出為中藥的寒熱藥性。基于XGBoost算法構建的中藥寒熱藥性識別模型在識別準確率方面表現良好,但準確率的提升帶來了可解釋性的下降。由于基于XGBoost算法構建的中藥寒熱藥性識別模型幾乎是一個黑箱模型,導致我們對模型的具體構建過程并不了解,使用傳統的feature importance僅能反映各寒熱特征標記的重要程度,但無法了解各寒熱特征標記與寒熱藥性識別結果的具體聯系。SHAP值的優勢在于,其不僅可以反映各寒熱特征標記對寒熱藥性識別結果的影響程度,而且可以準確指明影響程度的正負性。SHAP值通過量化每個特征標記對模型識別結果所做的貢獻來對模型的識別結果進行解釋。若xi表示第i個樣本,xij表示第i個樣本的第j個特征,yi表示模型對該樣本的識別值,ybase表示模型的基線(通常為所有樣本目標變量的均值),則SHAP值服從以下等式:

其中,f(xij)為xij的SHAP值,f(xik)為第i個樣本的第k個特征標記對最終識別結果yi的貢獻值,f(xik)>0時,表明該特征標記提升了識別值,對識別結果起正向作用;反之,則降低了識別值,對識別結果起反向作用。

1.3 數據來源

本研究選用藥性明確且具有代表性的61味中藥(30味寒性藥,31味熱性藥,如表1所示)。研究分別測量了在不同溶劑(無水乙醇、蒸餾水、氯仿、石油醚)中61味中藥對紫外波長400-190 nm的吸收度。圖1、2分別為寒性中藥薄荷和熱性中藥干姜的紫外吸收度曲線,兩曲線對比結果顯示,寒熱中藥的紫外吸收度曲線在吸收峰的形狀、所在位置及強度上存在一定差異。

表1 研究選用的61味中藥

圖1 薄荷(石油醚溶劑)不同紫外波長吸收度曲線

圖2 干姜(石油醚溶劑)不同紫外波長吸收度曲線

表2 不同溶劑下模型識別的ACC和AUC

1.4 模型設計

本研究的XGBoost模型基于Python語言構建,寒熱特征標記可視化基于SHAP實現。

1.5 模型評價

采用準確率(Accuracy,ACC)和受試者工作特征曲線下方的面積大小(Area Under Curve,AUC)兩種評價指標衡量單溶劑下模型的性能;采用ACC評價指標衡量多溶劑下模型的性能。ACC和AUC值越大,模型性能越好。

圖3 不同溶劑下模型識別的ROC曲線

為了證明本文模型在寒熱藥性識別任務上的優勢,設計對比實驗比較本文模型與已有研究采用的ANN[23]、SVM[15,20]和KNN[21]模型在上述兩種評價指標上的差異。

1.5.1 穩定性評價

本研究采用留一法對模型的穩定性進行評估。留一法使用的訓練集與原始數據集相比只減少了一個樣本,這使得留一法中被實際評估的模型與使用原始數據集訓練出的模型基本相似,評估結果比較準確。就本研究使用的61味中藥紫外光譜數據而言,不同溶劑(無水乙醇、蒸餾水、氯仿、石油醚、多溶劑)下實驗分別重復進行61次,每次留出1味中藥樣本作為測試集,剩余60味中藥樣本作為訓練集。

1.5.2 外推評價

在模型的外推性能評估中,本研究隨機將原始數據集中各約20味寒熱中藥樣本作為訓練集,剩余中藥樣本作為測試集。為了消除分組的偶然性對實驗結果可能造成的偏差,實驗重復進行10次計算平均值和方差。

2 結果

2.1 穩定性比較

不同溶劑(無水乙醇、蒸餾水、氯仿、石油醚)下模型識別的ACC和AUC如表2所示,ROC曲線如圖3所示。實驗結果表明,石油醚溶劑下的紫外光譜數據最適合用于寒熱藥性識別,氯仿、蒸餾水溶劑下的紫外光譜數據在寒熱藥性識別上的表現次之,無水乙醇溶劑下的紫外光譜數據在寒熱藥性識別上的表現較差,在后續多溶劑實驗中,可以考慮只融合石油醚、氯仿和蒸餾水3種溶劑下的紫外光譜數據。

表3 單溶劑多模型穩定性比較結果

表4 多溶劑多模型穩定性比較結果

表5 單溶劑多模型外推比較結果

表6 多溶劑多模型外推比較結果

表7 寒熱藥性總體識別的精確率、召回率和F1值

表8 寒熱藥性總體識別的混淆矩陣

鑒于石油醚溶劑下的紫外光譜數據在寒熱藥性識別上的表現最好,無水乙醇溶劑下的紫外光譜數據在寒熱藥性識別上的表現較差。因此,在設計對比實驗比較4種模型的性能時,單溶劑選取石油醚溶劑下的紫外光譜數據作為原始數據,多溶劑融合石油醚、氯仿和蒸餾水3種溶劑下的紫外光譜數據作為原始數據。本文模型在單溶劑和多溶劑下與ANN、SVM和KNN模型的穩定性表現分別如表3、4所示,實驗結果顯示,本文模型的穩定性優于參與比較的3種模型。

2.2 外推比較

單溶劑和多溶劑下本文模型與ANN、SVM和KNN模型的外推性能表現分別如表5、6所示,實驗結果顯示,本文模型在外推表現上優于參與比較的3種模型。

綜合表3-6的實驗結果可以得出結論:與已有研究采用的經典機器學習模型相比,本文模型在單溶劑和多溶劑下均具有更好的穩定性和外推性能,更加適應中藥寒熱藥性識別任務的需要。

2.3 寒熱藥性總體識別

本研究使用留一法評估模型的總體識別性能,寒熱藥性總體識別ACC為85.2%(52/61),寒熱藥性總體識別的精確率、召回率和F1值(F1值可以看作是精確率和召回率的調和平均數,是一種同時兼顧精確率和召回率的度量方式)如表7所示。表8為寒熱藥性總體識別的混淆矩陣,9味中藥藥性被誤判,側柏、柴胡、金銀花、毛知母、梔子5味寒性中藥被識別為熱性中藥,白芥子、半夏、附子、天南星4味熱性中藥被識別為寒性中藥。通過繪制上述9味藥性被誤判的中藥的紫外吸收度曲線(見圖4),并與兩種典型的寒熱中藥薄荷、干姜的紫外吸收度曲線進行對比,結果顯示,藥性被誤判的9味中藥的紫外吸收度曲線與其相異藥性的中藥的紫外吸收度曲線在吸收峰的形狀、所在位置或強度上存在相似性,這是導致其藥性被誤判的主要原因。

2.4 寒熱特征標記可視化

圖5為61味中藥寒熱特征標記重要性排行。實驗結果顯示,61味中藥在石油醚溶劑下對紫外波長400、301、299、256、267、373、265、226、368和251 nm的吸收度對于其寒熱藥性識別發揮重要作用。從整體角度來看,紫外波長400 nm的吸收度對于61味中藥寒熱藥性識別最重要。

圖4 藥性被誤判的中藥(石油醚溶劑)不同紫外波長吸收度曲線

本研究以寒性中藥薄荷、車前子,熱性中藥白胡椒、蓽茇4種中藥寒熱特征標記可視化的方式進一步分析中藥寒熱特征標記與寒熱藥性識別結果的關系。寒熱特征標記貢獻度為負,則該特征標記對于該味中藥為寒性特征標記;貢獻度為正,則該特征標記為熱性特征標記。貢獻度的絕對值大小表示該特征標記對于寒熱藥性識別結果的影響程度大小,本研究將貢獻度的絕對值大于0.5的特征標記視為重要特征標記。圖6-7分別為寒性中藥薄荷和車前子的寒熱特征標記貢獻度可視化效果圖。圖8-9分別為熱性中藥白胡椒和蓽茇的寒熱特征標記貢獻度可視化效果圖。實驗結果顯示,寒性中藥在紫外波長400和267 nm的吸收度具有相似性,而熱性中藥在紫外波長400、299和301 nm的吸收度具有相似性。

本研究通過單味中藥寒熱特征標記可視化的方式,分析了寒熱中藥在不同紫外波長吸收度上的差異。可視化的結果表明,有相似的紫外光譜的中藥具有相似的藥性。基于筆者所在課題組已有研究得出的結論:中藥的化學指紋圖譜可以有效表征中藥的物質成分。本研究從中藥寒熱特征標記可視化的角度初步證明了:物質成分相似的中藥具有相似的藥性。

3 討論

圖5 寒熱特征標記重要性排行

圖6 薄荷寒熱特征標記貢獻度

圖7 車前子寒熱特征標記貢獻度

圖8 白胡椒寒熱特征標記貢獻度

理論上講,決定中藥寒熱藥性的主要依據是藥效,而藥效的基礎是其所含物質成分,寒性中藥能夠調理熱證,熱性中藥能夠調理寒證,應具有相應的物質基礎[5]。在前期研究中,筆者所在課題組發現中藥的化學指紋圖譜可以用來識別中藥的寒熱藥性。課題組使用距離度量算法對中藥寒熱藥性識別進行了嘗試。由于中藥紫外光譜數據大多具有樣本量偏小、特征偏多等特點,導致經典分類器的識別效果一般。因此,本研究引入新的集成學習算法對中藥紫外光譜數據進行寒熱藥性識別。穩定性評價中,提出的模型在單溶劑下的ACC和AUC分別為0.852、0.865;多溶劑下的ACC為0.770。外推評價中,提出的模型在單溶劑下的ACC和AUC分別為0.810、0.828;多溶劑下的ACC為0.786。經過實驗驗證,提出的模型在單溶劑和多溶劑下均具有更好的穩定性和外推性能。實驗結果表明,新的集成學習算法能夠更好地適應中藥紫外光譜數據的特點,與經典分類器相比,寒熱藥性識別效果更好。從寒熱藥性識別的角度,本研究初步證明了中藥的紫外光譜與中藥的寒熱藥性存在相關性,即有相似的紫外光譜的中藥具有相似的藥性。初步證明了物質成分相似的中藥其藥性是相似的。

圖9 蓽茇寒熱特征標記貢獻度

中藥的寒熱藥性,寒性和熱性是一個相對的概念。每一味中藥都可以看作是一劑復方,無論是寒性中藥還是熱性中藥,其內都同時含有寒性和熱性物質,只是寒熱物質的種類和數量的不同配伍才使中藥表現為寒性和熱性。當寒性物質在種類和數量上占主導地位時,該味中藥表現為寒性;而當熱性物質占主導地位時,該味中藥表現為熱性。本研究將一種全新的可視化方式引入中藥寒熱藥性研究,首先對中藥寒熱特征標記的feature importance進行可視化,從而在整體層面上對決定中藥寒熱藥性的重要特征標記進行初步的認識。然后以寒性中藥薄荷、車前子,熱性中藥白胡椒、蓽茇4種中藥為例,對單味中藥寒熱特征標記進行可視化表達,直觀地展示了各寒熱特征標記對最終寒熱藥性識別結果的貢獻度。可視化結果表明,寒性中藥在紫外波長400和267 nm的吸收度具有相似性,而熱性中藥在紫外波長400、299和301 nm的吸收度具有相似性。從中藥寒熱特征標記可視化的角度,本研究進一步證明了相同藥性的中藥的紫外光譜具有相似性。進一步證明了如果中藥的物質成分是相似的,那么藥性是相似的。

4 結論

在本研究中,我們建立了一個基于集成學習的中藥寒熱藥性識別方案。該方案通過多溶劑下的中藥紫外光譜數據表征中藥的物質成分,采用集成學習模型對中藥紫外光譜數據進行寒熱藥性識別。穩定性和外推實驗結果表明,本文模型能夠更好地適應中藥紫外光譜數據的特點,穩定性和外推性能均顯著優于經典模型,在寒熱藥性識別上具有更高的識別準確率。本研究還通過中藥寒熱特征標記可視化的方式進一步分析中藥寒熱特征標記與寒熱藥性識別結果的關系。可視化的結果表明,相同藥性的中藥的紫外光譜具有相似性。中藥寒熱藥性識別和寒熱特征標記可視化的結果初步證明,物質成分相似的中藥具有相似的藥性。

猜你喜歡
可視化中藥特征
基于CiteSpace的足三里穴研究可視化分析
基于Power BI的油田注水運行動態分析與可視化展示
云南化工(2021年8期)2021-12-21 06:37:54
中藥久煎不能代替二次煎煮
中老年保健(2021年4期)2021-12-01 11:19:40
您知道嗎,沉香也是一味中藥
中老年保健(2021年4期)2021-08-22 07:08:32
中醫,不僅僅有中藥
金橋(2020年7期)2020-08-13 03:07:00
基于CGAL和OpenGL的海底地形三維可視化
如何表達“特征”
“融評”:黨媒評論的可視化創新
傳媒評論(2019年4期)2019-07-13 05:49:14
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
中藥貼敷治療足跟痛
基層中醫藥(2018年6期)2018-08-29 01:20:20
主站蜘蛛池模板: 狠狠五月天中文字幕| 国产精女同一区二区三区久| 97人妻精品专区久久久久| 国产精品视屏| 在线毛片网站| 极品国产在线| 中字无码av在线电影| 色综合中文| 亚洲天堂首页| 日韩高清成人| 再看日本中文字幕在线观看| 大乳丰满人妻中文字幕日本| 中文毛片无遮挡播放免费| 亚洲成a人在线观看| 国产精品嫩草影院视频| 亚洲国内精品自在自线官| 99热最新在线| 国产成人AV男人的天堂| 亚洲国产AV无码综合原创| 麻豆国产精品| 91精品啪在线观看国产| 成人国产小视频| 国产尤物视频在线| 99精品国产自在现线观看| 日韩第一页在线| 国产亚洲第一页| 精品久久久久久久久久久| 欧美区国产区| 99人妻碰碰碰久久久久禁片| 熟女成人国产精品视频| 亚洲色欲色欲www在线观看| 国产91麻豆免费观看| 99激情网| 综合网天天| 婷婷综合在线观看丁香| 欧美日韩专区| 久久国产成人精品国产成人亚洲 | 国产精品视频白浆免费视频| 国产va在线| 91精品啪在线观看国产91| 国产 在线视频无码| 99re免费视频| 国产香蕉国产精品偷在线观看| 亚洲第一黄色网址| 欧美日韩国产综合视频在线观看| 欧美在线中文字幕| 毛片在线看网站| 国产迷奸在线看| 欧美国产日韩在线观看| 久久www视频| 色婷婷色丁香| 色亚洲激情综合精品无码视频| 国产天天色| 18禁色诱爆乳网站| 日韩av无码DVD| 国产第一色| 亚洲精品大秀视频| 尤物精品视频一区二区三区| 老色鬼欧美精品| 欧美成人一区午夜福利在线| 国产91小视频在线观看| 亚洲国产精品日韩欧美一区| 久久综合伊人77777| 四虎免费视频网站| 午夜丁香婷婷| 狠狠躁天天躁夜夜躁婷婷| 国产成人综合亚洲欧美在| 中文无码精品a∨在线观看| 国产一区在线观看无码| 中国黄色一级视频| 在线视频亚洲色图| 免费精品一区二区h| 精品视频第一页| 全部毛片免费看| 国产91色| 538国产在线| 青草视频免费在线观看| 福利片91| 国产一级毛片网站| 亚洲精品老司机| 国产在线视频导航| 免费jjzz在在线播放国产|