劉莉萍 章新友 郭永坤


摘 要:基于BP神經網絡構建76味補虛藥分類模型。采用數據挖掘方法挖掘補虛藥藥效,利用Python語言實現BP神經網絡,并構建藥效分類模型及其應用。對12味補虛藥進行測試,其中有10味預測結果正確,正確率為83.33%。通過藥性分布可知,補虛藥的主要特征為溫、甘,歸經為脾、腎、心經。采用中藥性味歸經為特征對中藥分類進行預測,實驗結果表明,基于BP神經網絡的藥效分類模型具有一定的可靠性和準確性,亦為中藥分類方法研究提供了借鑒。
關鍵詞:中藥藥性;功效分類;BP神經網絡
DOI:10. 11907/rjdk. 182484
中圖分類號:TP301
文獻標識碼:A文章編號:1672-7800(2019)006-0006-04
Abstract: Based on the BP neural network, a classification model of 76 flavored drugs was established. Data mining method was used to mine the efficacy of tonic drugs, and BP neural network was used to construct the pharmacodynamic classification model and its application. 10 of the 12 flavours were tested correctly with a correct rate of 83.33%. Through the distribution of drug, we can see that the main characteristics of reinforcing deficiency medicine are warm and sweet, and the meridian is the spleen, kidney and heart meridian. In this study, the characteristics of flavor meridian of traditional Chinese medicine were used to predict the classification of traditional Chinese medicine. The experimental results show that ?the classification model based on BP neural network has certain reliability and accuracy, and provides a reference for the study of traditional Chinese medicine classification methods.
Key Words: properties of traditional Chinese medicine; efficacy classification; BP neural network
0 引言
中藥藥性理論是先輩們在長期行醫實踐中總結提煉出來的中藥學理論,藥效是根據中醫藥理論對藥物治療作用的高度概括,兩者都是中藥理論的重要組成部分[1]。歷代醫家均強調“藥性互參”、“性效結合”的中醫學整體觀[2],“中藥藥性—功效”共同構成一個有機整體。隨著計算機技術的發展,利用數據挖掘方法研究中藥性效規律,闡述中醫藥疾病治療機理,有助于揭示現代中醫藥的科學本質內涵,為中醫藥國際化提供有效的理論支持。
人工神經網絡具有自學習、自適應功能特征,能夠很好地處理非線性數據,恰好對應于中藥數據的非線性、高維度等特征,近年來被廣泛應用于中藥領域[3]。相翠玉等[4]將近紅外漫反射光譜分析技術與人工神經網絡方法相結合,對不同產地的大黃進行識別,識別正確率可達95%;劉星等[5]以不同產地和品種的薏仁近紅外光譜數據作為研究對象,采用學習向量化神經網絡建立薏仁分類識別模型,預測準確率可達90%以上;王麗瓊等[6]利用麻黃藥材HPLC指紋圖譜信息建立BP-ANN模型,對不同產地的麻黃進行分類,該模型對不同種類及產地麻黃藥材的預測準確率達到94.4%;湯彥豐等[7]采用傅里葉紅外光譜掃描 42種紫花地丁樣品,利用徑向基神經網絡建立分類模型對野生紫花地丁與栽培紫花地丁進行鑒別,識別正確率達到95.24%。由此可見,人工神經網絡在中藥領域的研究已取得較好效果。因此,本文采用BP神經網絡構建補虛藥藥效分類預測模型,以常用76味補虛藥的性味歸經為研究對象,并利用Python語言實現對中藥藥效的智能預測。
1 中藥四氣五味與歸經
《神農本草經》序例云“藥有酸咸甘苦辛五味,又有寒熱溫涼四氣[8]。”每味中藥都有四氣、五味的不同,因而可發揮不同治療作用。歷代本草在討論藥物功用時,首先標明其“氣”和“味”,可見氣與味是識別各種藥物性能的重要標志之一。
四氣,又稱為四性,指寒熱溫涼4種不同藥性,它反映藥物對人體陰陽盛衰和寒熱變化的作用傾向,是藥性理論的重要組成部分[9]。四氣之中寒涼與溫熱是相對立的兩種藥性,其中寒與涼、溫與熱之間僅有程度上的不同,即“涼次于寒”、“溫次于熱”。有些書籍甚至進一步用“大寒”、“大熱”、“微酸”、“微苦”對中藥四氣進行描述,然而其從本質而言,只有寒熱兩性的區分[4]。四性之外還有一類平性藥,如甘草、山藥、黨參等,這類藥物藥性寒熱界限不太明顯,且藥性平和、作用緩和,因此對于平性是否入性,醫家對此也有不同看法[10]。
五味,即酸、苦、甘、辛、咸5種不同藥味,有些還具有淡味或澀味,所以實際上不止5種藥味,但此5種是最基本的藥味。五味最初是通過人品嘗得到的,但在長期實踐過程中發現,五味不僅是藥物味道的反映,更是對藥物作用的高度概括[11]。五味也具有陰陽五行的屬性,即“辛甘發散為陽,酸苦涌泄為陰,咸味涌泄為陰,淡味滲泄為陽”。酸味屬木、苦味屬火、甘味屬土、辛味屬金、咸味屬水。
歸經表示藥物作用部位,即某藥對某些臟腑經絡有特殊的親和作用,因此該藥對相關部位的病變起著主要治療作用。藥物歸經不同,治療作用也不同[12],掌握中藥歸經理論,可以有效提高用藥準確性。中藥歸經理論是在中醫基本理論指導下,以臟腑經絡學說為基礎、以藥物治療具體病證為依據,從長期臨床實踐中歸納總結出來的。由于經絡能溝通人體內外表里,體表病變可通過經絡影響到內在臟腑,反之,內在臟腑病變也可反映于體表上。
2 BP神經網絡原理與訓練過程
2.1 BP神經網絡基本原理
BP(Back Propagation)神經網絡是1986年由Rumelhart&McClelland等科學家提出的概念,是一種按照誤差逆向傳播算法訓練的多層前饋神經網絡,也是目前應用最廣泛的神經網絡[13]。BP神經網絡主要分為輸入層、隱含層和輸出層,其結構如圖1所示。輸入層是指輸入數據集構成的向量集合,其輸出是輸入層及權值點積與激活函數的計算結果;隱含層可以是一層,也可以是多層,一般不超過兩層,其輸入是上一層輸出層與權重的點積標量,輸出是該標量與激活函數計算結果;輸出層只有一層,其輸入是上一層輸出層與權重的點積。輸出層計算與隱含層相同,計算結果是最終預期的分類權值。
BP神經網絡訓練分為兩步:一是根據當前參數值,計算前項傳播過程中每一層的輸出值;二是根據實際輸出與期望輸出之間的差,反向傳播計算每一層的誤差傳播項,結合每一層輸出關于該層參數的偏導數,實現每一層參數的更新。重復以上兩步,直至該過程收斂。
2.2 BP神經網絡訓練過程
BP神經網絡訓練包括3個階段:正向傳播過程、期望與實際分類誤差計算與反向傳播過程計算。
3 BP神經網絡模型構建及應用
3.1 中藥藥性指標量化處理
本文以全國高等中醫藥院校規劃教材《中藥學》(第四版)的76味補虛藥為樣本數據進行研究[11]。本文模型主要考慮中藥的四氣、五味和歸經,總共22種屬性與中藥藥效之間的關系,但由于采用數學方法對中藥性味歸經與藥效關系進行研究,所以需要對中藥藥性特征進行數值化處理。本文采用二值量化方法對藥性進行特征處理。例如,中藥的四氣屬性“寒、熱、溫、涼”,每味中藥具有哪項特征,則將其記為1,否則為0。同理,對中藥的五味、歸經和補益類4個功效即補氣、補陽、補血、補陰也進行二值量化處理,得到部分量化結果如表1所示。
3.2 補虛藥BP神經網絡構建與應用
Python是最近十分流行的一款編程軟件,由于其擁有豐富的擴展類庫,并具有簡單、易學、速度快等特點,在數據挖掘領域的應用越來越廣泛。本文利用Python的numpy庫構建BP神經網絡模型[12]。首先,確定輸入層、隱含層與輸出層神經元數目。根據中藥藥性的四氣、五味和歸經情況,本文選取22個參數作為神經網絡輸入單元,將補益類中藥的4種功效即補氣、補陽、補血和補陰4個參數作為輸出單元,輸出范圍取0~1。根據文獻[14]-[18],經綜合考慮,將本模型隱含層確定為1層,隱含層神經元數目跟據經驗公式進行確定,最終確定隱含層神經元數目為44層;其次,建立補虛藥藥效的BP神經網絡數學模型,并進行訓練與測試。根據確定的輸入層、隱含層和輸出層神經元數目以及隱含層數目,本文建立一個輸入節點為22、隱含節點為44、輸出節點為4的三層BP神經網絡。激活函數采用常用的S型函數Sigmoid,因為其能較好地反映人工神經網絡的輸入輸出特性。本模型在納入的76味中藥中,隨機抽取64味中藥作為訓練數據,剩余12組樣本作為測試數據。
3.3 補虛藥BP神經網絡測試結果
經過1 000次迭代運算之后,權重誤差達到最優,得到實際輸出結果如表2所示,測試樣本期望輸出與實際輸出的正確率比較如表3所示。根據表3結果可看出模型正確率高達83.33%,效果較好。
4 總結與展望
研究結果表明,在測試集12個中藥功效預測對應的48個數據中,只有2個數據錯誤,預測準確率高達83.33%,表明本模型在中藥功效分類預測應用中具有一定實用價值,并可將其推廣到中藥性效研究中。本模型研究中藥四氣五味與中藥性效之間的關系,采用數據集為補虛類中藥,其中大部分補虛類中藥性溫、甘,歸肝、脾、腎、肺、心經,導致數據集具有很強的相似性,要求在模型參數設置上更加精確。而且中藥性效與中藥各成分關系之間是非線性的,作用機制十分復雜,采用傳統研究方法難以做到全面分析。人工神經網絡具有很強的自學習能力、自適應能力及針對非線性關系的處理能力,因此利用BP神經網絡對中藥性效進行系統研究是行之有效的。
由于中藥成分與功效的復雜性,下一步研究將會考慮更多自變量因素,以提高模型分類準確性。例如:中藥除四氣五味歸經外,還會受到毒性等因素影響,在四氣五味中,“寒”還可細分為“大寒”和“小寒”,而本模型將其統一劃分為寒。此外,本模型采用的數據量子化方法應實現自動量子化,將有利于對較大數據集的處理。因此,在今后研究中可采用更快捷的量子化處理方法,同時擴大訓練數據集種類,以提高模型穩定性,并促進本模型在中醫藥研究領域得到更加廣泛的應用。
參考文獻:
[1] 李揚,馮旭,宋舸,等. 中藥藥性的研究方法進展[J]. 醫學信息,2018,31(13):38-40.
[2] 毛德西. ?中醫整體觀有三論[N]. 中國中醫藥報,2017-10-25(4).
[3] 周榮榮,閆潤紅,王麗萍,等. 數據挖掘技術在中醫方劑科學問題研究中的應用[J]. 中華中醫藥雜志,2018,33(9):4016-4020.
[4] 相翠玉,宋曉勇. 中草藥大黃的近紅外光譜和人工神經網絡鑒別分析[J]. 時珍國醫國藥,2012,12(3):3168-3169.
[5] 劉星,毛丹卓,王正武,等. 薏仁種類的近紅外光譜技術快速鑒別[J]. 光譜學與光譜分析,2014,34 (5):1259-1263.
[6] 王麗瓊,范琦,易珍奎,等. HPLC指紋圖譜結合反向傳播人工神經網絡和判別分析鑒定不同的麻黃藥材[J]. 西南師范大學學報:自然科學版,2012,37(5):73-77.
[7] 湯彥豐,候占忠,王志寶,等. 紫花地丁的紅外光譜和徑向基神經網絡鑒別[J]. 湖北農業學,2014,53(1):132-134.
[8] 李味味,章新友,仵倚,等. 基于BP神經網絡中藥復方功效的預測研究[J]. 中醫藥導報,2016,22(16):38-41.
[9] 王建,曾南,夏厚林,等. 中藥藥性理論研究模式的新思路[J]. 中醫雜志,2013,54(2):99-102.
[10] 金銳,張冰. 中藥藥性理論復雜性特征分析[J]. 中國中藥雜志,2012,37(21):3340-3343.
[11] 陳素紅,呂圭源. “性、味結合歸經”層面研究中藥藥性[J]. 中藥藥理與臨床,2008(4):58-62.
[12] 肖小河. 中藥藥性研究概論[J]. 中草藥,2008(4):481-484.
[13] 王振國. 中藥藥性理論現代研究:問題、思路與方法[J]. 山東中醫藥大學學報,2011,35(3):195-198.
[14] 鐘贛生. 中藥學[M]. 北京:中國中醫藥出版社,2016.
[15] SHEN X, WANG L, HAN D. Application of BP neural network optimized by artificial bee colony in intrusion detection[J]. Computer Engineering, 2016(2):190-194.
[16] DAS H,JENA A K,NAYAK J, et al. A novel PSO based back propagation learning-MLP (PSO-BP-MLP) for classification[M]. India:Springer,2015:333-344.
[17] NIE P L, FEI D, WANG H J, et al. Short-term power load forecasting based on EMD-BP neural network[J]. Control & Instruments in Chemical Industry, 2016.
[18] ZHAO Z,XU Q,JIA M. Improved shuffled frog leaping algorithm-based BP neural network and its application in bearing early fault diagnosis[J]. Neural Computing & Applications, 2016, 27(2):375-385.
(責任編輯:黃 健)