楊 濤,吳承玉
(南京中醫藥大學基礎醫學院,南京 210023)
吳承玉教授經過數十年的研究與實踐,提出五臟系統辨證體系[1],研究由單一病位與單一病性構成的基礎證,將其有機組合后可以執簡馭繁地把握靈活多變、動態的證。由于病位、病性特征與基礎證之間具有非線性、復雜性等特征,較難建立規范、準確的數學模型,給病證規范化及診斷信息化帶來了障礙。
人工神經網絡(Artificial Neural Network,ANN)是一種應用類似于大腦神經突觸連接的結構進行信息處理的數學模型[2]。誤差反向傳播(Back-Propagation,BP)神經網絡是ANN中應用最為廣泛的1種模型,它是由非線性變換單元組成的前饋網絡,通過對輸入輸出樣本的自動學習,能夠以任意精度逼近任意復雜的非線性映射。BP神經網絡的這一特性使其可以作為多維非線性函數的通用數學模型。因此,本文從心系入手,利用BP神經網絡建立心系基礎證診斷模型,用以模擬心系病位、病性特征與基礎證之間的非線性映射。
項目團隊在開展心系基礎證[3]的研究中,通過文獻調研、流行病學調查及專家咨詢等方法,確定了心系基礎證8類,心系病位、病性特征125個。搜集江蘇省中醫院病案室2000年至2010年存檔的心系病證的病案1394份,古今醫案及臨床報道的典型病案347份,合計1741份。由于病案資料在各類心系基礎證[4]上分布不均勻,因此本研究分層隨機抽取屬于心氣虛證、心血虛證、心陰虛證、心陽虛證、心血瘀阻證、心火亢盛證、痰蒙心神證、瘀阻腦絡證的病案資料各50份,合計400份,復合證(多個基礎證組合構成)病案資料100份,共計500份。
心系病位、病性特征涉及125個癥狀,將每個癥狀用1個二進制位標識,有該癥狀則對應的二進制位為1,沒有則為0。將500份病案資料整理成如表1所示的形式。

表1 病位特征編碼
表2顯示,將每個基礎證作為一個屬性,用1個二進制位標識,有該基礎證則標為1,沒有則為0。
利用MATLAB 7.11構建BP神經網絡模型(見圖1),輸入層125個節點,對應125個心系病位、病性特征;隱含層18個節點(通過比較不同節點下的網絡誤差,發現當隱含層節點數為18時,網絡誤差最小);輸出層8個節點,對應8個基礎證。傳遞函數選擇對數函數“logsig”,訓練函數選擇共軛梯度算法“trainscg”,最大訓練次數 3000次,最小梯度0.02。從500份病案中隨機抽取400例作為訓練樣本,100例病案作為測試樣本。
圖2顯示,在BP神經網絡的訓練過程中輸出的平均方差逐漸減小,經過2224次迭代計算,達到設定的誤差限度。此時,心系基礎證診斷模型初步建立,再利用100例病案數據進行測試。

表2 基礎證編碼

圖1 “心系病位、病性特征”→“基礎證”的神經網絡模型

圖2 網絡的性能曲線(訓練函數trainscg)
模型預測值與實際值之間存在多種形式(見圖3),不能將“正確率”作為單一的模型評價標準,還應該有漏判率和誤判率。利用訓練后的網絡模型對100例樣本進行分析(預測結果見表3)。

圖3 基礎證判斷

表3 神經網絡模型各項指標
模型對每個基礎證的診斷正確率都在84.00%以上,平均診斷正確率達90.63%,誤判率4.50%,漏判率4.88%。對于最終“證”的判定需要綜合每個基礎證的判定結果,如病人既有“心氣虛”也有“心陰虛”的表現,則模型診斷結果應為10100000(“心氣虛證”兼“心陰虛證”,即心氣陰兩虛證)才能判為正確。本實驗模型對100例病案資料的“證”的診斷正確率為73.00%。
臨床癥狀與證之間沒有明確的函數關系,只有通過對大量文獻及臨床流行病學調查的病案資料進行數據挖掘,客觀尋找它們之間的內在關系。本文利用MATLAB神經網絡工具箱,建立心系基礎證BP神經網絡診斷模型,通過樣本測試驗證了心系基礎證診斷模型的有效性。從檢驗結果可以看出,一是模型對基礎證的診斷正確率較高,而對最終“證”的診斷正確率不高。臨床上基礎證相對少見,而復合證多見,復合證的診斷建立在正確診斷基礎證的前提上。因此,要進一步提高基礎證的診斷正確率,進而提高復合證的診斷正確率;二是125個心系病位、病性特征作為輸入變量,部分變量相互耦合關聯,造成神經網絡的過擬合,耗費時間處理冗余數據,影響模型精度。因此,要進一步開展心系病位、病性特征與基礎證的相關性研究,找出最能反映與基礎證特點的病位、病性特征參與建模。
本文利用MATLAB神經網絡工具箱,初步構建了心系基礎證BP神經網絡診斷模型,經過樣本測試證明,利用BP神經網絡可以較好地模擬心系病位、病性特征與基礎證的多元非線性的復雜映射關系,模型對基礎證的診斷正確率較高,但對最終“證”的診斷正確率有待進一步提高。在后續的研究中,要進一步提煉心系病位及病性特征,同時要積極探尋ANN的優化算法,從而提高模型的診斷正確率及工作效率。本文的研究思路可以進一步應用于五臟系統診斷模型的研究中,為病證規范化、診斷信息化提供方法學參考。
[1]吳承玉,徐征,駱文斌,等.五臟系統病位特征與基礎證的研究[J].南京中醫藥大學學報,2011,27(3):201-203.
[2]傅薈璇,趙紅.MATLAB神經網絡應用設計[M].北京:機械工業出版社,2010:28-29.
[3]丁以艷.心系病位特征及基礎證的研究[D].南京:南京中醫藥大學,2012:18-23.
[4]吳承玉,丁以艷,吳承艷,等.心系病位特征與基礎證的研究[J].南京中醫藥大學學報,2012,28(1):1-2.