王 謙 吳宏妍 彭文文 翟麗萍 莊延雙 谷 鑫 周袁媛
(1.南京中醫藥大學翰林學院醫學院,江蘇 泰州,225300;2.泰州市中醫院內分泌科,江蘇 泰州,225300;3.南京中醫藥大學中醫學院 中西醫結合學院,江蘇 南京,210000)
人工智能技術在中醫診斷領域的應用主要包括智能辨證系統和智能診療技術如脈診儀、舌診儀、面診儀等兩大類。人工智能技術誕生于上世紀50年代,在中醫領域得到了較早應用[1]。經過幾十年的發展與研究,人工智能技術雖然已經取得了一定成果,但是人工智能目前在中醫診斷領域的研究仍然存在較大的發展瓶頸,這些瓶頸嚴重制約著中醫診斷現代化研究的發展。
筆者認為造成這些發展瓶頸的關鍵在于,研究者們只是單一地追求技術層面的研究,研究思路忽略了中醫學本身的思維方式,忽略了中醫哲學方法論對于智能化中醫診斷研究的重要指導意義。中國哲學為中醫學理論和概念背后的邏輯關系作出了指引,通過哲學的思辨關系,指導著辨證論治的思維與方法[2]。中國古代哲學思想原創于中華民族,先秦諸子、百家爭鳴,中國古代哲學思想不斷發展歷練的過程也是其不斷促進中醫學孕育、形成和發展的歷程,對中醫理論體系的構建、中醫學方法論的形成具有舉足輕重的意義[3]。中醫學既屬于科學的范疇,同時又是在哲學思想指導下建立了自身的理論體系,中醫理論中蘊含著豐富的哲學智慧,尤其是中醫的方法論極為重要。中醫方法論是在紛雜的事物和現象中尋找共性,把復雜的事物凝練并高度抽象為某種模型,將復雜的問題簡單化從而解決實際問題,如藏象模型、六經模型、衛氣營血模型、三焦模型等,都體現了這種方法論。這些方法論在中醫實際診療疾病時都發揮著重要的作用,在進行望聞問切的四診過程中無不體現著中醫的這種方法論。《道德經》曰:“有道無術,術尚可求,有術無道,止于術?!敝悄芗夹g在中醫診斷領域的研究不能僅僅停留在“術”的層面,要在中醫哲學方法論的指導下進行研究,才有可能實現真正的技術突破。本文從人工智能應用中醫診斷的發展瓶頸、問題分析、解決方法等幾個方面來論述如何運用中醫方法論來指導人工智能在中醫診斷領域的發展。現闡述如下。
從上世紀70年代至今,大批的中醫智能診斷研究雖取得了一定的成果。如北京中醫醫院的關幼波與電子計算機室的科研人員,根據自己的辨證施治經驗,研發出肝病診療程序,在國內率先把中醫學與電子計算機技術結合起來,開創了我國第一個醫學專家系統[4]。丁亮等的976例基于深度神經網絡的原發性肝癌模型,成功將原發性肝癌證型進行分類,其診斷的成功率達到82.8%[5]。蘇翀等基于決策樹算法的230例慢性阻塞性肺病模型也初步建立,對慢性阻塞性肺病的辨證準確率超過90%[6]。張啟明應用Logistic回歸分析分別對心病、肺病等進行了建模,實現了上述疾病的辨證分型[7-8]。
總體來說,智能辨證系統取得了一定的成果,但目前在發展過程中仍然存在著問題,主要表現在如下方面。①病種單一:目前臨床能實際運用的中醫智能辨證系統仍然只是應對單獨的疾病,或者某一類??萍膊。嗅t智能辨證系統的運用呈現出病種單一,研究團隊單打獨斗的局面,臨床至今難以出現一款綜合的、具有普適性的適合大多數疾病的中醫智能辨證系統。②診斷結果可信度不高:目前已面世的很多智能系統往往存在著四診數據量小、系統分析推理方法不統一等問題,導致智能診斷結果解釋性一般,不同的診斷軟件,其診斷結果不統一,因此診斷結果令臨床醫者和患者存疑,其可靠性和臨床信任度有待進一步提高??傊?,在臨床實際運用智能辨證軟件時,一是系統針對病種單一,中醫師選擇局限性較大,只能小范圍使用;二是這些智能辨證系統軟件不被信任,造成智能辨證系統臨床實際的使用率仍然較低,臨床實用性價值不高。
智能診療技術如脈診儀、舌診儀等主要智能診斷方法歷經幾十年的研究,取得了較多的成果,但脈診儀、舌診儀的研究在一些關鍵技術上仍然很難突破。如脈象儀的研究總體尚處于實驗探索階段,需進一步深入研究[9]。目前依然存在著很多問題,如運用單一技術采集的脈象信息獲得的脈搏信息比較簡單,沒有太多分析價值。而多種技術協同采集的結果,往往是不同的技術采集的脈搏信息之間差異性大,得不出一致的結論,缺乏統一性。舌診儀技術相對于脈診儀簡單,發展的較迅速,在市面上也出現了很多的舌診儀軟件和型號,但是這些舌診儀的診斷標準不一,診斷技術不同,診斷結果無法統一,難以形成規律性。同時,舌診、脈診還共同存在著一個最主要的問題,也是最核心的問題,舌象、脈象的中醫診斷尚未形成一個公認和統一的標準。不同的舌象、脈象代表的臨床意義至今無法統一,這給智能舌診、脈診技術制定技術參數帶來了巨大的困難,只有技術參數確定了才能利用現代技術實現對上述指標的規?;?、標準化采集。種種原因造成了脈診儀、舌診儀技術發展目前仍然處于十分緩慢且短時間內難以突破技術難關的狀態,至今沒有規律性的可供臨床參考的脈診、舌診數據。因此,總體上,智能診療技術雖經過了幾十年的發展,但仍然處于無法真正投入使用的局面。
上文已述,無論是智能中醫辨證系統,還是脈診儀、舌診儀等智能診療技術,它們的研究都離不開大量的標準數據的收集作為支撐,從理論上講,這種標準數據量越大,構建的辨證模型準確性越高。建立一個具有大數據并具有安全性的資源共享平臺,能夠顯著提高相關研究成果的準確性以及在臨床使用的可行性[10]。但是這種標準數據的收集存在著收集難度大且難以克服的現實問題,這是制約人工智能在中醫診斷領域發展的關鍵問題所在。
中醫四診的數據主要來源于專家本人經驗和他人病案收集(包括中醫古籍醫案及當代臨床病案),這兩種也都各自存在著局限性。 ①專家經驗由于是專家第一手資料,一般來說相對真實。同時,專家經驗已經得到臨床驗證,辨證過程和邏輯推理都比較準確可靠,因此基于專家經驗的智能辨證系統準確率比較高。但存在的問題是專家的經驗往往局限于某種疾病或專科疾病,受于專家人力精力限制以及專家團隊的大小等因素,能收集的專家病案數量也有限。同時由于專家專業不同、資料隱私性等因素,不同研究團隊之間也很難共享資料和形成有效的合作。因此,基于專家經驗的智能辨證系統往往只能應對一種或者幾種??萍膊?,這種系統雖然準確率較高,受用面卻十分狹窄。②在中醫醫案數據庫的建設過程中,數據的完備性是必須要考慮的問題,這是保證醫案數據庫客觀性的基礎[11]。除了專家經驗之外,其他的數據只能依托古籍醫案或者當今臨床病案的收集,但這兩種方法同樣存在著較大的問題。古籍醫案年代久遠,病案可能存在著記錄錯誤或者篡改,病案的真實性、可靠性往往無法考證。同時,古代醫案記載四診信息不全,不同醫家對四診重視程度不同,因此很多古代醫案往往只有四診中的一部分信息,甚至有些醫案只有只言片語,或者很多病案中的四診信息不確定,不統一,甚至互相矛盾。當今臨床病案在收集上同樣面臨著四診信息準確性很難考證的問題。因此,限于信息采集者中醫理論功底與臨床四診水平等不同,在信息采集時,對四診數據的“修飾”處理能力不足,得到的四診數據往往存在著較多的失真現象,而這種失真現象一旦出現,收集數據這一關鍵步驟便會出現偏差。規范化、數字化、客觀化地進行臨床診斷信息采集是實現多診合參客觀化的前提與重要基礎[12]。所以,目前智能中醫辨證系統比較依賴大量的臨床四診數據來建立系統辨證推理模型,而這關鍵的收集臨床四診數據一步卻又面臨著很大的困難。四診數據難以收集,數據真實性存疑,篩選病案、去偽存真的中醫人才缺乏都有可能成為限制智能辨證系統往前發展的現實問題,而這些問題短時間內也沒有切實可行的解決辦法。
主要智能診療技術如脈診儀、舌診儀等獲得有效的標準數據主要是來源于研究團隊的現場采集,而現場采集有效的診療信息無論是脈診儀還是舌診儀都面臨著巨大的困難,主要的困難還是在技術層面上難以深入開展。脈診儀、舌診儀的研究,雖然經歷了幾十年的研究,但依然難以形成技術上大的突破和進展。筆者認為主要在于中醫脈診、舌診理論的復雜性,如上文所述,舌象、脈象的中醫診斷由于其復雜性,很難形成一個公認或統一的標準。這給智能舌診、脈診技術制定技術參數帶來了巨大的困難。比如脈診常見的脈象雖然主要有28種,但是實際上臨床遠遠不止,28種脈中很多只是比較基礎的單一脈象,臨床觀察脈象往往是從多個角度,實際的脈象往往是多種脈象混雜在一起的復合脈象。同樣一個弦脈,按照力量大小來說,可以是弦而有力,也可以是弦而無力,即使有力或者無力之間仍然有差別,脈搏的力量受到年齡、性別、體質等多方面因素影響,相同的力量對不同的人意義則不同。再者,按照跳動的流利度來說,弦脈可以是弦中帶滑,也可能是弦中帶澀,甚至是弦中帶滑和澀同時出現。而且脈診還不止力量、流利度這些觀察點,還有脈率、脈位、脈寬、脈長、節律等,按照排列組合原理來分類,脈象會非常的復雜多樣。而且中醫脈診分為三部九侯,寸、關、尺三部每一部都可有不同的脈象,而且每一部的浮、中、沉也會不同。按照這樣計算,則在研究脈診儀的過程中,需要采集的脈象信號便極其復雜,這給臨床實際脈診數據采集帶來了極大的困難。舌診的研究同樣如此,現實中沒有完全一樣的舌形、舌色、舌苔等,比如同樣是紅舌,色差是有區別的,色度是不同的。病例越多,這些差別就會越復雜。因此無論脈診還是舌診,要采集完整的有可能遇到的數據非常困難。而這個采集數據的問題不解決,那么脈診、舌診的數據的不規律性和可信度的問題便一直存在。
人的認識能力是隨著人類實踐活動逐步提高的,人類理性在我們與世界打交道的過程中表現為一種不斷的、無限的成長過程[13]。筆者認為,人工智能在中醫診斷的研究要想取得大的進展,就需要改變思維方式,而不是一味地追求“術”,要在“道”的指導下進行,否則只會求術而不得。在追求技術層面的進步時,不能忽略方法論的作用。沒有正確的方法論,沒有正確的思維方式,往往會走向研究的死胡同。馬克思主義哲學認為,世界是可知的,但誰也無法把世界認識清楚?,F象的發生都不是簡單的,也不是容易被認識的。任何事物和現象的研究,往往最終會復雜化。但是馬克思主義哲學的唯物論和辯證法同時認為,復雜和簡單是一對矛盾,他們之間有著辨證的關系。研究事物既要從簡單化到復雜化,又要從復雜的現象里抽離出來,找出事物的共性,把復雜的問題高度抽象,從宏觀層面看待問題。研究問題也不是一開始便復雜化,要由易到難,由淺入深,最后達到認識復雜性現象本質的目的。而把復雜的問題高度抽象,變得簡單化,執簡馭繁正是中醫最具特色的方法論。因此要想實現中醫診斷智能化的技術突破,是否可以嘗試改變研究思維方式,運用中醫方法論來解決這個問題。
中醫方法論強調執簡馭繁,疾病是復雜的,多變的,但證型是相對簡單的、固定的。朱文鋒教授提出“證素辨證學”,采用“根據證候、辨別證素、組成證名”的辨證原則,無論什么病,只要知道了證素,就可以得出相應的證型。吳承玉教授的“藏象辨證學”也是對中醫辨證理論統一的重要嘗試。藏象辨證學以五臟系統為病位核心,將多種辨證方法納入到藏象辨證體系中,把所有的疾病統歸于五臟的辨證體系,把疾病劃分為五類,每類再具體分證型,只要出現必要的主癥,就可以辨出對應的中醫證型,把復雜的臨床疾病體系變得相對簡單[14]。如過去研究的哮喘和肺炎的智能中醫辨證模型,兩者只能單獨使用,而兩套系統之間并不能兼容。但如果運用藏象辨證或者六經辨證就可以統一兩者,哮喘和肺炎都可以歸到五臟的肺系統,當出現惡寒、無汗、發熱、喘咳等癥狀時,都可以辨證為藏象辨證理論的風寒犯肺證或者六經辨證太陽病的麻黃湯證。不論何種疾病,都可以在一種智能辨證系統里進行辨證,這樣才有希望出現一款適用性較高的智能中醫診斷系統,智能診斷系統在臨床才有可能大幅度擴大使用范圍。
前文已述,中醫脈診、舌診理論極其復雜,很難形成一個公認或統一的標準,智能舌診、脈診技術技術參數難以制定。我們是否可以轉換思路,一開始研究并不直接進入到細致微觀的局部研究,而是運用上述中醫的執簡馭繁的思維,從復雜的事物現象中抓共性。如脈象臨床千差萬別,但是中醫主要觀察脈的“位、數、形、勢”,或者說脈位、脈力、流利度、脈率、脈寬、脈長、脈律等。舌象觀察舌的淡、白、紅、絳等幾種顏色,舌苔的顏色、質地判斷病性即可。脈診儀、舌診儀的研究模仿中醫的思維特點,先從上述幾種宏觀的方面去研究。如脈診儀,先觀察脈位偏浮與偏沉的信號,有力與無力的信號,流利與不流利的信號,粗脈與細脈的信號,長脈與短脈的信號等,這種研究方式,或許可以使研究簡化,排除很多重復、干擾性的信號數據,最重要的是容易給信號數據定性,容易形成有規律性的、準確可靠的脈診數據,而不是一開始就陷入細節化、復雜化的泥潭,最終永遠無法給出一個肯定的結果。
總之,人工智能在中醫診斷領域的發展出現的瓶頸,筆者認為關鍵問題在于研究的思維方式上,要突破這些發展瓶頸,筆者認為可以通過改變研究思路,改變研究思維方式,在中醫方法論的指導下進行研究,或許這樣可以為智能診斷的研究提供新的出路。