佘楷杰,袁艿君,馬慶宇 ,岳廣欣,陳家旭,4△
(1.暨南大學中醫(yī)學院方證研究中心,廣州 510632;2.廣州市中醫(yī)方證重點實驗室,廣州 510632;3.中國中醫(yī)科學院中醫(yī)基礎理論研究所,北京 100700;4.北京中醫(yī)藥大學中醫(yī)學院,北京 100029)
中醫(yī)診斷是指醫(yī)者通過四診合參(望聞問切)收集患者的癥狀和體征,并經(jīng)綜合推理以完成辨證施治的過程,其優(yōu)勢在于個體化診療,方便快捷,但四診信息采集與辨證論治極度依賴醫(yī)者的經(jīng)驗、流派及學術思想,較強的主觀性影響了診斷治療過程的規(guī)范性和客觀性。多學科交叉的人工智能(artificial intelligence,AI)具有整體、開放動態(tài)、重視經(jīng)驗和預測推理的思維模式的特點,這與強調(diào)天人相應、整體觀念、形氣神一體及功能聯(lián)系的中醫(yī)學思維不謀而合[1]。通過數(shù)據(jù)收集、整理、特征提取以及模型構(gòu)建的過程,AI技術可以對患者的癥狀和體征進行綜合分析,這種分析涵蓋時間與空間、靜態(tài)與動態(tài)等多個角度,進一步證明AI與中醫(yī)診斷結(jié)合的必要性[2]。
與此同時,政府及相關機構(gòu)對AI在醫(yī)療領域的基礎和臨床研究提供了有力支持,相應的發(fā)展戰(zhàn)略、規(guī)劃及重大科技專項也陸續(xù)進入實施、結(jié)項和成果轉(zhuǎn)化的階段,《“十四五”中醫(yī)藥科技創(chuàng)新專項規(guī)劃》為中醫(yī)診療關鍵技術與裝備確立了“AI+中醫(yī)診療+健康服務”的發(fā)展方向。因此,本文就AI,特別是機器學習(machine learning,ML)在四診信息采集、多模態(tài)信息融合、智能辨病辨證和決策支持等方面的研究情況進行分析。基于AI與中醫(yī)診斷間契合程度,分析目前研究中的不足并做進一步的技術梳理,以期實現(xiàn)AI為中醫(yī)診斷的智能化賦能。
ML具有自主學習能力,并具備根據(jù)數(shù)據(jù)基數(shù)的增加而自動優(yōu)化的優(yōu)勢[3]。ML借助合適的算法對已知訓練集進行學習,分析潛在規(guī)律(如分布特征、類別屬性等),以對新數(shù)據(jù)集進行分析和預測[4]。
目前,ML的各類算法經(jīng)過長期更新迭代,主要基于特征學習方式、模型形式、適用數(shù)據(jù)范圍的不同分為傳統(tǒng)ML和深度學習(deep learning,DL)算法。傳統(tǒng)機器學習指基于手工設計特征工程的經(jīng)典機器學習算法,如支持向量機、多層感知器網(wǎng)絡、隨機森林、決策樹、k近鄰、貝葉斯算法、聚類分析、集成學習等,其依賴于人工設計數(shù)據(jù)特征,對數(shù)據(jù)表示的要求高。隨著大數(shù)據(jù)的廣泛應用,以及傳統(tǒng)機器學習在大數(shù)據(jù)規(guī)模計算和非結(jié)構(gòu)化數(shù)據(jù)(圖像、音頻)處理上的技術疲軟,DL飛速發(fā)展并廣泛應用。DL是機器學習的方法之一,見圖1,通過多層非線性運算提取數(shù)據(jù)的內(nèi)在規(guī)律和層次特征,揭示未知數(shù)據(jù)的類別屬性,主要算法包括卷積神經(jīng)網(wǎng)絡(convolutional neural networks, CNN)、循環(huán)神經(jīng)網(wǎng)絡(recurrent neural network,RNN)等。DL是ML的重要發(fā)展和延伸,通過特征自動學習和模型深化,在圖像、音頻等非結(jié)構(gòu)化數(shù)據(jù)的識別和分析上較傳統(tǒng)ML優(yōu)勢明顯,且無需人為干預[5],ML和DL區(qū)別見圖2。當前,互聯(lián)網(wǎng)、云平臺及大數(shù)據(jù)等聯(lián)合構(gòu)建的樣本數(shù)據(jù)庫對于DL精進算法、改良模型、提高識別精度最終實現(xiàn)中醫(yī)智能化輔助診療至關重要[6]。

圖1 人工智能、機器學習、深度學習的關系示意圖

圖2 傳統(tǒng)機器學習和深度學習的區(qū)別示意圖:以舌診圖像為例
中醫(yī)望診所獲得的患者圖像信息可以最直觀地反映患者的外部癥狀,故素有“望而知之謂之神”之說。其中,望診主要包括望舌和望面兩部分。舌診是中醫(yī)診斷的重要組成部分,通過望舌質(zhì)(神色形態(tài))和舌苔(質(zhì)色)可以揭示疾病的病位和病性[7],如《醫(yī)門棒喝》所言“觀舌本可驗其陰陽虛實,審舌垢即知其邪之寒熱淺深也”。然而受限于醫(yī)者經(jīng)驗和流派等主觀因素,傳統(tǒng)舌診有不可避免的模糊性和不確定性。因此,將AI技術用于舌象處理和模式識別,構(gòu)建舌診信息的智能識別分析系統(tǒng)確有必要。
傳統(tǒng)ML對舌象分析主要使用SVM、k近鄰、神經(jīng)網(wǎng)絡、貝葉斯算法等[8-9]。目前,傳統(tǒng)ML在智能舌診的運用包括如下步驟:(1)采用標準的采集系統(tǒng)獲取高分辨率的舌圖像。(2)對舌圖像進行預處理,包括校正顏色、調(diào)整對比度等。(3)對舌象定位和分割,通過人工設計特征并對數(shù)據(jù)進行標注。(4)采用分類器對舌的顏色、形態(tài)和紋理進行分類,包括RF和SVM分析舌質(zhì)和舌苔顏色[10],SVM分辨齒痕舌及裂紋舌[11]。同時,智能化舌診信息與臨床疾病和證候之間的關聯(lián)研究有助于提高AI舌診對臨床的指導價值。Zhang等[12]基于標準舌圖特征參數(shù),借助SVM算法建立糖尿病的診斷模型。丁然等[13]建立了慢性乙型肝炎的舌診客觀量化信息數(shù)據(jù)庫,發(fā)現(xiàn)證候與舌象客觀化指標之間的相關性。由于ML算法分析舌象依賴于提取的特征,在重視關鍵舌象特征提取的基礎上又要避免網(wǎng)絡參數(shù)繁多引起的過擬合現(xiàn)象。雖然ML在舌診圖像的客觀化、規(guī)范化及定量化等方面做出了貢獻,但仍存在一定局限性,如人為設計的特征提取器魯棒性有限,遷移學習和泛化能力差,同時不同機構(gòu)、不同地域之間的數(shù)據(jù)低共享性也增加了算法的過擬合風險,因此ML算法尚未實現(xiàn)人類感知精度[14]。
隨著DL理論的發(fā)展,CNN作為一種包含卷積計算且具有深層結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡,具有良好的表征學習能力,無需人工設計特征提取,在圖像識別和分類任務上優(yōu)勢明顯,其魯棒性和遷移學習能力優(yōu)于傳統(tǒng)的ML算法。因此望診智能化是DL在中醫(yī)輔助診療領域的一個重要突破點。目前CNN識別舌診的流程如下(圖3):(1)與傳統(tǒng)ML方法相同,標準化采集舌圖像,舌圖像預處理,舌體分割。(2)設計、優(yōu)化模型結(jié)構(gòu),并基于已標注的舌象數(shù)據(jù)測試集進行網(wǎng)絡參數(shù)訓練。(3)基于DL算法進行舌象分類,包括舌質(zhì)舌苔等提取特征和分析。(4)結(jié)合中醫(yī)舌診知識庫完成證候的推斷。Zhou[15]在CNN網(wǎng)絡的基礎上提取舌圖像的特征,這種方法在舌診圖像的體質(zhì)分類識別上比傳統(tǒng)ML準確率增加9%。

圖3 舌診智能化輔助診斷流程圖
除了舌診外,面診也是《黃帝內(nèi)經(jīng)》首倡的中醫(yī)診斷內(nèi)容。面部望診包括對整體的神色觀察及頭面的局部形態(tài)觀察,如《素問·陰陽應象大論篇》言“善診者,察色按脈,先別陰陽”,通過面診識別病位、辨別病機,這符合見微知著、司外揣內(nèi)的中醫(yī)診斷基本原理,而《素問·刺熱論篇》和《靈樞·五色》均闡述了面部望診的分候臟腑體系,可見望診在疾病診斷和篩查方面意義重大。在面部望診的智能化分析上,包括望診儀采集圖像、圖像校準及分割,隨后通過圖像分析提取面部特定標記點,采用ML算法進行面部特征分類,與數(shù)據(jù)庫進行對比得出診斷結(jié)果。如Zhao和Liu等以面部顏色和光澤為特征,提取面部圖像的特征后進行降維處理,并借助SVM進行數(shù)據(jù)分類和加權融合,這提高了智能面診識別和分類的精度[16-17]。此外,通過紅外成像區(qū)分面部臟腑分區(qū)的熱度差異,以此反映人體各臟腑的功能和氣血盛衰狀態(tài)[18]。SVM、貝葉斯、AdaBoost等算法也用于研究眼睛、口唇的顏色、形態(tài)等[19]。但目前面部望診的研究內(nèi)容、信息采集等仍缺乏標準,相關技術和算法臨床適應性差,未來需著眼于色診以外的神、形研究,并引進新技術,可以先從挖掘辨病、辨證的特異性指標為切入點,提升算法和技術的適用性。
總之,得益于傳統(tǒng)ML算法的鋪墊和DL的發(fā)展,計算機視覺對圖像信息的處理和識別能力迎來高速發(fā)展。傳統(tǒng)ML算法在小樣本數(shù)據(jù)訓練、避免過擬合風險等方面具有優(yōu)勢,但在大規(guī)模數(shù)據(jù)的處理上存在計算復雜度高,超參數(shù)難以調(diào)節(jié)等局限,同時對圖像和音頻等非結(jié)構(gòu)化數(shù)據(jù)的處理依賴于人工標注的特征提取,無疑在增加成本的同時加大了人為誤差。DL具有更高的識別精度及大規(guī)模數(shù)據(jù)處理能力,并有更優(yōu)的魯棒性和可遷移性,但DL極度依賴于訓練數(shù)據(jù)的數(shù)量、質(zhì)量及計算資源。因此,選擇何種算法進行圖像的AI診斷還需要結(jié)合具體的情境來決定。
脈診是狹義的切診。傳統(tǒng)脈診標準源于《脈經(jīng)》《瀕湖脈學》和《診家正眼》,指醫(yī)者對寸口脈象四要素“位、數(shù)、形、勢”進行診查,以了解臟腑虛實、氣血充盈、正邪交爭的情況,如《靈樞·脈度》曰“其流溢之氣,內(nèi)溉臟腑,外濡腠理”。在臨床實踐中,醫(yī)生學識、臨床經(jīng)驗及切脈主觀性等因素影響脈診結(jié)果,不利于學派交流、理論傳承及重復研究,脈診也有“心中了了,指下難明”的困境,因此脈診的客觀化、信息化及智能化研究是必然趨勢。目前,脈診客觀化研究主要包括脈象采集傳感器技術標準研究、脈象特征提取和脈象波形圖分析處理[20]。通過壓力傳感器、光電傳感器等將脈象的搏動轉(zhuǎn)換為具體的脈沖圖形,并結(jié)合目前的主流算法如動力學分析、時域分析、頻域分析進行脈象分析[21],再基于CNN網(wǎng)絡[22]、BP神經(jīng)網(wǎng)絡及希爾波特-黃變換分析等算法進行脈搏波識別與分類[23],最后與中醫(yī)臨床診療知識圖譜進行深度融合。Hu等[24]研究老年人不同血壓分級的脈搏波周期特征,通過脈沖數(shù)據(jù)預處理、周期分割后提取脈沖波特征,用于脈診的心血管疾病風險評估。Luo等[25]利用ML算法對健康者和高血壓患者的脈搏波進行分類預測,基于脈搏診斷儀(PDA-1)觀察脈搏波的頻域和時域變化來評估高血壓風險。但在脈象信號分析中,時域、頻域分析難以研究脈象的非線性信息,且傳統(tǒng)ML算法需要人為標記特征。顏建軍等[21]提出一種基于無閾值遞歸圖和CNN的脈象分析與識別方法,通過VGG-16的CNN自動提取非線性特征,隨后構(gòu)建脈象分類模型,準確率達98.14%。
在脈診客觀化研究中,脈診儀是關鍵所在,雖然傳感器技術和分析算法不斷更新迭代,但目前仍有一定問題:(1)多探頭、數(shù)組式傳感器技術尚未完全成熟[26]。(2)目前采集的脈象信息難以完全反映脈象四要素,不能準確體現(xiàn)中醫(yī)脈診的臨床思維,因此目前僅適用于輔助醫(yī)生診斷而不能獨立辨病辨證[25]。(3)目前脈診的AI輔助診斷主要局限于脈圖信號分析算法,如傳統(tǒng)ML算法的SVM、k-NN、DT、BP神經(jīng)網(wǎng)絡等[14]。總之,目前脈診儀多用于科研和治未病用途,臨床使用度有限,究其原因是這些設備沒有超出醫(yī)生的感知和診斷能力,受傳感器采集信號的靈敏度和穩(wěn)定性影響,其準確性、重復性等均有所限制[27]。
中醫(yī)聞診涉及聽聲音、嗅氣味。正如《素問·陰陽應象大論篇》言“審清濁而知部分,視喘息聽聲音而知所苦”,《難經(jīng)》也有“聞而知之謂之圣”等,表明聞診在識病、辨證、判斷預后中的重要地位。但無論是聲診還是嗅診,目前仍停留在醫(yī)者主觀判斷及定性層面,難以重復驗證,且缺乏定量的診斷標準[28]。高也陶等[29]的二十五音分析儀開啟對中醫(yī)聲診客觀化、標準化的研究,目前用于AI輔助聽診的ML算法主要包括SVM、K-NN、決策樹、獨立成分分析及神經(jīng)網(wǎng)絡等。目前,聲診客觀化方法由三步構(gòu)成:(1)在安靜、回聲抑制的場地收集患者穩(wěn)定的元音數(shù)據(jù),或是通過五臟相音理論跟讀對應“角徴宮商羽”的漢字,探索語音對應的特征[29],或是結(jié)合非語音指標如咳嗽、呼吸、啼哭、呻吟等研究非語音聲音的特征參數(shù)[30]。(2)音頻數(shù)據(jù)處理,包括信號的降噪、雜波過濾、變換及提取特征,如近似熵、樣本熵及小波包變換等提取參數(shù)特征。(3)參數(shù)特征作為輸入數(shù)據(jù)以供ML算法訓練。如陳春風等[31]通過342例肺系疾病的語音信號采集和特征分析,結(jié)合SVM、小波包變換和香農(nóng)熵值對肺系病證進行分類。作者還通過小波變換結(jié)合近似熵,配合SVM算法以識別虛、實證型語音信號[32]。近來通過DL識別音頻雖仍處于起步階段,但已表現(xiàn)出較高的識別精度,如CNN數(shù)據(jù)增強技術識別虛、實證的精度超過95%[33],原因是CNN在分析聲學信號時域的局部波形基礎上也具備全局的感受野,與臨床醫(yī)生聽診過程的本質(zhì)類似。
嗅診本質(zhì)是氣味分子與受體作用產(chǎn)生物理震動或化學刺激的過程,但常溫下醫(yī)生嗅覺僅能識別有明顯揮發(fā)的化學分子。電子鼻技術通過氣味傳感器陣列收集并識別單一或復雜氣體,通過與氣味圖譜對比或者結(jié)合ML算法以預測氣味屬性[34-35]。宋鎮(zhèn)貴[36]通過電子鼻收集氣味信息,基于小波分析提取口腔氣味的病理特征。劉英東[37]在此基礎上結(jié)合電子鼻、信號處理及模式識別等技術,優(yōu)化人工神經(jīng)網(wǎng)絡識別算法并構(gòu)建病理氣味的數(shù)據(jù)分析模型。目前嗅診客觀化研究臨床報道較少,主要局限于口臭的分析,在臟腑病位識別與病性診斷方面還具有較大研究空間,是中醫(yī)聞診客觀化研究方向之一。
總之,開展聞診定性、定量的客觀化研究是四診合參現(xiàn)代化的途徑,目前仍面臨以下問題:(1)按照中醫(yī)理論和診斷方法歸類,西醫(yī)的叩診、聽診也應當歸屬于聞診的體系中[38]。(2)目前聲診客觀化研究對象主要局限于肺系病證,但根據(jù)五臟相音理論,聲診客觀化應當具備識別五臟病位及辨別病性的能力,如依據(jù)腸鳴音識別脾胃系疾病、根據(jù)聽診信息識別心肺系統(tǒng)疾病,在聲診信息的證型量化上也可依據(jù)太息識別肝郁程度、呼吸深淺識別腎不納氣程度等[30]。(3)嗅診能定性定量分析氣味成分但卻無法評價口臭、糞臭的程度,不同個體的氣味成分標準差過大,因此大樣本臨床調(diào)查確有必要。(4)小樣本研究報道涉及的指標特異性不強,在特征提取及ML算法識別分類上不具備代表性。因此,后續(xù)應當進一步規(guī)范聲音采集和分析的標準,探索哪種聲樣適合分析哪些病證,再研究哪些元音或字句能與臟腑特征、中醫(yī)證型對應。
通過問診收集患者的病情資料,自古便是歷代名醫(yī)重視的四診環(huán)節(jié)之一,“問而知之謂之工”,張景岳更是將問診視為“診病之要領,臨證之首務”。然而在實際的臨床問診過程中,患者的癥狀、體征、證候等信息互相夾雜,數(shù)據(jù)維度高,并受患者主觀感知,醫(yī)者的知識儲備、流派及經(jīng)驗等因素影響,導致問診受主觀性的影響最大。因此,完善問診的客觀化、標準化研究以減少主觀因素對問診信息收集及診斷造成的干擾,提升問診的有效性、可靠性及科學性至關重要。
目前,問診客觀化研究主要針對問診量表和問診模型兩部分。由于表述癥狀的詞語較多,若結(jié)合癥狀的誘因及加重因素則形成的復合癥狀詞語數(shù)目更為繁多[39]。因此,需要通過問診量表來規(guī)范癥狀表述、量化分級為進一步研究癥狀與證候之間的關系提供基礎。如劉國萍等[40]以心系疾病為研究對象,研制心系病證問診量表,囊括8個條目及66個癥狀變量,為心系病證的問診客觀化提供了方法學范例。趙靈燕[41]通過條目篩選、賦分及確定證候要素的診斷閾值,建立包含9個要素的2型糖尿病中醫(yī)證候診斷量表。中醫(yī)量表研究雖有增多趨勢并愈加規(guī)范,但由于辨證的復雜性導致量表評測維度和條目繁雜,特征之間的交互作用使得結(jié)果復雜而難以解釋[42]。同時部分量表的條目選擇不當、標準不統(tǒng)一、術語不規(guī)范等局限性也影響了量表的適用性。因此通過ML算法建立模型以改進量化診斷成為一種新的方法。黃仲羽[43]基于多維計算機自適應測試技術,以跳題的方式對功能性胃腸病的證候測評量表進行個體化調(diào)整,提高證候量表的測評效率,改善了模型的自主學習能力。劉國萍等[44]基于模糊數(shù)學、條件隨機場等方法,將證候診斷的核心癥狀、體征及微觀辨證指標進行組合,并借助多標記學習算法和DL網(wǎng)絡建立主證辨證模式,對慢性胃炎的證候診斷與傳統(tǒng)中醫(yī)辨證結(jié)果基本一致。可以發(fā)現(xiàn),目前問診客觀化研究主要集中于癥狀與證候之間的關系,即較為低層次的數(shù)據(jù)挖掘與分析,但對傳統(tǒng)中醫(yī)問診高層次文本語義、認知智能等的研究尚未深入。
自然語言處理(natural language processing,NLP)可從非結(jié)構(gòu)化數(shù)據(jù)中提取專業(yè)術語、疾病間的時序關系和事件等,在DL、語音工具的輔助下共同組成AI問診系統(tǒng)的核心,如2018年首屆世界中聯(lián)中醫(yī)藥大數(shù)據(jù)發(fā)展論壇上發(fā)布的醫(yī)患AI對話系統(tǒng),系統(tǒng)基于云計算、大數(shù)據(jù)等構(gòu)建中醫(yī)藥知識庫,可完成問診信息采集、癥狀推理和輔助診斷[45]。問答系統(tǒng)(question answering system,QA)是自然語言處理實現(xiàn)智能問診的一項傳統(tǒng)任務,其基于DL提取文本信息的語義特征,并利用決策樹等模型識別答案[46]。其中,利用DL算法構(gòu)建語言模型提取文本特征后多在通用數(shù)據(jù)集上進行測試,如Dong[47]提出的多列CNN能從響應路徑、上下文及答案類型等三方面學習問題與答案之間的分布表示。但在中醫(yī)診斷領域,由于缺乏大型帶注釋的臨床數(shù)據(jù)集,以及NLP仍未能較好地解決文本信息中的專業(yè)術語、多種疾病間的時序關系、多領域的知識推理、非結(jié)構(gòu)化數(shù)據(jù)識別,以及中醫(yī)古籍的多義、歧義、通假等復雜語法識別等難點,目前還沒有一個系統(tǒng)能較好回答自然語言問題并給出辨證治療答案。此外,帶注釋的數(shù)據(jù)集還涉及患者就診信息的隱私。由于這些挑戰(zhàn),目前中醫(yī)智能問診的研究還處于探索階段。因此,后續(xù)圍繞智能化問診及中醫(yī)文本信息識別的問題,應當建立標準化問診信息采集流程,基于臨床應用場景建立帶注釋的數(shù)據(jù)集,如Pampari等利用i2b2數(shù)據(jù)庫中針對NLP任務的臨床數(shù)據(jù)的現(xiàn)有注釋,采用含注意力層的端對端模型,生成了100萬個問題形式及40萬個問題-答案對的大型數(shù)據(jù)集[48]。其次,建議發(fā)展和完善中醫(yī)術語的規(guī)范化和標準化以輔助語境分析、消除語義分歧,為特征提取及智能決策做鋪墊。最后,選擇合適的特征選擇和降維方法也有助于提高智能問診模型的效果,如Wrapper和混合式特征選擇方法相互補充,或者結(jié)合最新的建模方法及特定文本數(shù)據(jù)改進現(xiàn)有的特征選擇方法也可能成為新的研究方向[49]。
中醫(yī)四診客觀化研究不僅包括四診信息采集的客觀性和準確性,還與四診合參和辨證論治的過程密切相關,正如《醫(yī)門法律》強調(diào)“望聞問切,醫(yī)之不可缺一” ,以及《四診心法要訣》所云“望以目察,聞以耳占,問以言審,切以指參……識病根源……可以萬全”。在中醫(yī)四診客觀化研究的初期,由于信息分析和融合技術處于起步階段,且不同診法儀器標準、采集信息來源等存在巨大差異,因此四診客觀化研究呈“各自為戰(zhàn)”的特點,不能發(fā)揮“四診合參”的優(yōu)勢[20]。近年來,四診信息客觀采集與分析系統(tǒng)的成熟為四診合參的融合研究奠定了基礎。其中,多源多模態(tài)信息融合用于對圖像、音視頻及文本等不同模態(tài)數(shù)據(jù)進行認知、綜合和判斷,挖掘多模態(tài)數(shù)據(jù)的內(nèi)在聯(lián)系,該算法通常滿足一致性和互補性原則[50],是AI輔助四診合參的關鍵技術。牛欣及王憶勤團隊長期研究四診信息的融合處理技術,研發(fā)的四診合參診療儀用于臨床研究[26,51]。溫川飆教授團隊開發(fā)的通用裝備采集四診數(shù)據(jù),并基于大數(shù)據(jù)流式計算等方法實現(xiàn)動態(tài)數(shù)據(jù)處理,以開發(fā)辨證論治輔助診斷系統(tǒng)[52]。王俊文等[27]認為可以通過領域本體的方法,將系統(tǒng)、復雜的四診過程拆解成可測量的變量,并整理出互相獨立的診斷概念體系,在此基礎上尋找概念間的關聯(lián),以此建立起領域本體為核心的信息采集、處理、分析和應用,以此作為多模態(tài)信息融合的基礎。目前,基于與模型有無關聯(lián),多源多模態(tài)融合方法可分為兩種,其中與模型相關的方法需要建立規(guī)范的數(shù)據(jù)采集流程,使得舌、面、脈、味等數(shù)據(jù)同構(gòu)化,并以統(tǒng)一的ML算法進行訓練、分類識別,但目前尚無同構(gòu)數(shù)據(jù)的采集標準[2]。與模型無關的方法則對不同采集標準下的數(shù)據(jù)進行特征提取,再用ML算法對特征進行加權融合、計算及分類,該方法魯棒性及可操作性更強[53-54]。趙文等[20]研究發(fā)現(xiàn)基于子空間學習、協(xié)同訓練、多核學習等算法能夠提升四診合參的智能化程度,基于模式識別技術也可較好地構(gòu)建四診信息融合及四診合參輔助診療系統(tǒng)。總之,信息處理技術的成熟有助于挖掘中醫(yī)診療的內(nèi)在規(guī)律,ML、DL等算法可從多角度研究四診信息的融合分析、四診信息與辨證辨病間的潛在聯(lián)系。
目前研發(fā)的四診合參智能化系統(tǒng)雖然基于大規(guī)模臨床數(shù)據(jù)建立,但并不具備臨床醫(yī)生的中醫(yī)思維,缺乏獨立演算能力。隨著AI技術的發(fā)展,結(jié)合語音識別、自然語言處理及ML算法實現(xiàn)人機對話,并借助5G網(wǎng)絡、云計算、大數(shù)據(jù)標注平臺等構(gòu)建異構(gòu)、異標準、跨平臺的AI輔助四診合參技術是智能辨病辨證的發(fā)展基礎,構(gòu)建四診信息多源采集、整合和分析的一體機是實現(xiàn)智能辨病辨證的路徑之一[55]。
中醫(yī)辨證是中醫(yī)學的基本理論與核心思想,是在中醫(yī)理論指導下,根據(jù)四診信息明確病變本質(zhì)的思維過程,由辨證而明確病因、病位、病性及病勢等病機本質(zhì),辨證即為診斷的要務[1]。而辨病分中醫(yī)學和現(xiàn)代醫(yī)學兩類疾病,是通過綜合分析四診信息,縝密推理并判斷疾病病種、確定疾病病因、了解病程特點和發(fā)病規(guī)律的思維過程[56]。但“病”和“證”是維度和分類不同的兩種概念,在時空上存在非線性、多維、復雜、模糊的交叉網(wǎng)絡關系[57]。“證”是疾病總過程某一階段病理本質(zhì)概括,從“證”與“病”的角度進行關聯(lián)即是目前辨病辨證相結(jié)合的診治過程,表明“病”與“證”是緊密相連的,正如“線”與“珠”的關系[58]。但目前“病”與“證”分類方法眾多,數(shù)據(jù)繁雜。AI技術的分類方法對于非線性、復雜模糊的中醫(yī)數(shù)據(jù)有很好的適應性,但目前仍缺少較為公認的AI與辨病辨證結(jié)合的分類方法[59]。因此,探索AI與中醫(yī)辨病辨證結(jié)合的突破口,提升臨床中醫(yī)“病”“證”的識別精確度依然是中醫(yī)智能診斷研究的核心。目前,智能輔助診斷的技術和算法步驟如下:(1)首先,基于中醫(yī)四診儀器收集準確、穩(wěn)定可靠的脈診、聞診、望診數(shù)據(jù),積累規(guī)范的臨床大樣本四診數(shù)據(jù)庫,利用ML算法分別對四診信息的特征進行加權融合與分類。(2)基于現(xiàn)代醫(yī)學檢測技術和方法,檢測微觀指標數(shù)據(jù)如臨床檢測、影像學檢測和分子生物信息,采用基于現(xiàn)代醫(yī)學信息的智能化診斷決策系統(tǒng)研究微觀指標與“病”“證”的精確診斷關系[60]。(3)針對“病”“證”分類目標,綜合選用合適的ML算法,以設計、優(yōu)化、完善更適合智能辨病辨證的智能分類自主學習算法[61]。丁琪等[62]基于DL在處理非線性、復雜多層數(shù)據(jù)方面的優(yōu)勢,將四診信息作為輸入層,證型、治法為隱藏層,方劑、藥物為輸出層,通過DL的反向傳播反饋以調(diào)整缺失值,建立了“癥-病-證-藥”的關聯(lián)學習系統(tǒng)。Zhang等[63]借助NLP中的雙向長短期記憶網(wǎng)絡及隨機森林的RNN,從非結(jié)構(gòu)化的電子文本記錄中提取癥狀、體征,再基于CNN的學習算法預測187種常見疾病及其證型,準確率達80%以上。依據(jù)《傷寒論》《金匱要略》經(jīng)方理論的六經(jīng)辨證唯一性、治法嚴謹性和處方加減規(guī)范性,以“首辨六經(jīng)歸屬,次辨病機方證,預測病傳規(guī)律”的臨證思維確立“經(jīng)方AI辨證及疾病傳變預測”的研究思路[64],基于ML算法確定六經(jīng)分類,BP神經(jīng)網(wǎng)絡學習辨證處方,還可根據(jù)貝葉斯網(wǎng)絡及蒙特卡洛樹搜索算法,從原始信息中推演新的疾病進展規(guī)律,因此“ML六經(jīng)分類-神經(jīng)網(wǎng)絡學習辨證處方-疾病規(guī)律預測”的路徑可為智能化辨證辨病提供參考[64]。綜上,ML算法具備處理復雜、異類四診信息數(shù)據(jù)的能力,并能進一步研究數(shù)據(jù)的內(nèi)在規(guī)律及關聯(lián)模式,從而預測病證的轉(zhuǎn)變規(guī)律,這種智能化思維模式符合傳統(tǒng)中醫(yī)的“治未病”理念。
專家系統(tǒng)由AI衍生而成,是以中醫(yī)專家診療的知識經(jīng)驗為基礎,綜合知識獲取和語言分析技術,通過數(shù)據(jù)采集、挖掘和邏輯推理以模擬醫(yī)學專家識病、辨證和處方的思維過程,進而實現(xiàn)精準診斷和個體化診療方案等臨床輔助智能決策。其中,關幼波教授于1978年率先開發(fā)“關幼波肝病診斷程序”[65],隨后朱文鋒教授團隊于1979年研發(fā)《中醫(yī)數(shù)字辨證機》,并在1985年升級為《中醫(yī)辨證論治電腦系統(tǒng)》[66],這些系統(tǒng)都是基于中醫(yī)理論開發(fā)并為后續(xù)中醫(yī)領域?qū)<蚁到y(tǒng)的研發(fā)奠定了基礎。目前,專家系統(tǒng)的診療模式多為“四診信息采集-經(jīng)驗提取-臨床應用驗證-機制機理研究-理論指導臨床”,通過研究名老中醫(yī)診病特征,數(shù)據(jù)結(jié)構(gòu)化轉(zhuǎn)化后匯總形成名老中醫(yī)的診療信息數(shù)據(jù)庫,結(jié)合數(shù)據(jù)挖掘方法如聚類分析、關聯(lián)規(guī)則等實現(xiàn)名老中醫(yī)經(jīng)驗整理及診療系統(tǒng)構(gòu)建[67]。但早期的專家系統(tǒng)診療程序僅簡單模擬某一疾病領域的某一專家診療思維,當面對不同疾病領域、不同流派學說時基本不能運用。而目前專家系統(tǒng)在四診信息客觀化采集的基礎上拓寬了辨證的思路與方向,如楊亞利[68]以屬性偏序結(jié)構(gòu)圖算法為核心,構(gòu)建“證候-證素-證名-病名”的中醫(yī)數(shù)量化診斷模型,并以此設計中醫(yī)內(nèi)科常見病的專家系統(tǒng),通過對四診信息采集和證候集的推理以確定中醫(yī)病名和證型診斷。Zhang等[69]基于集成學習算法構(gòu)建名老中醫(yī)臨證經(jīng)驗模型,在分析國際疾病分類(ICD-10)標注的臨床數(shù)據(jù)基礎上實現(xiàn)精準診斷和穴位推薦。總之,專家系統(tǒng)的應用領域應當包括病證輔助診斷、中醫(yī)健康狀態(tài)辨識和健康管理等,立足于豐厚的中醫(yī)文獻和臨床診療數(shù)據(jù),基于數(shù)據(jù)挖掘算法抽取與病名診斷、證候分類有關的知識模型或分類規(guī)則。
中醫(yī)豐富的古籍資料、醫(yī)案和名老中醫(yī)經(jīng)驗是中醫(yī)各家流派思想和臨床經(jīng)驗的載體;現(xiàn)代研究積累的單體、中藥、復方的藥理機制研究也構(gòu)建了龐大的標準現(xiàn)代中藥藥理數(shù)據(jù)庫,收集這些數(shù)據(jù)和資料并提取特征是實現(xiàn)中醫(yī)診斷現(xiàn)代化的重要路徑。為實現(xiàn)該路徑,借助數(shù)據(jù)挖掘技術對中醫(yī)古籍、文獻和名老中醫(yī)經(jīng)驗進行整理,從紛繁復雜的醫(yī)案和名老中醫(yī)經(jīng)驗中挖掘藥物處方及配伍規(guī)律,采用ML算法對這些規(guī)范化數(shù)據(jù)進行中醫(yī)病證診斷,這是中醫(yī)臨床病證診療決策支持系統(tǒng)的構(gòu)建思路[67]。目前研究常用的數(shù)據(jù)挖掘技術主要是聚類分析、關聯(lián)規(guī)則、決策樹、無尺度網(wǎng)絡粗糙集理論等[70],在揭示復雜癥狀體征信息與證型、治則治法、方藥間的潛在關系方面具有優(yōu)勢。在“癥-證-方”的規(guī)律研究中,湯爾群等[71]采用基于數(shù)據(jù)挖掘的中醫(yī)處方智能分析系統(tǒng)對《傷寒論》112首經(jīng)方君、臣、佐、使的用藥規(guī)律和氣、味、歸經(jīng)規(guī)律進行量化排序,總結(jié)辨證處方規(guī)律,探討了經(jīng)方“證”與“主癥”的關系。粗糙集適用于推理不確定、不完整的知識體系,與部分疾病的證候診斷原理相似。如秦中廣最早將粗糙集用于類風濕疾病證候的診斷[72],晏峻峰等[73]也將粗糙集和證素辨證進行結(jié)合并運用于推理規(guī)則和癥狀辨證素量表制定。劉保延和周雪忠教授團隊則采用關聯(lián)規(guī)則、聚類分析及案例推理等方法 進行臨床診療智能決策研究,針對糖尿病、中風及冠心病實現(xiàn)名老中醫(yī)臨床經(jīng)驗的多維分析[74-77]。何菊等[78]運用復雜網(wǎng)絡模型挖掘名老中醫(yī)治療肺癌的用藥規(guī)律,以節(jié)點關聯(lián)度和屬性相似度為基礎構(gòu)建加權網(wǎng)絡以挖掘核心用藥,結(jié)果顯示該加權復雜網(wǎng)絡能準確挖掘?qū)傩韵嗨频母哳l與低頻藥物社團,為肺癌臨床用藥規(guī)律提供智能化依據(jù)。廈門大學周昌樂教授團隊等利用粗糙集、軟計算理論構(gòu)建八綱辨證和臟腑辨證的模型系統(tǒng)以探索中醫(yī)辨證邏輯化的發(fā)展途徑[79-80]。數(shù)據(jù)挖掘也是體現(xiàn)ML應用的重要分支,張從正和朱丹溪分別作為“攻下派”和“滋陰派”代表醫(yī)家,兩者用藥明顯不同,王瑞祥以樸素貝葉斯和SVM算法進行模式識別,分析兩位醫(yī)家的方劑數(shù)據(jù)集,在區(qū)分方劑特性上效果較優(yōu),可作為比較不同流派醫(yī)家思想和用藥特點的智能化范式,從各家流派個性用藥中發(fā)現(xiàn)共性規(guī)律[81]。總之,以“癥-證-方-藥”為規(guī)律的中醫(yī)數(shù)據(jù)挖掘方法為智能辨病辨證、中醫(yī)臨床智能診療決策系統(tǒng)提供了算法支持。
無論是專家系統(tǒng)還是數(shù)據(jù)挖掘,都是建立在數(shù)據(jù)的采集、提取和分析上,而不同醫(yī)院、不同中醫(yī)學術流派、不同時代的中醫(yī)古籍與醫(yī)案等數(shù)據(jù)千差萬別,嚴重影響中醫(yī)客觀化、規(guī)范化進程中數(shù)據(jù)的穩(wěn)定性、純潔性及可重復性,暫未能實現(xiàn)局部統(tǒng)一的數(shù)據(jù)化。因此需要借助大數(shù)據(jù)技術促成中醫(yī)藥古籍、醫(yī)案的電子化,將典籍和醫(yī)案資料轉(zhuǎn)化為規(guī)范化數(shù)據(jù)。同時,臨床醫(yī)療需要構(gòu)建更為統(tǒng)一和規(guī)范的信息采集與數(shù)據(jù)管理機制,借助信息化手段,先從區(qū)域醫(yī)療資源整合入手,逐步探索、解決全國醫(yī)療資源整合的難點問題,再轉(zhuǎn)化為計算機語言可識別的結(jié)構(gòu)化數(shù)據(jù)。對于數(shù)據(jù)信息的質(zhì)量控制則應當構(gòu)建開放、共享的區(qū)域醫(yī)療大數(shù)據(jù)平臺,對中醫(yī)臨床病歷、健康信息、生物樣本等進行統(tǒng)一管理與整合。
目前,四診研究已在客觀化及定量表達(如脈象四要素量化表達、舌面診的顏色量化、問診癥狀的量表)、特征信息提取及分析、儀器研發(fā)應用等方面取得可觀進展,舌診儀、脈診儀、色診儀、聞診儀等逐漸成為新興的中醫(yī)診斷技術,特別是ISO/TC249首次出版“舌診”和“脈診”兩部中醫(yī)診斷學術語標準,為解決四診信息標準化采集、建立大型帶標注的先驗數(shù)據(jù)集掃除障礙。但目前仍存在一定局限性,如脈診缺乏成熟的多探頭、數(shù)組式傳感器技術,難以完全體現(xiàn)脈象四要素的量化指征;聞診缺乏相關的標準,在儀器研發(fā)上稍落后,目前多以組件存在于四診儀中,并且在元音、字句等語音特征和咳嗽、噯氣、啼哭、腸鳴等非語音特征的采集上仍未形成規(guī)范;面部望診缺乏采集和分析的標準,而舌診目前尚處于標準化起步階段,兩者均缺少色診以外的神、形研究。問診的量表采集也存在條目選擇、標準建立和術語不規(guī)范的局限性,缺少癥狀量化的分級標準,同時不同的評測維度和特征交互也影響了采集的可解釋性。
因此,針對四診信息采集問題,目前仍需要研制能夠反映脈象四要素量化的多通道、多探頭復合傳感器;完善聲診的采集標準,基于中醫(yī)嗅診理論研發(fā)電子鼻氣味采集系統(tǒng),探索“聲樣-病證”與“氣味-病證”的分析契合度;進一步完善中醫(yī)癥狀體征術語規(guī)范,建立具有中醫(yī)診斷特色的問診信息采集量表和癥狀量化分級標準。總之,繼續(xù)開展四診名詞術語標準、四診儀器采集、操作規(guī)范等系列標準研究,建立新的四診采集平臺,構(gòu)建大型標注數(shù)據(jù)集,為構(gòu)建智能診斷的算法模型提供可靠的先驗數(shù)據(jù)是基礎性的工作與難題。
中醫(yī)智能化辨證主要基于四診設備采集的癥狀體征信息與證候間的關聯(lián)研究,但由于關聯(lián)的非單一線性關系,采集的四診客觀化數(shù)據(jù)與證候間的關聯(lián)便涉及復雜性、相對模糊性與多維性。因此,更需要通過綜合多種AI技術和算法,形成一個穩(wěn)定可行、多算法融合的“單類疾病-多種證候”智能診斷模型范式研究。
類似于冠心病心絞痛證候應證組合規(guī)律的研究[82],可通過引入疾病的證候要素作為癥與證之間的智能化媒介,再運用多種算法構(gòu)建模型來智能化辨證并按證候要素的權重以形成主次證候的復合診斷。例如,可以先基于聚類算法將疾病的臨床主要癥狀聚類并確定證候要素及主要證候的組合特征。基于聚類分析存在的單分配問題,單純以聚類算法的證候智能診斷無法符合中醫(yī)理論指導下“證候-癥狀”的多對應特點。因此,隨后采用貝葉斯網(wǎng)絡對疾病臨床醫(yī)案的證型與癥狀的關聯(lián)性進行分析,在智能辨證算法中間過程使用以提高辨證識別率。再通過判別分析與Logistic回歸分析完成證候的鑒別診斷。在上述智能辨證過程中還可以通過證候要素的權重組合完成主次證候的復合診斷。比如可以采用因子分析降維方法和二分類Logistic回歸分析研究證候量化和疾病不同分期的證候診斷,由于因子分析無法符合不同證候要素權重和組合特征下的個體差異,后續(xù)可以采用主成分分析來生成信息權重數(shù)和系統(tǒng)效應權數(shù),消除變量間的共線性特征,實現(xiàn)證候要素不同重要程度信息的權重分析。通過上述多種算法結(jié)合可以建立更加符合中醫(yī)理論指導下的“四診癥狀體征信息群-證候要素-證候”的智能診斷模式。
目前,多數(shù)已發(fā)表的中醫(yī)智能輔助診療系統(tǒng)均顯示較好的目標任務識別與分類性能。但由于缺少對智能預測和決策的綜合解釋,無法得知結(jié)論的內(nèi)在邏輯與可靠性,目前仍采用與領域?qū)<彝评磉^程和結(jié)論對比、離散式的準確率、回歸率和ROC曲線下面積等對系統(tǒng)進行評價[83],而忽視了智能診療系統(tǒng)的臨床療效評價。因此需要結(jié)合中醫(yī)和AI技術本身的特點來進行中醫(yī)智能輔助診療模型的療效智能化評價研究,此關鍵技術目前仍受技術基礎能力限制。
智能化療效評價同樣分為個體和群體化療效評價。群體化療效應當借助循證醫(yī)學最佳證據(jù)的臨床決策和AI技術結(jié)合來評價療效、安全性,并通過自主學習算法優(yōu)化中醫(yī)臨床診療方案。個體化療效評價可基于四診客觀化設備采集診前、診后的癥狀體征資料,依據(jù)中醫(yī)藥核心結(jié)局指標、目標成就、證候要素等變化,選用合適的ML算法構(gòu)建分類器,先從重大疾病/慢病/優(yōu)勢病種的中醫(yī)療效智能化評價入手,為其他疾病智能輔助診療模型的個體化療效智能評估提供思路。如貝葉斯網(wǎng)絡能描述不定性問題間的因果聯(lián)系,可以明確每一種干預措施與核心臨床結(jié)局指標間的因果關系,以實現(xiàn)智能化中醫(yī)療效評價[84]。總之,深入理解AI和中醫(yī)藥學科的特點,從兩者的思維方式來明確關聯(lián)是智能化療效評價的基礎。
隨著AI與大數(shù)據(jù)等信息技術運用于中醫(yī)智能化并產(chǎn)生新的輔助診療模式,本研究探討了AI技術特別是傳統(tǒng)ML和DL在中醫(yī)四診、多源多模態(tài)信息處理、智能辨病辨證等智能診斷中的運用,可為智能決策支持系統(tǒng)的輔助治療提供支撐。但仍需重視AI為中醫(yī)診斷賦能過程中的基礎與技術性問題,如四診采集標準和大型帶標注的數(shù)據(jù)集等基礎工作和難題;多算法集成的智能辨病辨證模型、針對智能決策診療支持的智能化療效評價等技術難題尚處于起步階段,還應當采取一切先進的技術與合適的方法來探索和開發(fā)。總之,解決中醫(yī)智能診斷中的技術難題,構(gòu)建中醫(yī)智能診斷模型和相應的智能化療效評價模型是助力中醫(yī)藥客觀化進程、創(chuàng)造新時代AI式中醫(yī)特色醫(yī)療體系的必經(jīng)途徑。