賈 文,尹 瑩,余 晗,柯于鶴*
(1.武漢市中西醫結合醫院,湖北 武漢 430022;2.湖北中醫藥大學,湖北 武漢 430065)
2019年12月底,“新型冠狀病毒(Corona virus disease 2019,COVID-19)”疫情爆發[1],并迅速在全世界多個國家蔓延開來,至少有34個國家報告了COVID-19病例[2],其中包括美國[3]、意大利[4]、德國[5]等發達國家,2020年3月11日世界衛生組織宣布COVID-19為全球性大流行病[6]。截至目前全世界感染人群已經超過2 000萬,死亡人數超過30萬,其中危重型患者的死亡率遠超輕型/普通型患者[7],在某些國家,危重型患者的死亡率甚至高達27%[4],因此明確易死亡患者的臨床特征,探索影響COVID-19患者死亡的危險因素對于降低COVID-19患者的死亡風險有積極意義。盡管已經有相關研究對可能導致住院患者死亡的因素和臨床特征進行了初步分析[7- 8],但這些研究多是對患者的臨床特征進行簡單描述或者采用Logistic回歸模型或廣義線性模型進行建模分析,但由于影響死亡的因素眾多,傳統的回歸分析或者線性模型在處理存在多重共線性數據資料時存在偏倚[9-10]。其次,在中國國內中藥被廣泛應用于臨床一線[11],但現有研究很少有針對中藥或中成藥對患者死亡率的影響分析和評價。
決策樹是新興機器學習算法之一[12],其所需要的數據準備往往非常簡單,而且能夠同時處理數據型和常規型屬性,并對大型數據源做出可行且效果良好的結果分析,還能通過靜態測試對模型進行評測,對模型可信度進行評估[13],目前疾病的預測模型在臨床上已有廣泛應用。本研究收集武漢市某定點醫院中COVID-19患者的住院數據,采用決策樹模型來探索影響COVID-19住院患者死亡率的因素,并將中藥治療(包括使用中成藥和中藥湯劑)作為影響因素之一,以深入探討中藥治療與患者死亡率的相關性。
研究對象為2020年3月20日前武漢市中西醫結合醫院收治的COVID-19患者,其中危重型確診患者的診斷標準參照國家衛生健康委員會頒布的《新型冠狀病毒肺炎臨床治療方案(第七版)》[14],具體內容包括:(1)COVID-19確診患者:有臨床表現、影像學特征,新型冠狀病毒核酸檢測為陽性;(2)COVID-19危重型:COVID-19確診患者符合下列任何1條:①出現呼吸衰竭,且需要機械通氣;②出現休克;③合并其他器官功能衰竭需行ICU 監護。
本研究納入所有可獲得研究數據的住院患者,排除因特殊原因無法獲得完整研究數據的患者。本研究得到武漢市中西醫結合醫院倫理委員會批準,并在中國臨床試驗中心進行注冊(注冊號:ChiCTR2000030719)。
本研究收集了武漢市中西醫結合醫院衛生信息系統(Hospital Information System,HIS)中的患者住院信息,采用Epidata 3.1軟件建立專門的數據提取工具,選擇兩名研究者對納入患者的流行病學、人口統計學、臨床、實驗室檢查、治療方案、轉歸等數據進行系統采集,并采用雙人雙錄入的方法以減少數據誤差,采集過程中所有爭議由第三位研究者進行判定。
1.3.2 單因素分析 以住院期間是否死亡作為分組依據,將患者分為兩組,采用單因素分析法篩選兩組之間具有顯著差異的因素,其中計量數據依據是否符合正態分布,采用Mann-WhitneyU檢驗或t檢驗;計數數據采用χ2檢驗,并依據具體數據分布情況選擇Person檢驗或Fisher精確檢驗,P<0.05表示差異有統計學意義。
1.3.3 方差膨脹因子分析 為保證模型的穩定性,在建立決策樹前采用R軟件對單因素分析中具有統計學差異的因素進行方差膨脹因子(VIF)分析,以VIF>2作為標準,排除導致潛在共線性的變量。
1.3.4 決策樹模型的建立 在排除共線性變量后,采用IBM SPSS Modeler14.1 Premium 軟件進行數據管理,并選用Chi-squaredAutomatic Interaction Detector(簡稱CHAID)算法建立決策樹模型,將住院期間是否死亡作為因變量,以排除后潛在共線性的因素為自變量,將納入研究的70%患者作為訓練集建立決策樹模型。為防止對數據的過度解讀,本研究中的決策樹模型將采用交互驗證法,并在停止規則中將父分支最小記錄數定為5%,子分支最小記錄數定為3%,建立決策樹模型后以剩余的30%患者對所建模型的準確率進行判斷,準確率為90%以上則認為模型預測性良好。
本研究共納入272例COVID-19患者,需要強調的是由于疫情初期核酸檢測不完善的原因,本次研究納入的患者均是住院后核酸檢測為陽性的患者。所有患者中有死亡病例43例(15.8%),危重型患者64例(23.5%);其中男性患者127例(46.7%),患者中位數年齡為64歲,住院時間的中位數為25天;患者中合并有高血壓的患者有104例(38.2%),高血壓是最常見的合并癥,絕大多數患者入院后接受了抗病毒(93.4%)、抗菌(79%)和中成藥(68%)治療,而接受過中藥湯劑治療的患者為204例(75%)。
將所有患者按是否在住院期間發生死亡作為分組依據,共分為兩組,采用Mann-WhitneyU檢驗或χ2檢驗將兩組之間各種因素進行單因素分析(見表1),結果提示兩組患者在性別、年齡、危重型患者比例、無創機械通氣、有創機械通氣、抗病毒治療、中成藥治療、中藥湯劑治療、出現喘息、出現便秘、合并慢性阻塞性肺疾病、高血壓、冠心病、心肌梗死、腦梗死、慢性腎功能不全、病毒性肝炎、D-D二聚體、降鈣素原、血沉、白細胞計數、紅細胞計數、血小板計數、血紅蛋白計數、中性粒細胞絕對值、淋巴細胞絕對值、超敏C反應蛋白、白蛋白、谷草轉氨酶、肌酐、尿素氮、肌酸激酶、乳酸脫氫酶、肌酸激酶同工酶、肌紅蛋白、超敏肌鈣蛋白等36個因素上具有統計學差異(P<0.05)。

表1 新型冠狀病毒肺炎住院患者死亡風險的單因素分析結果
對納入的因素進行方差膨脹因子(VIF)分析,以VIF>2作為標準,排除導致潛在共線性的變量,最終納入性別、危重型患者比例、抗病毒、中成藥、中藥湯劑、喘息、便秘、慢性阻塞性肺病、高血壓、冠心病、心肌梗死、腦梗死、慢性腎功能不全、病毒性肝炎、D-D二聚體、降鈣素原、血沉、白細胞、紅細胞、血小板、淋巴細胞絕對值、白蛋白、谷草轉氨酶、肌酐、肌酸激酶同工酶、超敏肌鈣蛋白等26個變量。見表2。

表2 變量的多重共線性篩選
將上述變量納入決策樹模型,隨機選取185例患者作為訓練集,通過建模和變量篩選,共篩選出危重型比例、降鈣素原、中藥湯劑、淋巴細胞絕對值、中成藥等5個變量和7條途徑(表3);其中依據模型影響力從高到低對納入模型的5個變量進行排列(圖1),依次為危重型比例、降鈣素原、中藥湯劑、淋巴細胞絕對值、中成藥。將剩余的87例患者建立測試集,對建立的決策樹模型(圖2)的準確性進行評價,結果顯示測試集的預測準確率為95.4%,敏感度為83.3%,特異性為97.4%,表明所建模型預測效果良好。見表4。

表3 COVID-19患者住院死亡風險預測決策樹模型分類規則

表4 決策樹模型檢測正確率

圖1 影響因素重要性排序

圖2 決策樹模型
由于目前尚無針對COVID-19的特效治療藥物或疫苗,因此支持性護理,包括癥狀控制和并發癥預防仍然是最關鍵的治療方案[15],對于危重型患者這類高危人群[7],臨床醫師不僅需要關注患者自身基本情況,同時也需要積極采用多種特殊治療,如氣管插管[16]、康復血漿療法[17]、體外膜肺氧合[18]等,對臨床可能出現的多種并發癥進行處理。但正是由于影響住院患者死亡的因素太多,從而造成數據的復雜性程度高、噪聲大,因此需要靈活和高效的數據處理方法。決策樹作為一種重要的數據挖掘算法,相較于傳統的Logistic回歸或多元線性回歸,決策樹具有分類精度高、對噪聲數據有很好的穩健性、所提取規則可以量化且易于理解等優點[13],不僅可以從眾多因素中篩選出有統計學意義的危險因素,同時也可以對各危險因素不同水平下發生危險的可能性作出定性判斷。本研究以272例COVID-19患者為研究對象,采用決策樹模型法嘗試建立了COVID-19患者住院死亡風險預測模型,并深入探索了中藥治療(中藥湯劑或中成藥)與住院患者死亡之間的相關性。經測試集測試,模型預測的準確率達到了95.4%,表明模型預測效果良好,同時以對模型的影響力為評價標準,從高到低篩選出危重型比例、降鈣素原、中藥湯劑、淋巴細胞絕對值、中成藥等5個預測因素。
本研究中危重型患者被定義為出現呼吸衰竭,且需要機械通氣、或出現休克、或合并其他器官功能衰竭需要ICU監護的患者,既往研究結果表明危重型患者的死亡率要遠高于非危重型患者[7],這是因為危重型患者一般年齡偏大,合并疾病較多,因此更容易出現急性呼吸窘迫綜合征、呼吸衰竭、猝死等不良后果[19],本研究的結論支持既往研究結論。
現有研究結果表明,危重型COVID-19患者體內擁有更高濃度的粒細胞集落刺激因子、干擾素、巨噬細胞和腫瘤壞死因子等炎性因子,這表明炎癥風暴可能是加重患者病情和造成患者死亡的重要因素[8]。降鈣素原是反映患者體內炎癥水平的重要指標[20],其水平會隨著感染性疾病嚴重程度的增加而呈現顯著升高的趨勢,并與患者預后相關。本研究發現降鈣素原作為反映體內炎癥水平的特異性指標,在預測COVID-19患者死亡結局方面具有顯著作用,同時為既往研究結論提供了佐證。
淋巴細胞降低是COVID-19患者的重要特征之一,現有研究結果表明SARS-CoV-2可作用于人體T淋巴細胞,而病毒的大量復制導致T淋巴細胞耗竭,從而抑制機體免疫,導致人體淋巴細胞數量的下降[21],從而可能導致患者繼發細菌感染。中性粒細胞/淋巴細胞比值升高已經被多個研究證實與患者的預后相關[22],而本研究發現淋巴細胞降低可增加住院患者的死亡風險,對既往的研究結論進行了驗證。
本病尚無特效藥物[23],因此臨床常采用聯合用藥的治療方法,在國家政策的大力支持下[13],中醫藥被廣泛應用于一線臨床治療,并取得了良好的效果,有臨床研究表明,相較于單純西藥治療,中西醫結合治療可明顯減少COVID-19患者的死亡率,并縮短病程[24]。本研究深入探索了中醫藥與住院患者死亡率之間的關系,發現中藥干預(中藥湯劑與中成藥)是降低患者死亡率的重要因素,本研究結論與本課題組既往研究結果一致[25],通過對患者的中藥處方進行統計分析,發現主要涉及的中藥有麻黃、苦杏仁、茯苓、白珠、藿香、培蘭、黃芪、黨參等,相關研究結果表明中藥湯劑的多成分、多靶點特性直接或間接作用于COVID-19疾病特異性因子,從而達到改善患者癥狀的目的[26],但需要注意的是目前關于中醫藥應用于COVID-19患者的高級證據依然不足[27],未來需要更多大樣本的臨床研究進行驗證。
綜上所述,本研究基于決策樹法建立了評估COVID-19患者住院死亡的預測模型,并且經過測試準確率良好,最終篩選出危重型比例、降鈣素原、中藥湯劑、淋巴細胞絕對值、中成藥等5個預測因素,但由于時間和人員等多方面因素的限制,本研究采集的患者相關指標還不盡完備,并且樣本量較小,因此,篩選出來的危險因素及所建立的預測模型的代表性還需要更大樣本的臨床數據進行驗證。