王 瑩 李莉芳 何航幟 楊青青 張垚燁 張巖波,3,4△ 趙 卉△
【提 要】 目的 應用隨機森林模型探討慢阻肺患者報告結局(COPD-PRO)中各維度與modified Medical Research Council(mMRC)呼吸困難評分一致性評價的效果,以評估COPD-PRO對患者癥狀判斷的準確性。方法 于山西13所醫院收集300例慢阻肺患者,以mMRC評分生成的二分類變量為結局變量,COPD-PRO13個維度為預測變量,并納入人口學特征變量,構建隨機森林模型,并與決策樹模型進行比較。結果 IND(獨立性)、ANX(焦慮)、COG(疾病認知)、DEP(抑郁)等維度對于慢阻肺患者報告結局量表的癥狀評估的貢獻較大。兩種模型性能比較結果顯示,隨機森林的特異度、精準度和AUC和F1值都高于決策樹模型。結論 隨機森林模型在慢阻肺患者報告結局的癥狀評估中具有較好的預測效果,并識別影響患者癥狀的相關因素,為臨床治療與管理提供理論依據。
慢性阻塞性肺疾病(chronic obstructive pulmonary disease,COPD)是一種因氣道和/或肺泡異常引起的,常見的、可預防和可治療的疾病[1]。2017年全球疾病負擔研究報告顯示,估計2017年全球COPD的時點患病率為3.92%[95%CI(3.52%,4.32%)],COPD導致的病死率估計為42/10萬(占所有原因死亡的4.72%),估計傷殘調整壽命年(DALYs)率為1068.02/10萬[2]。COPD最常見的呼吸癥狀包括呼吸困難、咳嗽和/或咳痰,患者對這些癥狀的報告可能不足[1]。
2011年,GOLD指南在對于COPD患者評估分組提出的新方法中[3],增加了患者急性加重的風險和相關臨床表現,關于患者臨床癥狀的評估,采用的是modified Medical Research Council(mMRC)呼吸困難等級評分和COPD評估測試(CAT)[4]。在疾病管理的背景下,急性加重是COPD的重要臨床事件,在很大程度上導致患者生活質量下降[5],而慢病管理的核心就是提高患者的生命質量?;颊邎蟾娼Y局是直接來自患者對自身健康狀況和治療感受的報告。研究表明,關注患者報告結局有助于全面了解患者的情況,并且相關內容已被納入2020年COPD全球倡議(global initiative for chronic obstructive lung disease,GOLD)中[6]。但此量表無法直觀反映出COPD患者的癥狀嚴重程度。
因此本研究利用慢阻肺患者報告結局(COPD-PRO)評分結果,采用隨機森林模型實現對COPD患者癥狀嚴重程度的預測,并與決策樹模型的預測性能進行比較,探索出影響患者癥狀的相關因素,并為患者改善癥狀提供理論依據,并為患者提供針對性的治療、干預與管理措施提供科學指導。
本研究分別在山西省山西醫科大學附屬第一醫院、山西醫科大學附屬第二醫院、山西省人民醫院、山西中醫藥大學附屬醫院等13所醫院進行現場調查。每家醫院內均有呼吸科醫生或護士擔任負責人,對其進行簡要培訓之后,負責患者調查。本研究要求參與者能夠獨立完成量表填寫(老年者詢問家屬,負責人代理填寫)。
納入標準:(1)確診為慢性阻塞性肺病的患者;(2)年齡>18歲;(3)同意接受調查者。排除標準:(1)并發精神疾病的患者;(2)由于智力障礙或其他原因導致不能完成問卷者??傆嫲l放340份問卷,最后回收316份,回收率為93.24%,其中有效問卷為300份,有效率為94.94%。
(1)問卷內容
調查問卷由3部分組成,分別為COPD患者人口學特征、COPD-PRO[7]和mMRC量表。
COPD-PRO由四個領域組成,共13個維度57個條目。研究表明,該量表具有較優的信效度[8],量表采用likert式五級記分法。各維度信度系數具體見表1。mMRC是一種呼吸困難量表,較易使用。有研究表明,與客觀功能參數相比,呼吸困難與慢阻肺患者生活質量的相關性更好[9-10]。根據呼吸困難程度分為5個等級(0~4級)。0級:劇烈活動時出現呼吸困難;1級:在平地快走或爬緩坡時出現氣短或呼吸困難;2級:由于氣短或呼吸困難,在平地行走的速度要比同齡人慢或中途需要停下休息;3級:在平地上步行100米左右或數分鐘后就需要停下休息;4級:因嚴重呼吸困難而不能出門或自己穿脫衣服。0~1視為癥狀少,≥2視為癥狀多,并將此作為本研究的因變量,自變量包括年齡、性別、收入、吸煙、飲酒、家族史、環境影響(粉塵、油煙)、并發癥、醫保情況等基本情況和COPD-PRO中的13個維度。

表1 慢阻肺患者報告結局量表及各維度信度系數
(2)統計方法
本研究采用SPSS 22.0對基本情況進行描述性分析,采用R語言“rpart”包構建決策樹模型,通過調節maxdepth、minsplit、minbucket、最小代價復雜度參數CP值等參數對決策樹進行剪枝;用“randomForest”包構建隨機森林模型,通過選擇合適的顆數參數(ntree)和隨機選擇特征數目參數(mtry)構建最優模型。將mMRC評分癥狀少記為“1”,癥狀多記為“2”。采用隨機抽樣的方法,從中抽取70%的數據作為訓練集,剩余數據用于測試集,利用特異度、靈敏度、精準度、AUC值來評價兩種模型的預測效果。
① 決策樹模型
決策樹模型是由根節點、分支節點和葉節點構成的樹狀樣結構,反映特征與標簽之間的映射關系[11]。與隨機森林的“黑箱式”模式相比,決策樹模型的原理更加簡單易懂[12],它的核心就是通過對數據的學習,選定判斷節點,構造一棵合適的樹,還可以利用建好的決策樹對分類樣本集進行分類[13]。這一特點使決策樹更加適用于復雜的臨床研究環境。
② 隨機森林模型
2001年Breiman提出了一種統計模型—隨機森林模型[14],它是以CART決策樹為基礎的Bagging集成算法[15]。隨機森林同時訓練多個決策樹,綜合考慮多個結果,同時引入隨機特征值的選擇與樹的完全分裂,使模型更加多樣化[16],這也是優于決策樹算法的一個特點。它的優勢是不易產生過擬合現象,抗噪能力好。
本研究共納入300例COPD患者,平均年齡為(70.82±10.99)歲,最小年齡為32歲,最大年齡為91歲。mMRC評分為癥狀少的有113人,癥狀多的人有187人。其余變量的基本信息及變量賦值見表2。

表2 300例慢阻肺患者人口學特征資料的統計描述及變量賦值
對決策樹進行前剪枝發現,限制樹生長的最大深度、最小分支節點數及葉節點的最小樣本數對決策樹準確度的影響并不大。因此,通過選擇合適的CP值對決策樹進行后剪枝,來確定最終模型。通常是通過模型的預測誤差及其標準誤來選擇合適的CP值[12]。不同CP值對應的誤差結果見表3。當分裂次數為2時,決策樹模型的驗證誤差最小,對應的CP值為0.0203;當分裂次數為6時,訓練集對應誤差最小。因此利用兩個CP值分別建立對應的決策樹,并在測試集上比較模型的預測性能,發現當CP值為0.01時,決策樹的特異度和靈敏度之和最大,精準度最高。決策樹可視化如圖1,圖中數字表示正確分類的數量和節點中的觀測值數量,如141/210表示為,節點中觀測值數量為210(訓練集樣本量),正確分類的數量為140。由圖可見,最終納入模型的變量為人口學特征中的飲酒和焦慮、抑郁、滿意度等維度。

圖1 決策樹可視化

表3 不同分裂次數對應的CP值
(1)顆數參數的選擇
本研究將ntree分別設置為100、200、300和400,通過比較各個模型的特異度、靈敏度、精準度和AUC值來確定最優顆數。具體結果見表4。由表4中的結果可以看出,當ntree=100時,模型的特異度、精準度和AUC值處于最優水平,因此本研究采用ntree=100的隨機森林模型作為最終模型。

表4 不同顆數的隨機森林模型性能比較
(2)隨機選擇特征數目參數的選擇
本研究納入的自變量共有22個,根據隨機特征計算公式[log2(p)+1](P為特征變量數)得出本研究的參數應設置為5。將mtry分別設置為3、4、5、6,比較不同特征選擇數的模型性能,具體結果如表5所示。當mtry=6時,隨機森林模型的特異度、靈敏度和精準度都處于最優水平,因此本研究將mtry設置為6建立最終模型。

表5 不同特征選擇數的隨機森林模型性能比較
(3)各變量重要性評分
在建立隨機森林模型時,隨機森林方法計算出了模型中各個變量的重要性評分,具體結果如圖2所示。除人口學特征中的飲酒等因素對患者癥狀有較大影響外,焦慮、獨立性、疾病認知、抑郁等維度對隨機森林模型準確度和Gini系數的影響較大,說明這些指標對慢阻肺癥狀等級分類具有較大的貢獻。

注:左圖橫軸表示變量替換后模型準確率的下降,右圖橫軸表示變量替換后Gini系數的下降,縱軸表示模型中的各個變量。坐標軸從上往下排列的各個變量評分逐漸減小,數值越大表示變量越重要,對模型的影響越大。
將最終的決策樹模型和隨機森林模型在測試集上進行測試,各個評價指標結果如表6所示。從表中結果可以看出,隨機森林模型的特異度、精準度、AUC值和F1值都高于決策樹模型。因此,綜合來看,隨機森林模型在患者報告結局評分對于癥狀嚴重程度的預測有較好的表現。

表6 隨機森林和決策樹模型在測試集中的模型性能比較
本研究在構建決策樹和隨機森林模型時發現,飲酒對于慢阻肺患者癥狀影響較大。Ryan Ng等人[17]的研究發現,與輕度飲酒者相比,不飲酒者與六種慢性疾病[充血性心力衰竭(CHF)、COPD、糖尿病、肺癌、心肌梗塞(MI)和中風]任何一種的風險增加都有關。在三個歐洲國家進行的一項為期20年的研究發現,在患有COPD的中年男性中,與輕度至中度飲酒者相比,重度飲酒者的死亡風險增加了一倍以上[18]。在我國,飲酒與COPD的相關性研究較少,未來本研究會將飲酒劃分為更詳細的標準再次評估。除人口學特征變量外,患者報告結局中包含的部分維度如焦慮、獨立性、疾病認知、抑郁等對患者癥狀嚴重程度的預測也有較大的影響。
本研究發現,獨立性對慢阻肺患者癥狀的多與少會有較大影響。獨立性所對應的問題是(1)您在彎腰、屈膝或下蹲時會出現呼吸困難嗎?(2)您在外出活動時,需要經常停下來休息嗎?(3)您能打掃衛生、提重物爬樓梯或走有坡度的路嗎?(4)早晨穿衣梳洗會花費您很長時間嗎?可見獨立性與患者日?;顒佑休^大關系。Warz H等人[19]研究發現,與同齡患者相比,COPD患者通常表現為運動減少和久坐的生活方式,這與多種不利的健康結果有關。運動減少是日常生活的一個重要特征。它可以在日常生活中直接和不顯眼地測量,是一個相關的以患者為中心的結果[20]。有研究指出,改變COPD患者的身體活動行為需要一種跨學科的方法,將呼吸醫學、康復醫學、社會科學和行為科學結合起來[21]。因此,臨床工作人員應對患者及其家屬做好相關健康教育,讓患者和家屬都能知曉獨立性活動的重要性,讓患者出院后也能保持有效的活動,從而提升患者的生命質量。
本研究發現,焦慮和抑郁會影響COPD患者癥狀的嚴重程度。精神健康相關疾病是全球老年人殘疾增多和生活質量降低的主要原因[22]。而COPD患者常見的精神疾病有心境障礙、輕度抑郁和焦慮障礙[23-24]。有證據表明,與常規護理相比,綜合肺康復(肺康復、運動加教育)能降低患者短期內的焦慮和抑郁癥狀水平[25];以及包括認知行為治療和咨詢在內的心理治療可以改善COPD患者的焦慮和抑郁癥狀[22-23]。因此,臨床工作者在對患者進行臨床治療的同時,也應關注患者的心理健康,幫助患者保持健康的心態,樹立戰勝疾病的信心。
本研究發現,患者對疾病的認知以及治療效果、醫院服務滿意度均會影響到患者癥狀的數量。這與J W Dodd和Marco Contoli等人[26-27]的研究結果相似。大多數研究表明,COPD患者在整體感知、記憶和運動功能等領域都有明顯的認知障礙[28-30]。有研究指出,幾乎一半的COPD患者不堅持服藥[31]?;颊邔ζ渌幬锏臐M意度會影響與治療相關的因素,例如他們繼續使用藥物的可能性、正確使用藥物以及對藥物治療方案的依從性[32-33]。因此,醫院應建立完善、合理的健康教育體系,加強對COPD患者的健康教育;并提高服務質量,加強醫患溝通,建立友好的醫患關系,有助于提高患者的疾病認知水平。
PRO對于評估癥狀、癥狀對日常生活活動的影響和治療反應至關重要[34]。但對于測量患者報告結局癥狀的研究,有研究將圣喬治呼吸問卷(St. George′s Respiratory Questionnaire)納入分析[35],對于mMRC等級的研究較少,且大多使用多元線性回歸,但該方法在處理變量共線性、變量間潛在的交互作用等方面具有一定的局限性[36]。因此本研究采用決策樹和隨機森林模型,利用COPD-PRO各維度作為自變量進行患者癥狀多少的預測,評價其預測結果與mMRC呼吸困難評分的一致性,以評估COPD-PRO對患者癥狀判斷的準確性,并探索影響患者癥狀多少的相關因素,為臨床治療與管理提供理論依據。
本研究還存在一些局限。在修訂的GOLD 2011指南中指出,在對COPD患者進行分類時,不僅要考慮患者的功能嚴重程度,還要考慮患者癥狀和病情惡化的風險[37],但本研究只考慮到了患者癥狀的嚴重程度。另外,本研究的總樣本量不夠大,所得到的健康狀態相對較少。因此,本研究在未來將從以下幾個方面進行完善:(1)將電子病歷中的功能指標納入研究,改善模型的預測性能;(2)采用深度機器學習算法,提高模型的靈敏度,提升模型評估效果;(3)對患者追加隨訪,將數據實時更新,將模型應用于縱向數據。