郭祈福, 張海榮, 邵楠, 童曉維, 黃建釵,5
新型冠狀病毒肺炎(corona virus disease 2019,COVID-19)是由2019新型冠狀病毒感染引起的一種急性呼吸道傳染病,起病急、傳播快、傳染性強、流行范圍廣,其重癥患者易發生全身炎癥反應綜合征,引發多臟器功能障礙,死亡率高達13.4%[1]。此外,重癥患者通常需要更多醫療資源,給醫療系統造成巨大壓力。因此,早期識別重癥病例至關重要,有利于醫療資源的優化配置,并改善患者預后。目前,雖已存在多個成熟且廣泛應用的重癥病例預測模型[2],但多數是針對大型醫院收集的COVID-19患者的完整數據進行危險因素篩選及建模,其中部分指標在基層醫療單位難以獲取,故實用性不強,可操作性欠佳。因此,本研究擬納入常用且容易獲得的臨床變量,建立有效實用的預測模型,以便在不同場景下準確評估COVID-19患者的病情,幫助早期識別可能發展為重癥的高危患者。
1.1 對象 選取2020年1月17日—3月24日于湖北省宜昌市第三人民醫院住院的非輕型COVID-19成人患者343例,男性189例,女性154例,年齡(53.41±16.83)歲(18~91歲);訓練集240例(70%),男性140例,女性100例,年齡(53.61±16.89)歲(18~88歲);測試集103例(30%),男性49例,女性54例,年齡(52.94±16.77)歲(20~91歲)。診斷標準、臨床分型嚴格按照《新型冠狀病毒肺炎診療方案(試行第七版)》[3]。重型和危重型病例統稱為重癥病例。排除癥狀輕微且無肺部影像學改變的輕型患者。
1.2 方法
1.2.1 數據收集 收集錄入患者入院時的臨床特征(吸煙和飲酒史、并發癥、疾病分型、常見癥狀、生命體征等)及實驗室檢查數據,并經專人核查,核查過程存在的任何問題均由兩位專業醫師綜合判斷、解釋。
1.2.2 實驗室檢查 患者于入院時采集鼻咽拭子標本進行實時熒光定量聚合酶鏈反應(real time fluorescent quantitative polymerase chain reaction, qRT-PCR)以確診,采集血液進行血常規、血清生化(包括肝腎功能、肌酸激酶、肌酸激酶同工酶和乳酸脫氫酶等)、凝血功能、C反應蛋白和降鈣素原等檢查。

內部建模:訓練集240例,根據病情分為重癥組和非重癥組,將患者入院時的臨床特征及實驗室檢查指標采用非條件單因素logistic回歸分析,初步篩選COVID-19重癥病例的潛在預測因素,將單因素分析具有統計學意義的指標納入多因素logistic回歸分析(方法:向前),按分析模型的復雜程度分為自評模型(模型1)、基層模型(模型2)和復雜模型(模型3)。模型1:納入在上述單因素分析中P<0.05 的人口統計學特征、并發癥和臨床癥狀;模型2:除了模型1納入的因素外,增加了上述單變量分析中P<0.05的生命征和門診常規評估的化驗指標;模型3則包含了所有上述單變量分析中P<0.05的因素。
模型評估(內部驗證與外部驗證):采用R軟件(版本3.6.1),采用一致性指數及Nomogram列線圖評價預測模型的判別能力。將多因素分析中具有統計學意義指標的OR值取整賦值,計算各患者3種模型得分。為便于評估每個患者的具體病情,結合其得分,運用列線圖對每個患者的重癥概率進行預測分析。列線圖中,每個預測變量均單獨繪制,變量狀態與最頂部指定的點值相對應,最后將這些變量的點值相加并繪制在底部的總分標度尺上,該標度對應最底部的點值即發生重癥COVID-19的風險值。內部驗證:將訓練集患者的總分進行ROC曲線分析,通過Z檢驗比較3種模型曲線下面積評估預測模型效果,通過約登指數法確定診斷界值,計算模型的靈敏度、特異度、陽性預測值及陰性預測值。外部驗證:通過計算測試集患者3種模型得分并進行ROC曲線分析,同樣通過Z檢驗比較3種模型曲線下面積評估預測模型效果,通過訓練集樣本確定的診斷界值,計算3種模型的靈敏度、特異度、陽性預測值及陰性預測值。
2.1 訓練集和測試集患者的臨床特征和實驗室指標比較 兩組患者入院時的臨床特征和實驗室指標差別均無統計學意義(表1~2)。
2.2 訓練集患者的臨床特征 訓練集240例中,入院時重癥45例(18.75%);76例(31.7%)患者至少有1個并發癥,常見的并發癥為高血壓病60例(25.0%)、糖尿病28例(11.7%)和冠心病12例(5.0%);常見的癥狀為發熱191例(79.6%)、咳嗽176例(73.3%)和咳痰109例(45.4%),具體見表3。訓練集患者入院時的實驗室檢查結果見表4。

表1 訓練集和測試集患者臨床特征的比較

表2 訓練集和測試集患者的實驗室指標比較

表2 (續)

表3 訓練集患者入院時臨床特征中計數資料的描述性分析

表3 (續)

表4 訓練集患者入院時臨床特征和實驗室指標中計量資料的描述性分析
2.3 采用單因素和多因素logistic回歸分析篩選重癥患者的預測因素 針對訓練集患者總共36個變量進行單因素logistic回歸分析,結果顯示,22個變量(包括年齡、并發癥、從發病到首次入院的時間、發熱、咳嗽、咳痰、呼吸困難、疲勞、呼吸頻率>24 min-1,以及入院時血淋巴細胞、血紅蛋白、血小板、直接膽紅素、白蛋白、天門冬氨酸氨基轉移酶、乳酸脫氫酶、肌酸激酶、肌酸激酶同工酶MB、部分凝血活酶時間、D-二聚體、C反應蛋白和降鈣素原的水平)均與重癥COVID-19的發生相關,作為建立預測模型的預備因素(表5~6)。進一步行多因素logistic 回歸分析發現,存在并發癥、發熱、咳痰、呼吸困難、血淋巴細胞數減少和D-二聚體升高是重癥COVID-19的獨立預測因素(模型3,表7)。

表5 單因素logistic回歸分析篩選重癥新型冠狀病毒肺炎預測因素(臨床特征)

表6 單因素logistic回歸分析篩選重癥新型冠狀病毒肺炎預測因素(實驗室指標)

表6 (續)

表7 重癥新型冠狀病毒肺炎3種預測模型的多因素logistic回歸分析結果
本研究通過多因素logistic回歸分析構建了3個預測重癥COVID-19的模型:自評模型(模型1)、基層模型(模型2)和復雜模型(模型3),詳見表7。
模型1納入在上述單變量分析中P<0.05的年齡、并發癥和臨床癥狀(包括發熱、咳嗽、咳痰、呼吸困難和疲勞),多因素logistic回歸分析發現存在并發癥、發熱、咳痰和呼吸困難是重癥COVID-19的獨立預測因素。模型2除了模型1納入的因素外,增加了上述單變量分析中P<0.05的呼吸頻率、血常規中的淋巴細胞數、血紅蛋白、血小板和C反應蛋白水平,多變量分析發現存在并發癥、發熱、咳痰、呼吸困難、血淋巴細胞數減少是重癥COVID-19 的獨立預測因素。模型3則包含了所有上述單變量分析中P<0.05的因素,多變量分析發現有并發癥、發熱、咳痰、呼吸困難、血淋巴細胞數減少和D-二聚體升高是預測COVID-19重癥病例的獨立危險因素,其中發熱、D-二聚體升高,尤其呼吸困難是最強有力的預測因素。3個預測模型中各預測因素的OR值詳見表7。
2.4 重癥COVID-19預測模型的評估(內部驗證和外部驗證) 3個預測模型均以列線圖的形式呈現:模型1、2、3的一致性指數分別為0.902、0.924和0.943,決定系數R2分別為0.525、0.604和0.664 (圖1)。

圖1 模型1、模型2和模型3的列線圖Fig.1 Nomograms of model 1, model 2 and model 3
3種預測模型各預測因素的OR值取整賦值(表8),后在訓練集(內部驗證)和測試集(外部驗證)通過ROC曲線對3種預測模型進行評估、驗證。圖2顯示了3種預測模型的ROC曲線。3種模型的ROC曲線下面積(area under ROC,AUROC)在內部驗證時分別為0.898、0.920、0.937,在外部驗證時分別為0.870、0.878、0.879(P<0.001)。模型3的AUROC大于模型2,模型2的AUROC大于模型1,但3種模型對于重癥COVID-19的預測效果差別無統計學意義(圖2,表9)。內部和外部驗證均發現,3種模型預測重癥COVID-19的效能良好,具有較高的診斷敏感性(84.4%~90.0%)和特異性(67.5%~89.2%)、高的陰性預測值(negative predictive value,NPV)(均>95%)、可接受的陽性預測值(positive predictive value,PPV)(內部驗證:48.1%~65.0%;外部驗證:40.0%~53.1%)(表10)。

表8 3種預測模型預測因素OR值取整賦值情況

A:內部驗證;B:外部驗證。圖2 預測重癥新型冠狀病毒肺炎的受試者工作特效曲線Fig.2 Receiver operating characteristic curves for predicting severe COVID-19

表9 3種模型預測重癥新型冠狀病毒肺炎的效果比較
早期識別存在重癥風險的COVID-19患者并盡早采取恰當的醫療措施,不僅可避免醫療資源的濫用,還能改善患者的預后。本研究基于單變量和多變量分析的結果,構建并驗證了3種預測 COVID-19重癥病例的模型。模型1是一個自評模型,納入年齡、并發癥和常見癥狀,便于患者自行評估病情。模型2作為基層模型,除了模型1納入的年齡、并發癥和常見癥狀外,還增加了單變量分析中具有統計學意義且在基層醫療機構易于獲得的呼吸頻率、血常規中的部分指標和C反應蛋白,主要是方便醫生通過簡單的體檢和實驗室檢查快速評估風險,便于早期決策,特別適用于基層醫療單位或門診患者。模型3包含了單變量分析中P<0.05的所有變量,更加復雜,更適合醫生對住院患者病情的準確評估。列線圖作為這些模型的可視化預測工具,可作為醫生和患者早期評估個體疾病嚴重風險簡單有效的工具。在3個預測模型中,一致性指數均>0.9,決定系數R2>0.5,表明3個模型預測重癥COVID-19具有良好的效果。

表10 3種模型預測重癥新型冠狀病毒肺炎的效能
3種預測模型的內外部驗證均顯示有較高的AUROC、診斷敏感性、特異性和NPV,PPV雖不太高,但可接受。因此,3種模型均可作為預測COVID-19重癥病例的有價值的工具。與LIU等[4]的研究比較,本研究的預測模型不僅通過內部驗證,還進行外部驗證,具有更高的AUROC,而與GONG等[5]的研究比較,本研究的模型3具有更高的AUROC、診斷敏感性和特異性。相較于TANG等[6]和CHANG等[7]的研究,本研究建模的例數相對較少,但其建立的3種預測模型,適用于不同的場景,且各預測因素容易獲得,實用性更強。雖然OH教授的團隊也建立了3個預測模型[8],但這3個模型主要用于預測患者發生不同程度疾病進展風險的可能性,通過評估每個患者可能的修正臨床嚴重程度評分,結合3個模型,進一步評估其發生不同程度疾病進展的風險,而本研究中的3個預測模型,則是基于3個不同的場景,不僅醫生可用,也有利于患者自我評估,便于指導患者及時就診或住院治療。本研究通過對各模型預測因素的OR值取整賦值進行建模,更便于實際操作。因此,這3個模型對于準確的個體化評估重癥COVID-19病例具有各自的特點、優勢及應用場景。模型3的AUROC大于模型2,模型2的AUROC大于模型1,在診斷敏感性、特異性、PPV和NPV上表現出相似的結果。在一定程度上,可認為模型3對COVID-19重癥患者的預測效果優于另外兩個模型,但差別無統計學意義。
本研究發現,入院時存在并發癥、發熱、咳痰、呼吸困難、血淋巴細胞減低和D-二聚體升高與重癥COVID-19的發生相關,其中發熱、D-二聚體升高,尤其是呼吸困難,是COVID-19重癥病例最有力的預測因素。大量文獻證明,并發癥與COVID-19 的嚴重程度和致命結局有關,最常見的是高血壓病、糖尿病和冠心病[9-11]。除了上述類似的結果,本研究還發現,并發癥越多的患者,越有可能發展為COVID-19重癥病例,這與之前的研究[12-13]結論亦一致。
發熱是COVID-19患者最常見的臨床表現,重癥患者更常出現呼吸困難[14-15],本研究結果與之一致。本研究還發現,除了發熱(OR=10.611)和呼吸困難(OR=19.674),痰的產生也是重癥病例的早期預警指標。早期有痰的患者患重癥COVID-19的風險更高,在模型3中OR為4.033,原因可能是咳痰通常預示著合并細菌感染,從而加重患者的病情。本研究表明,發熱不僅是最常見的癥狀,而且是預測病情嚴重程度的最有力因素之一,而呼吸困難是重癥病例的最有力預測因素,這與文獻[8]的結論一致,提示同時有發熱和呼吸困難的患者應更加重視其發展為重癥病例的可能性。
血淋巴細胞參與清除新型冠狀病毒感染的細胞,因此淋巴細胞數的增加可能是COVID-19病情恢復的關鍵[16-17]。越來越多的證據表明,重癥COVID-19 患者經常出現血液高凝狀態[18],臨床上血栓栓塞事件發生率很高[19]。COVID-19患者淋巴細胞計數減少和D-二聚體升高與疾病嚴重程度升高和預后不良有關[9,15,19-20],本研究結果與之一致。本研究中,與對照組比較,血淋巴細胞數減少(<1.26×109L-1)和D-二聚體升高(≥1.35 μg/L)患者發生重癥的風險分別達到6.512倍和10.843倍。
以往研究表明,與年輕患者相比,老年患者具有更嚴重的病情和更差的預后,高齡是重癥病例的重要獨立預測因素[21-23],這與本研究多變量分析的結果不一致,考慮可能與樣本量小、單中心研究的選擇偏倚、統計分析方法不同有關。
本研究也存在一些局限性。第一,作為單中心回顧性研究,樣本量相對較小,有必要在未來的多中心前瞻性和縱向研究中進一步確認結果。第二,癥狀輕微且無肺部影像學改變的輕型患者預后好,且武漢COVID-19疫情暴發期間,因醫療資源緊缺,很多輕型患者未入院診療,為減少偏倚,在本研究中予以剔除,因此本研究的模型不適用于預測輕型患者。第三,考慮到入院時胸部影像學數據部分患者因病情危重或在基層醫療單位無法第一時間完善,同時兼顧建立模型的實用性,因此在分析研究數據時未納入影像學的資料建模,這可能在一定程度上影響模型的預測效能及PPV值。第四,3種模型的PPV都不太高,這意味著篩查陽性患者的概率不是太高,可能會導致一些醫療資源的浪費。但是,NPV高意味著漏診率低,有助于排除COVID-19的重癥患者。
總之,入院時存在并發癥、發熱、咳痰、呼吸困難、血淋巴細胞數減少和D-二聚體升高是重癥COVID-19的良好預測因素。本研究構建了3種簡單有效的模型作為預測重癥COVID-19的工具,當條件較差時,建議使用自評模型或基層模型,如果條件允許,為了獲得更好的預測結果,建議使用復雜模型進行預測。