王航 楊慶斌
隨著人口老齡化、城市化及其相關風險,慢性阻塞性肺疾病(chronic obstructive pulmonary disease,COPD)越來越成為我國國民的主要死亡原因[1]。肺功能測試(pulmonary function test,PFT)是診斷COPD的常規方法,根據慢性阻塞性肺疾病全球倡議(global initiative for chronic obstructive lung disease,GOLD)的定義,COPD的特征為1秒內用力呼氣量和用力肺活量比值(FEV1/FVC)<70%[2]。但FEV1比FVC隨年齡下降更快,因此GOLD定義容易對老年COPD過度診斷[3]。因此,一些學者建議使用正常值低限(lower limit of normal,LLN)診斷COPD[4]。LLN是按年齡分層的FEV1/FVC比值的截止值,研究表明,在老年人中應用任何人群來源的LLN都會出現較低的COPD患病率估計值[5]。因此,應選擇哪種方法,是否有其他PFT變量可以提高GOLD或LLN的診斷準確性,以及哪種定義能夠更準確的判斷預后是目前面臨的問題。本研究建立專家小組作為參考標準,對GOLD和LLN定義進行驗證,并評估其對預后的判斷能力。
本研究為回顧性病例對照研究,選取2018年1月~2020年6月我院呼吸科診治的患者202例。納入標準:①年齡≥40歲;②出現慢性咳嗽、咳痰、喘息等慢性呼吸癥狀;③接受了詳細的標準化臨床檢查,包括PFT、胸部X線和超聲心動圖。排除標準:①合并肝腎疾病、其他部位的急性或慢性感染、代謝疾病;②精神疾病、惡性腫瘤疾病;③癥狀無法評估者。本研究經醫院倫理委員會批準(倫理號:20220114),所有患者均在入院時簽署了知情同意書。
通過電子病歷統計患者的人口學特征和臨床資料。PFT使用沙丁胺醇作為支氣管擴張劑,計量吸入器給藥,總劑量為400μg,15min后進行測量,重復操作直到獲得3個可接受的測量值。如果沙丁胺醇存在禁忌,則使用異丙托溴銨,總劑量為160μg,操作在給藥后30min進行。根據ATS/ERS指南檢測肺功能指標預測值[6]。
在沒有真正的參考標準的情況下,本研究成立COPD專家小組作為參考診斷,專家小組由1名呼吸內科主任醫師和2名主治醫師組成,根據病史、吸煙史、胸部X線以及PFT等臨床評估的所有可用結果確定是否存在COPD。除FEV1/FVC外,還參考PFT的其他參數,包括一秒用力呼氣容積(forced expiratory volume in 1s,FEV1)、用力肺活量(forced vital capacity,FVC)、殘氣量(residual gas volume,RV)、肺總量(total lung capacity,TLC)和肺一氧化碳彌散量(diffusion capacity for carbon monoxide of lung,DLCO)。此外,吸煙年數、臨床癥狀或除COPD外其他肺部疾病史均可在需要時使用。
根據GOLD標準,GOLD定義為使用支氣管擴張劑后FEV1/FVC<70%。根據樣本量以及與研究人群年齡的可比性,選擇復旦大學附屬中山醫院正常人群的LLN公式(LLN中山)[7]和哈爾濱醫科大學公共衛生學院的正常人群LLN公式(LLN哈醫)[8],LLN定義為FEV1/FVC低于年齡相近的健康參照組的下5%。誤診數定義為假陽性與假陰性例數之和,COPD加重定義為需要短期(7~10天)口服糖皮質激素,所有患者隨訪2年,預后結果包括COPD加重、COPD住院和全因死亡。

專家小組和GOLD定義診斷的COPD有著相似的基線特征,與無COPD患者相比,COPD患者年齡較大,多為男性,死亡率較高,吸煙年數較長,身體質量指數(body mass index,BMI)較低,β受體阻滯劑和抗膽堿藥的使用率較高;PFT檢查顯示,COPD患者FEV1%預計值,FVC%預計值和DLCO%預計值以及FEV1/FVC較低,TLC%預計值,RV%預計值和RV/TLC%預計值較高,差異有統計學意義(均P<0.05)(見表1)。
與專家小組診斷相比,GOLD定義假陽性16例,假陰性17例;LLN中山假陽性5例,假陰性44例;LLN哈醫假陽性9例,假陰性45例。與GOLD相比,兩組LLN的特異度較高,敏感度較低。GOLD與專家小組診斷高度一致,LLN中山和LLN哈醫與專家小組診斷中度一致(均P<0.05)(見表2)。
隨訪期間74例患者經歷了至少一次COPD加重發作,34例患者因COPD原因住院,全因死亡患者30例。在所有COPD定義中,與無COPD患者相比,COPD患者的預后明顯較差(見表3)。
單變量Cox回歸分析顯示,專家小組診斷對患者預后的判斷能力最強,其次是GOLD和兩組LLN的診斷(均P<0.05)(見表4)。

表1 根據專家小組和GOLD定義患者的基線特征[M(QR)/n(%)]

表2 以專家小組診斷為參考測試GOLD和LLN的診斷測試性能[n(%)]

表3 不同定義中有無COPD患者預后比較[n(%)]

表4 不同COPD定義預后的單變量Cox回歸分析
在PFT變量中,FEV1%預計值和RV/TLC%預計值對專家小組COPD診斷的效果最好。使用專家小組診斷作為參考,上述變量的AUC(95%CI)分別為0.953(0.931~0.975)和0.851(0.815~0.899)。將FEV1%預計值和RV/TLC%預計值添加到GOLD或LLN定義中,顯著提高了診斷性能。GOLD定義的κ(95%CI)增加到0.838(0.732~0.983)(P<0.05),誤診的數量減少至17。LLN中山和LLN哈醫定義的κ(95%CI)上升至0.799(0.625~0.803)和0.807(0.776~0.932)(均P<0.05),誤診數量下降至20和19。
由于調查設計、診斷標準和分析方法的不同,各項研究報告的COPD患病率差異也不相同,這使得數據比較復雜化[9-10]。本研究使用專家小組診斷進行內部驗證,專家小組的診斷與COPD加重、COPD住院和全因死亡高度相關,強調了專家小組診斷的有效性。本研究發現,專家小組診斷作為參考時,GOLD定義的假陽性診斷和LLN定義的假陰性診斷較多。選擇GOLD診斷COPD是為了易于簡化和推廣。但在沒有COPD病理表現的老年患者中,FEV1/FVC也可能低于0.7,肺活量測試結果>0.7也并不一定排除COPD診斷[11]。此外,老年患者進行FVC操作時,往往不能完全將肺排空,使得FVC降低,FEV1/FVC增加,導致COPD的誤診[12]。多項研究表明[13-15],當使用LLN定義時,診斷為COPD陽性的患者更少,特別是在老年人中,與本研究的結果相似。然而,這些研究均只比較了LLN和GOLD兩種定義,沒有設置參考檢驗,無法證實哪種方法診斷性能更好。
在診斷研究中,需在特異度和敏感度之間進行權衡,評估假陽性和假陰性病例的后果。COPD的假陽性結果可能導致過度治療,從而造成額外的費用,肺部用藥的不良反應可能對部分患者造成傷害。此外,假陽性診斷還增加了醫生和患者忽視心血管疾病和心力衰竭等其他病因的風險。假陰性診斷的影響是對早期COPD患者的治療不足。本研究顯示,LLN傾向于將輕度梗阻的老年人歸為無COPD,LLN識別出的臨床相關預后事件少于GOLD或專家小組診斷。說明當使用LLN診斷時,接受針對減少上述事件治療的患者將會減少,增加了將COPD患者分類為無COPD的可能,從而增加了老年患者治療不足的風險。早期診斷和識別假陰性,可在肺損害仍為輕度時,采用戒煙咨詢和運動訓練等干預策略[16-17]。開始藥物治療可以減輕癥狀,提高生活質量,減少急性發作次數。因此指南提倡盡早發現氣流限制[6]。
本研究顯示,專家小組診斷最能預測COPD加重、肺部住院和全因死亡的發生,其次是GOLD定義,最后是兩個LLN定義。將專家小組中對COPD診斷效果最好的FEV1%預計值和RV/TLC%預計值兩指標添加到GOLD或LLN定義中,顯著提高了診斷性能并減少誤診。FEV1是氣道阻塞重要的決定因素[18-19],RV/TLC%預計值與FEV1%預計值高度負相關[20]。對于GOLD定義FEV1/FVC<0.70但FEV1%預計值和RV/TLC%預計值為正常值的受試者,應對COPD診斷進行重新評估。
本研究的局限性是在評估其他PFT變量的附加價值以改善GOLD或LLN的診斷時可能存在合并偏差。PFT參數在專家小組的診斷中起著重要作用,因此,應考慮對FEV1%預計值和RV/TLC%預計值等PFT變量的診斷性能是否過于樂觀。將FEV1%預計值和RV/TLC%預計值納入GOLD或LLN定義仍需要進行外部驗證和精確的臨界值計算。本研究的目的不是創建新的COPD定義,而是提高對FEV1/FVC<0.7的單一固定臨界值和年齡調整LLN定義的一些缺點的認識。綜上所述,與專家小組診斷相比,GOLD定義和常用的LLN定義都存在不足,將FEV1%預計值和RV/TLC%預計值添加到診斷定義中可減少誤診數量。