韓松濤,趙曉群,黃艷春
(新疆醫科大學附屬腫瘤醫院檢驗科,新疆烏魯木齊 830011)
生物參考區間通常指參考值分布的95%置信區間[1],是解釋檢驗結果、分析檢驗信息的基本依據和尺度,同時可靠的參考區間對指導臨床患者診治提供堅實依據。國際臨床化學和實驗室醫學聯盟推薦的參考區間(RIs)建立方法對臨床實驗室過于復雜,錯誤使用率高[2]。國際臨床化學和實驗室醫學聯盟和美國臨床實驗室標準化協會在2010年共同修訂了名為《臨床實驗室中參考區間的定義、建立和驗證》的指南第3版(EP28-A3c)。在指南中,建立參考區間的方法得到了補充,使用不少于120例參考個體的非參數法,并指出參考區間的建立是繁瑣、耗時且昂貴的,因此允許臨床實驗室使用已建立的參考區間[3]。糖鏈抗原72-4(CA72-4)指標廣泛用于胃腸道腫瘤和卵巢癌的診斷、治療和預后監測[4-8]。新疆醫科大學附屬腫瘤醫院和新疆醫科大學附屬第四醫院CA72-4目前均采用試劑說明書中推薦的6.9 U/mL作為參考區間的上限,但在體檢中發現有些體檢者無明顯不適癥狀,卻表現出CA72-4異常高于試劑說明書中的參考區間的上限,初步猜測可能跟選擇的健康人群及地域有關。因此,本研究選取一家腫瘤專科醫院和一家綜合性醫院的體檢人群,初步建立CA72-4的參考區間,并評估其研究價值。
1.1一般資料 數據來自新疆醫科大學附屬腫瘤醫院及新疆醫科大學第四附屬醫院的實驗室信息管理系統,調取既往體檢健康者基本信息及CA72-4的檢測值,共39 957例。本研究僅對>18歲的成年人的指標進行分析,納入標準:(1)檢測信息完整準確,既往體檢健康者;(2)無胃腸、婦科疾病、藥物治療(如非甾體抗炎藥、糖皮質激素等)等基礎疾病史。排除標準:(1)有慢性疾病、代謝性疾病、營養性疾病的患者;(2)既往有相關治療病史。納入39 889例,其中男性17 484例,女性22 405例。本研究經醫院倫理委員會批準。
1.2儀器和試劑 全自動電化學發光免疫分析儀購自瑞士Roche公司,型號Cobase601;CA72-4檢測試劑盒和校準品購自瑞士Roche公司。采用經典的Westgard多規則質控作為室內質量控制(12s作為警告規則,13s、22s、R4s、41s、10x作為失控規則),新疆醫科大學附屬腫瘤醫院實驗室累積的變異系數(CV)為5%,附屬第四醫院實驗室累積的CV為7%。
1.3方法 使用偏度-峰度值檢驗(Skewness-Kurtosis)對數據進行正態性分析,當偏度值和峰度值分別小于對應偏度和峰度標準差的1.96倍即可判定為呈正態分布。非正態分布數據通過Box-Cox變換轉變為近似正態分布[9],并對變換后數據使用偏度-峰度值檢驗分析正態性,并繪制頻數分布直方圖。離群值剔除采用四分位間距法[10],剔除均值±1.5倍四分位間距之外的數值。運用非參數秩和檢驗、Spearman相關性分析計算該項目不同性別、年齡之間是否有統計學差異。采用非參數法進行RIs的建立。運用非參數統計法計算97.5%的值作為上限。
1.4統計學處理 運用Office Excel 2010及SPSS19.0軟件分析,通過非參數法,并依據參考變化值(RCV)=21/2×Z×[實驗室累積變異系數(CVA)2+生物變異度(CVI)2]1/2計算本研究所得到的結果差異是否具有統計學意義,比較CA72-4檢測項目的上限水平,建立符合本實驗室的CA72-4的RIs,并與當前所運用的RIs進行比較。
2.1數據分布 經分析整理,納入39 889例,剔除離群值后,最終納入的數據為34 937例,其中男性15 544例,18~<30歲1 626例,30~<50歲7 561例,50~<70歲5 247例,≥70歲1 110例;女性19 393例,18~<30歲682例,30~<50歲8 430例,50~<70歲8 956例,≥70歲1 325例,經Box-Cox變換后,繪制頻數分布直方圖觀察數據的分布情況,見圖1、2。

注:橫坐標表示CA72-4測量值(U/mL);縱坐標表示頻率(例)。
圖139889例CA72-4檢測數據分布直方圖

注:橫坐標為CA72-4測量值(U/mL),縱坐標為頻率(例)。
圖2最終納入34937例CA72-4值Box-Cox變換后分布直方圖
2.2CA72-4檢測結果和參考區間建立 運用非參數秩和檢驗,得出Z=-11.425,P<0.05,不同性別間差異有統計學意義,可依據性別建立RIs。運用Spearman相關性分析,CA72-4檢測結果與年齡差異無統計學意義(P>0.05),不能根據年齡建立RIs。采用非參數排序法,分別對已剔除過離群值的男、女數據進行升序排列,取97.5%的數值作為參考區間的上限。見表1。

表1 不同性別之間CA72-4測量值比較和參考區間的建立
2.3運用RCV公式比較 CA72-4的生物變異度為16.06%[11],新疆醫科大學附屬腫瘤醫院實驗室累積的CV為5%,附屬醫院第四實驗室累積的CV為7%,平均CV為6%。Z為95%的置信區間,在本研究中取1.96數值,經計算RCV=21/2×1.96×[0.160 62+0.062]1/2=47.52%;比較RCVmax及RCV的大小。得出男性RCVmax=25.36,女性RCVmax=27.10,不同性別所建立的RIs差異無統計學意義。
2.4運用EP28-A3c文件驗證參考區間 運用本研究建立的RIs發現,在34 937例數據中,異常例數1 367(占比3.91%),低于廠家提供的RIs刷選出的異常例數2 060(占比5.90%);按照EP28-A3c文件根據不同性別檢測20例健康體檢者的CA72-4,并進行驗證。經過驗證,本研究所建立的參考區間適用于本實驗室,見表2。

表2 CA72-4參考區間驗證和新RIs正常者、異常者的頻數變化
直接法建立參考區間需要篩選健康人群納入參考個體,這一過程極為昂貴和耗時,并且在當今的臨床工作中難以實現,尤其是當參考區間需要根據年齡和性別差異分別建立或者需要針對一些特殊人群進行研究時,入組參考個體的選取會變得異常困難。因此許多實驗室改為引用試劑廠商或者其他實驗室的參考區間,但是直接套用他人建立的參考區間可能會存在服務人群和檢測系統的差異,會對臨床工作和患者造成困擾[2]。因此,迫切需要一種快捷及簡單方便的方法建立本地區或者適合本實驗室的參考區間。國內外有許多研究基于大量樣本統計分析計算出檢測項目的RIs,如Robust法、Bhattacharya法、傳統的非參數法等[12]。隨著實驗室信息管理系統的發展,調取大量實驗室數據已并非難事,也為運用間接法建立實驗室RIs奠定了很好的基礎。同時制定嚴格的納入、排除標準可為數據的可靠性提供重要的保證。在本研究中,回顧性分析了近5年體檢人群的CA72-4結果,在制定納入、排除標準時,由于使用相對較長時間范圍內的數據,對于分析前的因素的控制并不是很明確,從而導致在建立參考區間受到影響,因此在制定納入、排除標準的同時,觀察體檢人群其他相應指標(生化、免疫、血常規等)或者是翻閱既往病例和進行電話隨訪并制定患者調查問卷,以排除潛在對該指標檢測有影響的人群;其次加大數據量可以優化所建立的參考區間,并盡可能將檢測結果不確定的人群控制在5%以下,以此來控制分析前因素對該指標的影響。
建立生物參考區間過程中,數據的剔除是關鍵步驟。本研究采用剔除四分位間距法[10],剔除均值±1.5倍四分位距之外的數值。運用此剔除方法要求數據呈正態或對稱分布,如原數據呈偏態分布,需將數據轉換成正態或對稱分布形式。本研究數據呈偏態分布,故選擇“Box-Cox”轉換方式對數據進行正態性轉換[9]。然而在間接法建立實驗室生物參考區間的文獻當中,數據剔除法各有不同[13-14],每種方法各有優缺點,在選擇數據剔除時可根據數據量和數據分布情況,選用不同剔除方法以到達剔除效果。許多離群值剔除方法都是以數據正態分布為前提[15],所剔除的離群值均按照剔除公式嚴格計算。本研究最終納入的數據為34 937例,共剔除4 952例,剔除比例為12.4%。出現這種情況,這與離群值剔除既按照剔除公式計算,又循環使用本研究中的方法直到剔除所有離群值為止有關;同時亦不排除本研究中數據基數大導致剔除比例較高。如果離群值剔除不正確會導致參考區間反常縮小或者擴大,因此只有嚴格按照剔除公式進行反復循環剔除離群值才能保證所建參考區間的正確性。
確定參考區間的上、下限是最重要的一環。通常確定參考區間的上、下限有參數法、非參數法及羅伯斯特法等[15]。參數法是建立參考區間的最經典的方法,但是一般要求數據必須呈正態分布。而大多數的數據并非正態分布,這也是限制了參數法在確立參考區間的應用。羅伯斯特法是一種介于參數法與非參數法之間的方法[16],具有類似參數估計的過程并且對樣本量沒有太高的要求,對于數據分布形態的要求不如其他的方法嚴格。正是這種特性使其在非正態分布的數據中同樣表現出色[3]。從嚴格意義上來說,羅伯斯特法是一種小樣本估計參考區間的方法,被廣泛應用于樣本量少于120例的情況中[15]。EP28-A3c指南明確指出非參數法是建立生物參考區間的推薦方法之一。由于參數法的計量水準明顯高于非參數法,因此非參數法對樣本數量的要求相對較高。根據相關研究者建議,使用非參數法進行參考區間研究,最小的可靠觀測量為120例。無論獲得多大量的參考值,數據仍然應該根據非參數方法分析并根據適當的百分位數報告[3]。對大部分分析物而言,應該選取數據分布的2.5%和97.5%百分位值作為上、下參考限的取值[3]。
現中國大多數醫院所使用的參考區間均是依據歐美健康人群所建立的,且根據衛健委最新頒布的有關腫瘤標志物的參考區間行業標準(WS/T645.2-2018)中并沒有涉及CA72-4。本研究通過采用非參數法建立參考區間,得出CA72-4參考區間男性<8.65 U/mL,女性<8.77 U/mL,與試劑廠商所提供的參考區間有一定的差別,這種差別有可能是因為地區或者人群的選擇不同,也有可能是在本研究中僅采用了非參數法這一種方法進行參考區間的建立,不排除此種方法存在局限性。因此在建立參考區間的過程中可進行兩種以上方法的比較,以得出更加符合本實驗室或者本地區健康人群的參考區間。
本研究通過非參數法初步得到新疆地區CA72-4的參考區間,具有一定參考價值。同時隨著醫院的實驗室信息管理系統逐步完善,使用間接法建立實驗室指標的RIs比直接法更加簡單明了,相應技術要求較低。對于各級醫院實驗室可依據不同地區、不同人群建立符合本地區或本實驗室的RIs,為臨床或患者提供更好參考依據。