李 昕,賈正仙
(昆明醫(yī)科大學(xué)第一附屬醫(yī)院 醫(yī)學(xué)檢驗科,云南 昆明 650032)
生物參考區(qū)間是解釋、分析檢驗結(jié)果的依據(jù),可直接采用國家權(quán)威機構(gòu)或權(quán)威刊物發(fā)表的適合實驗室的生物參考區(qū)間,也可自行建立或直接引用試劑供應(yīng)商提供的生物參考區(qū)間,但需對引用的生物參考區(qū)間進行驗證確認[1,2]。隨著計算機信息技術(shù)的發(fā)展,有眾多學(xué)者提出利用實驗室儲存的大量數(shù)據(jù),建立以數(shù)學(xué)統(tǒng)計模式為基礎(chǔ)的生物參考區(qū)間(間接法)[3],并被美國臨床實驗室標準化委員會(CLSI)和國際臨床化學(xué)聯(lián)合會(IFCC)共同頒布的導(dǎo)則EP28-A3c所認可。2018年4月27日中華人民共和國國家衛(wèi)生健康委員會發(fā)布了國家行業(yè)標準WS/T 404.4-2018《臨床常用生化檢驗項目參考區(qū)間第4部分:血清總膽紅素、直接膽紅素》。該行業(yè)標準的參考樣本選擇了東北(沈陽)、華北(北京)、西北(西安)、華東(上海)、華南(廣州)和西南(成都)6地區(qū)城鄉(xiāng)居民。這些地區(qū)相比昆明地區(qū)均處于低海拔地區(qū),同時昆明地區(qū)民族人口眾多,所以需要驗證行業(yè)標準是否適用于昆明地區(qū)人群。
本文利用本院實驗室信息管理系統(tǒng)(laboratory information system,LIS)數(shù)據(jù)庫中存儲的血清總膽紅素(TBIL) 與直接膽紅素(DBIL) 的檢測數(shù)據(jù),獲取本地區(qū)生物生物參考區(qū)間,并與行業(yè)標準進行比較,從而獲得一種快速建立本地區(qū)的生物參考區(qū)間的方法,現(xiàn)報告如下。
材料與方法 一、數(shù)據(jù)來源 昆明醫(yī)科大學(xué)第一附屬醫(yī)院實驗室信息管理系統(tǒng)(LIS) 中儲存的2017年12月-2018年11月份所有體檢人群的TBIL和DBIL的實驗室檢測數(shù)據(jù),共獲得健康男性20~79歲27 023份數(shù)據(jù),健康女性20~27歲22 804份數(shù)據(jù)。
二、儀器和試劑 本實驗室所有體檢人群數(shù)據(jù)均是用配套儀器(Cobas8000) 及配套試劑檢測而得,同時在每天開關(guān)機分別使用配套的常規(guī)生化多項目質(zhì)控品(中值C.A.F.S批號:186380;高值C.A.F.S批號:186394)進行室內(nèi)質(zhì)量控制。如果質(zhì)控失控均及時糾正后才可做常規(guī)標本。
三、方法 1.通過使用計算機結(jié)構(gòu)化查詢語言(Structured Query Language,SQL) 將所有做了TBIL和DBIL的數(shù)據(jù),同時將做了以下檢驗項目紅細胞、血紅蛋白、丙氨酸氨基轉(zhuǎn)移酶、天門冬氨酸氨基轉(zhuǎn)移酶、總蛋白、白蛋白、γ-谷氨酰轉(zhuǎn)移酶、總膽汁酸、總膽固醇、甘油三脂、尿素、肌酐等超出參考范圍的異常樣本數(shù)據(jù)踢除。已盡可能排除存在血液系統(tǒng)疾病,肝膽疾病以及腎臟疾病對膽紅素的影響。
2.將剔除后最終數(shù)據(jù)共獲得健康男性20~79歲14 722份數(shù)據(jù),健康女性20~79歲12 687份數(shù)據(jù)導(dǎo)出至EXCEL表中,運用Dixon法判斷離群值,并剔除。
3.觀察頻數(shù)分布圖,運用Kolmogorov-Smirnov檢驗分別驗證男、女TBIL和DBIL資料分布情況及同性別不同年齡的資料分布情況。
4.生物參考區(qū)間建立和驗證:依據(jù)中華人民共和國衛(wèi)生行業(yè)標準WS/T404-2018《臨床常用生化檢驗項目參考區(qū)間第4部分:血清總膽紅素、直接膽紅素》計算P2.5~P97.5為其95%參考區(qū)間,對TBLL、DBLL進行驗證,對不能接受的給予重建。
四、統(tǒng)計學(xué)分析 1.使用Office Excel 2016辦公軟件錄入各組數(shù)據(jù)。首先將檢測數(shù)據(jù)按照大小排序并計算極差R,然后分別計算最大和最小值與其相鄰數(shù)值之差D;若D/R≥1/3,則將最大值或最小值視為離群值予以剔除;將余下數(shù)據(jù)重復(fù)前述步驟進行離群值檢驗,直至剔除所有離群值。
2.使用SPSS 22.0統(tǒng)計軟件觀察頻數(shù)分布圖及Kolmogorov-Smirnov檢驗判斷資料分布情況,最后分別按照性別年齡進行分組,分別用非參數(shù)方法計算參考樣本組以P2.5為參考下限,P97.5為參考上限,建立男20~59歲、男60~79歲、女20~59歲、女60~79歲4組參考區(qū)間。
3.不同組間采用獨立樣本T檢驗來比較實驗室數(shù)據(jù)得到的參考區(qū)間上限分別比較后,再與行業(yè)標準中的參考區(qū)間上限進行比較,看是否存在差異。
結(jié) 果 一、離群值的剔除:男、女的TBIL,DBIL4組數(shù)據(jù)均存在2個離群值。剔除后TBIL健康男性20~59歲12 589份數(shù)據(jù)、60~79歲2 131份數(shù)據(jù);健康女性20~59歲10 894份數(shù)據(jù)、60~79歲1 791份數(shù)據(jù);DBIL健康男性20~59歲10 981份數(shù)據(jù)、60~79歲1 324份數(shù)據(jù);健康女性20~59歲9 090份數(shù)據(jù)、60~79歲1 056份數(shù)據(jù)。
二、數(shù)據(jù)分布:從LIS數(shù)據(jù)庫中提取的各組TBIL,DBIL數(shù)據(jù)均成偏態(tài)分布,不同性別按年齡分組比較,分別計算以P2.5~P97.5建立參考區(qū)間,見表1,表2。通過統(tǒng)計學(xué)分析,總膽紅素及直接膽紅素在同一性別的不同年齡分組間無統(tǒng)計學(xué)差異(P<0.05)。無論男性,還是女性的TBIL,DBIL參考區(qū)間均不受年齡影響。
三、不同性別分別進行使用獨立樣本T檢驗進行比較,比較結(jié)果見表3。不同性別血清TBIL和DBIL的參考區(qū)間相比,差異均有統(tǒng)計學(xué)意義(P<0.05),且男性>女性。
四、本地區(qū)建立的TBIL與DBIL的參考區(qū)間上限均高于行業(yè)標準WS/T 404.4-2018。TBIL、DBIL下限對于臨床無意義,即將下限均設(shè)為0,上限四舍五入取整數(shù),見表4。昆明地區(qū)的總膽紅素與直接膽紅素參考區(qū)間均高于現(xiàn)行的國家標準。
討 論 血清中的膽紅素來源有3個方面,絕大部分來自人體紅細胞衰老后的血紅蛋白分解代謝,小部分來自造血過程中紅細胞的過早破壞,還有很少一部分來自非血紅蛋白血紅素的分解,所以膽紅素含量受血紅蛋白(Hemoglobinopathy,Hb)影響較大。昆明地處高原,造成缺氧,Hb相對升高,進而膽紅素的來源也相對升高,導(dǎo)致本地區(qū)總膽紅素,直接膽紅素可能偏高,所以需要驗證行業(yè)標準的參考區(qū)間是否適用。

表1 男、女性不同年齡段總膽紅素的參考區(qū)間(μmol/L)

表2 男、女性不同年齡段總膽紅素的參考區(qū)間(μmol/L)

表3 不同性別總膽紅素和直接膽紅素參考區(qū)間比較 (P2.5-P97.5,μmol/L)

表4 不同性別總膽紅素和直接膽紅素參考值范圍(μmol/L)
對于定量檢測項目,參考區(qū)間界限值的改變會影響臨床醫(yī)生的判斷,可能忽視疾病的嚴重性而導(dǎo)致治療的延遲,為患者帶來不良結(jié)果,增大醫(yī)療成本[4]。血清TBIL,DBIL的檢驗結(jié)果在肝膽疾病的診斷中起著重要作用。本次研究顯示,TBIL、DBIL參考區(qū)間在同性別中是沒有明顯的年齡差異。男性TBIL、DBIL參考區(qū)間明顯高于女性,這與男性血液中紅細胞數(shù)、血紅蛋白含量高于女性的生理特點是一致的。同時TBIL、DBIL參考區(qū)間略高于行業(yè)標準,所以昆明地區(qū)不適用于國家的行業(yè)標準WS/T404《臨床常用生化檢驗項目參考區(qū)間第4部分:血清總膽紅素、直接膽紅素》的參考區(qū)間。需要自行建立昆明地區(qū)的參考區(qū)間。
目前國際上推薦通過建立排除標準,選取合適參考樣本以獲得參考值的方法(直接法)是生物參考區(qū)間建立的首選方法。但是直接法操作過程復(fù)雜,耗時長,且費用昂貴,因此大部分實驗室仍以引用并驗證廠商或行業(yè)標準推薦的參考區(qū)間的方法為主[5]。
隨著信息化時代的到來,大數(shù)據(jù)(big data)已經(jīng)在各行各業(yè)中越來越多的應(yīng)用起來。醫(yī)學(xué)檢驗科是其在醫(yī)療單位中具有大數(shù)據(jù)特征的科室之一。隨著實驗室信息管理系統(tǒng)(LIS) 普及,醫(yī)學(xué)檢驗科的檢測數(shù)據(jù)每天增加百兆字節(jié)或幾十千兆字節(jié)。近年來,全球檢驗醫(yī)學(xué)專家更加關(guān)注醫(yī)學(xué)檢驗大數(shù)據(jù)(big data in laboratory medicine,BDLM)[6]。已經(jīng)有多篇利用間接法建立參考區(qū)間的文獻說明間接是可行的[7-9]。間接法建立生物參考區(qū)間作為一種后驗的方法,最大缺點是可能納入疾病狀態(tài)的異常數(shù)據(jù)[10,11。本次的研究篩選的數(shù)據(jù)僅限于LIS系統(tǒng)中,沒有將其他系統(tǒng)(體檢系統(tǒng)、PACS系統(tǒng)、HIS系統(tǒng))中的相關(guān)指標納入篩選條件,所以依舊可能存在異常數(shù)據(jù)。通過大數(shù)據(jù)的萃取,數(shù)據(jù)正態(tài)性分布的有效轉(zhuǎn)換,合適的離群值剔除規(guī)則和數(shù)學(xué)統(tǒng)計模式,能夠鑒別出絕大部分的異常數(shù)據(jù)并直接擯棄,由此途徑得到的參考區(qū)間與直接法相比具有較高的可信度[9]。通過結(jié)構(gòu)化查詢語言 (SQL) 將醫(yī)學(xué)檢驗大數(shù)據(jù)(BDLM) 中所需要的數(shù)據(jù)按一定條件檢索,快速準確的提取出來,節(jié)省成本,提高了工作效率。
利用BDLM最首要的問題是先按一定的條件檢索并導(dǎo)出相關(guān)數(shù)據(jù),然后才能進一步利用。醫(yī)學(xué)檢驗科應(yīng)該有強大的LIS,能夠按一定條件和要求檢索并導(dǎo)出電子表格類型數(shù)據(jù),比如可以按年齡、性別、項目、科室、病種等條件檢索,同時必需檢索全符合條件的數(shù)據(jù)。當然,要想采集BDLM進行科學(xué)研究,還需要LIS與體檢中心的體檢健康信息管理系統(tǒng)或(和) 醫(yī)院電子病歷信息系統(tǒng) (electronic medical record system,EMRS) 相互兼容、讀取數(shù)據(jù)的能力[13]。相信不久的將來,更多系統(tǒng)間的數(shù)據(jù)共享,可以更為嚴格的篩選需要的數(shù)據(jù),將影像學(xué)指標,病歷等納入篩選條件,從而得到更為準確的生物參考區(qū)間。
結(jié) 論 利用BDLM建立與驗證生物參考區(qū)間的方法必將取代傳統(tǒng)方法,成為各個實驗室建立生物參考區(qū)間的首選方法。這樣的方法可以實現(xiàn)程序化,自動化,人性化的根據(jù)自己實驗室的需求建立不同地域、不同人群、甚至是不同疾病患者間的一個參考區(qū)間。這個方法值得大力推廣。