沈麗娟,唐煜坤,肖春海△
1.上海市金山區中西醫結合醫院檢驗科,上海 201500;2.上海市第六人民醫院金山分院檢驗科,上海 201500
R語言是在統計學上應用比較廣泛的一款開源、免費軟件,具有強大的建模、統計、數據處理和可視化功能。R語言操作簡單,非計算機專業人員也可以掌握[1-2]。全國每年同步開展2次臨床檢驗專業醫療質量控制指標室間質評活動,其中臨床實驗室周轉時間(TAT)的上報是該活動的主要內容之一[3-4]。TAT上報需要以實驗室某個月的十萬甚至百萬級的檢驗數據作為基礎數據,統計檢驗前和實驗室內TAT,共162個指標。基層醫院LIS統計功能很不完善,準確上報質量指標幾乎不可能。本文僅以實驗室內TAT統計為例,介紹如何使用R語言快速、批量生成其中的87個質量指標,為LIS中TAT統計功能不完善的實驗室提供一個借鑒方法。
1.1材料來源 選取上海市第六人民醫院金山分院2020年12月住院和門診患者的生化、自動化免疫、“三大常規”、凝血四個專業的檢驗數據,涉及的項目依次是血鉀、肌鈣蛋白、白細胞計數、國際標準化比值(INR)、尿常規、甲胎蛋白、促甲狀腺激素和丙氨酸氨基轉移酶。信息科人員預先從LIS數據庫中抽取數據,生成兩個“Sheet”(表單),此兩個表單的名稱分別為“專業TAT”和“項目TAT”,并放于同一個Excel文件中,取名為“TAT.xlsx”。“專業TAT”表單的列名至少包括:類別、科室、儀器名稱、采樣到簽收時間、簽收到發布時間。“項目TAT”表單的列名至少包括:類別、科室、項目代碼、儀器名稱、采樣到簽收時間、簽收到發布時間。
1.2主要設備和軟件 聯想T460p電腦,R-4.0.4,RStudio-1.2.5019。
1.3方法
1.3.1TAT目標值 根據《上海市三級綜合醫院評審標準(2018版)》與《臨床實驗室質量指標:WT/S 496-2017》[5-6],結合上海市第六人民醫院實際情況,經過與臨床溝通制訂了本實驗室的TAT,并把目標定為TAT 90分位數小于實驗室規定TAT。
1.3.2按照專業進行TAT統計 把準備好的“TAT.xlsx”表格數據放于R的工作路徑目錄下,在R中運行代碼。利用ggplot函數和geom_boxplot函數結合geom_signif函數的統計功能,設置其參數“test=Wilcox.test”,可以實現每個專業不同類別之間的兩兩比較。4個專業的可視化圖用plot_grid函數進行拼圖。
1.3.3按照項目進行TAT統計 確認“TAT.xlsx”表格數據放于R的工作路徑目錄下,在R中運行代碼。
1.4統計學處理 用R-4.0.4中的分位數函數“quantile()”作為基礎統計函數,結合“tapply()”函數進行分類統計。不同分組中的TAT分布比較用“wilcox.test”進行非參數檢驗,P<0.05為差異有統計學意義。
2.1按專業分類實驗室內TAT分位數統計結果 批量生成的各個專業的TAT 50分位數和90分位數結果見表1。生化的急診、門診和住院,三者之間TAT分布差異有統計學意義(P<0.01)。自動化免疫的門診和住院之間的TAT分布差異有統計學意義(P<0.01)。“三大常規”(血常規、尿常規、大便常規)的急診和住院之間,門診和住院之間的TAT分布差異均有統計學意義(P<0.01)。凝血的急診和住院之間,門診和住院之間的TAT分布差異均有統計學意義(P<0.01)。見圖1。

表1 實驗室內TAT按專業統計結果表

圖1 各專業中不同標本類別之間的實驗室內TAT分布比較圖
2.2按檢驗項目分類實驗室內TAT統計結果 急診、門診和住院類別檢驗項目的TAT 90分位數都在實驗室規定的TAT之內。見表2。

表2 實驗室內TAT按項目統計結果表

續表2 實驗室內TAT按項目統計結果表
臨床檢驗的日常工作會產生大量的數據,特別適合用R語言進行簡單的數據分析并應用于科室管理中。關于實驗室內的TAT報道多集中于其重要性以及分析現狀和持續改進[7-8],本文則主要介紹本實驗室如何利用R語言批量、準確且快速地獲取TAT分位數以及簡單的可視化。
本文代碼預先用tapply函數自建了分組統計的50分位數和90分位數的函數,方便后面應用。filter函數主要用于數據的篩選,ifelse主要用于每行數據的自定義分類。數據處理主要以tidyverse包為基礎,利用ggsignif包的統計功能結合cowplot包中圖形處理函數進行可視化。另外tidyverse包已經包含了dplyr數據處理包和ggplot2畫圖包。
上海市第六人民醫院金山分院的患者類別只分為住院和門診,急診科也只分為住院和門診。不同于其他醫院設置獨立急診化驗室[9],門診和急診則共用一個化驗室,負責全院急診生化、凝血和“三大常規”。因此,本文代碼根據不同儀器的檢驗項目,利用ifelse函數轉成不同的專業。如將門診患者中非急診科并且無急診生化檢驗的轉為門診類別,將急診科就診和進行急診生化檢驗的其他科室的門診和住院患者轉為急診類別,將住院患者中非急診生化檢驗轉為住院類別。可見,R語言可以針對每個實驗室的特殊條件隨時進行參數調整,相比LIS集成的統計功能更靈活。
通過P值可以直接看出各個標本類別TAT之間的差別是否有統計學意義。這也是普通LIS統計TAT所忽視的內容。
實驗室內TAT分位數按項目分類統計中,實驗室不同的儀器可以使用相同的項目代碼,所以項目的類別用filter函數根據患者類別和儀器條件重新進行了篩選。
剩余TAT最短的是必須需要關注的,它提示如何改進;剩余TAT最長的則提示是否還可以適當縮短規定TAT,以提高臨床服務能力。通過TAT的分析還可以間接了解各個崗位人員的安排是否合理,甚至為了平衡剩余TAT可以適當進行人員和工作任務的調整[10],以優化科室管理[11]。
R語言具有易學性,而且在統計和作圖方面功能強大,檢驗人員通過R語言學習完全可以對自己的實驗室TAT進行快速、準確統計,使臨床實驗室質量指標的上報更加準確。R語言也是重要的醫學科研統計工具,所以R語言在檢驗科科室管理、質控分析和科研中都有廣泛的應用[12]。