彭絨雪,李金明(北京醫院 國家老年醫學中心,國家衛生健康委臨床檢驗中心,中國醫學科學院老年醫學研究院,北京100730)
自身抗體檢測是診斷自身免疫病(autoimmune disease,AID)必不可少的實驗室依據之一[1]。盡管自身抗體的檢測特異性不佳(部分健康人群也可檢測陽性)[2],但由于AID通常存在與疾病相關的高效價自身抗體,同時這些針對自身組織器官、細胞或細胞成分的自身抗體可伴隨整個疾病變化過程,因此,測定不同類型的自身抗體(尤其是高滴度的自身抗體)及其滴度變化對于AID的診斷和鑒別診斷、疾病的活動度判斷、臨床用藥指導及治療效果觀察具有重要的臨床意義[1]。
近年來,大量自身抗體檢測項目在臨床的廣泛開展使得眾多AID患者得到了及時的診治,并大大降低了疾病致殘率[3]。但與此同時,由于檢測試劑多樣性所帶來的實驗室自身抗體檢測準確性和可靠性問題也日顯突出。對于自身抗體臨床檢測實驗室,充分認識和理解性能驗證與質量控制對于自身抗體檢測的重要性,了解為什么做性能驗證、如何做性能驗證,以及如何在日常檢測中進行檢測性能的延伸驗證,對于保證自身抗體檢測的持續準確可靠至關重要。
根據國際標準化組織(International Organization for Standardization,ISO)以及美國食品藥品監督管理局(U.S.Food and Drug Administration,FDA)的描述,性能驗證(verification)被廣泛定義為“通過提供客觀證據以證明規定的要求得到滿足”,而性能確認(validation)則為“通過檢查和提供客觀證據證明,對特定預期用途的應用要求始終能得到滿足”[4]。兩者看似相似,但實際上,實驗室在開展實驗室自建檢測(laboratory developed tests,LDTs)前(例如開展一種自建的新型自身抗體檢測方法前)所需完成的、證明所使用的方法能實現預期用途的過程為性能確認;而使用經批準的商品化試劑或檢測系統(料)在預期開展該檢測的實驗室條件下,包括人員(人)、環境(環)、儀器(機)及SOPs(法)等,參照商品試劑盒說明書對其中所列出的一系列性能指標進行測試,以確認這些性能特征能否在相應實驗室條件下得以復現的過程才是性能驗證。經注冊批準的商品化檢測試劑或系統已在上市前完成了性能參數的建立(分析性能確認),因此,性能驗證過程僅需開展簡化的方法學比對和重復性實驗等對檢測準確性和精密度等進行驗證即可。
為了保證最終的檢測質量,實驗室必須首先明確所采購使用的試劑或檢測系統足夠好,能夠滿足其所確定臨床預期用途的要求。目前,隨著自身抗體檢測技術的不斷發展,自身抗體的檢測方法和檢測試劑也愈加多樣。不同的抗體檢測試劑或系統往往由于其固定/包被的抗原的來源、類型、結構和質量不同,其檢測能力也不同。而即便實驗室選用了公認的或普遍應用的獲批商品化試劑,也不能代表這些檢測試劑或系統可在實際使用的特定實驗室條件下對患者樣本發揮出相應的檢測性能。以最常用的抗核抗體(anti-nuclear antibody,ANA)間接免疫熒光(indirect immunofluorescent assay,IIF)檢測為例,在實際情況下,可能會存在樣本稀釋誤差、實驗室環境溫濕度變化、加樣時間差導致各樣本反應時間不一、熒光顯微鏡光路偏倚或光源減弱、圖像采集參數設置不正確、實驗室操作人員的判讀能力參差不齊等情況[5],上述影響因素中的每個錯誤和偏倚相互疊加,最終就可能導致檢測性能無法達到預期檢測目標。因此,實驗室在使用或更換新的檢測試劑或系統時,通過性能驗證明確其是否符合實際臨床需求,并以此建立及完善檢測系統,確認日常檢測中的關鍵質量控制點(即實驗室在性能驗證過程中發現的、可能嚴重影響本實驗室該項目檢測結果的關鍵點),并形成標準操作程序(standard operation procedures,SOPs)和室內質控規則,對保障自身抗體檢測結果的準確性至關重要。
與其他生物標志物不同的是,自身抗體的種類繁多,且其檢測方法也不盡相同。隨著自身抗體半定量/定量檢測和自動化檢測的出現,自身抗體的檢測方法除了傳統的IIF、免疫比濁法(immunoturbidimetric assay,IA)、線性免疫印跡(line immunoassay,LIA)、放射免疫試驗(radioimmunoassay,RIA)和酶聯免疫吸附試驗(enzyme-linked immunosorbent assay,ELISA)外,化學發光免疫試驗(chemiluminescent immunoassay,CLIA)和多重微珠流式免疫熒光試驗等也逐步得到了應用[6-7]。不同的試劑所用抗原性質、方法原理及結果呈現形式等可能都有不同,因此,不同的自身抗體檢測所需驗證的性能指標和方法也有所不同。實驗室所需驗證的自身抗體檢測系統性能指標通常可根據其檢測的預期用途和檢測方法具體確定。
2.1 定性檢測方法 對于LIA等定性檢測方法,由于其多用于幾種到十幾種自身抗體的聯合檢查,且結果判讀僅為依據膜條顯色情況判斷陰性和陽性2種結果,因此在性能驗證時,實驗室可使用日常檢測中收集到的結果明確的臨床樣本,對其中幾種最常見的(如抗核抗體譜中的抗dsDNA抗體)、最具有臨床意義的(如抗核抗體譜中的抗Sm抗體)以及最難以檢測的(如抗核抗體譜中的抗Jo-1抗體)自身抗體進行檢測精密度和準確度的評估。由于精密度是準確度的基礎,因此,精密度是最重要的也是首先需要驗證的性能指標。在精密度驗證前,實驗室首先需評估相應自身抗體檢測系統的變異來源,例如儀器、實驗室環境(尤其是反應溫度和濕度)、操作人員能力及試劑批次等。根據變異來源,實驗室可通過重復性實驗進行重復性(repeatability)、中間精密度(intermediate precision)及再現性(reproducibility)的驗證。具體可通過對弱陽性和中等強度陽性樣本(例如膜條顯色為弱陽性和中等強度陽性的樣本)及陰性樣本進行為期5 d、每天1~2批、每批3~5次的重復檢測,以此對批內(within-run)檢測符合率進行檢測重復性評價以及對批間(between-run)、日內(within-day)、日間(between-day)和不同操作者之間(between-operator)的檢測符合率進行中間精密度和再現性的綜合評價[8-10]。若精密度符合性能要求,則可進一步進行準確度的驗證。準確度的驗證通常可采用方法學或臨床診斷比較實驗2種方式。在實驗室具有參比方法(如ELISA、CLIA等其他經驗證性能符合要求、可滿足臨床預期用途的方法)的情況下,準確度驗證可通過方法學比較實驗實現,即采用待評價方法與參比方法平行檢測同一套樣本的方式,比較檢測結果的差異,隨后根據四格表計算陽性符合率(positive percent agreement,PPA)和陰性符合率(negative percent agreement,NPA)以明確檢測準確度情況(由于弱陽性樣本結果通常不能作為指導AID診斷和治療的依據,且LIA等定性檢測方法易出現假陽性情況,因此在進行準確度驗證時可無需過于關注弱陽性樣本的比對結果)。而當實驗室沒有合適的參比方法時,準確度驗證的“金標準”則可為由臨床方法確定的臨床診斷,根據檢測結果與臨床診斷是否一致,計算最終的診斷敏感性和診斷特異性,以明確檢測的實際準確度情況[7]。
2.2 半定量檢測方法 對于IIF等半定量檢測方法,由于其除陰陽性結果外還具有對核型和抗體滴度的判斷,因此在精密度及準確度的性能驗證時實驗室不僅需對檢測的定性符合率進行評估,還需根據判讀得到的核型和抗體滴度進行進一步分析。以IIF-ANA檢測為例,根據ANA熒光模型國際共識(International consensus on antinuclear antibody pattern,ICAP)及我國ANA檢測臨床應用專家共識,IIF-ANA檢測不僅需回報定性結果,還需對細胞核熒光模型、細胞漿熒光模型和細胞有絲分裂熒光模型等熒光模型進行準確判讀(其中檢出必報的熒光模型包括:細胞核均質型、細胞核斑點型、著絲點型、核點型、核仁型、細胞漿纖維型、細胞漿顆粒型、細胞漿網狀/線粒體型、細胞漿極型/高爾基體型、細胞漿棒環狀型、核膜型和細胞漿線性/肌動蛋白型),并對抗體滴度進行報告[11]。因此,實驗室在進行IIF-ANA精密度和準確度性能驗證時,應選擇具有不同抗體滴度(如滴度值在1∶80或1∶100~1∶320的弱陽性樣本和滴度值在1∶1 000左右的中等強度陽性樣本)及不同核型類型(如最常見的細胞核斑點型、細胞核均質型、細胞漿顆粒型,最具有臨床意義的核膜型、核仁型,以及最難以檢測或易于混淆的核點型和中心體型)的臨床樣本或標準物質進行精密度和準確度的評估(人工核型判讀符合率應≥80%,抗體滴度值應≥90%不超過上下1個稀釋度),以確保核型判讀和滴度檢測的準確性和可靠性。而除精密度和準確度外,自身抗體通常還可存在于除AID以外的正常人群(包括孕婦、老年人等)或感染性疾病、肝臟疾病、腫瘤性疾病患者體內,因此,使用不同檢測系統的不同實驗室還有必要通過臨床實驗建立適用于本實驗室的檢測參考區間[12]。尤其是對于IIF-ANA,實驗室應建立40歲以下和40歲以上兩組非風濕性疾病代表人群的95%參考區間范圍[13],以便于臨床進行進一步診療判斷。
2.3 以定量結果值報告定性結果的檢測方法 對于ELISA、CLIA和多重微珠流式免疫熒光等以定量結果值報告定性結果的檢測而言,實驗室除需對檢測的精密度、準確度和參考區間進行驗證外,還需借助定值標準物質對檢測系統的檢測限(limit of detection,LOD)即分析敏感性進行驗證。為降低實驗室的檢測成本及工作量,實驗室在進行此類方法的性能驗證時,可在完成檢測系統的最低檢測限驗證的同時,也完成精密度(重復性)驗證。而對于此類方法的準確度,其檢測數據還可采用散點圖或差異圖進行結果分析,以評估測定范圍內值的偏倚是否恒定以及偏倚是否受到方法間差異的影響。
檢測開展前的性能驗證只是在某個單一時點通過人、機、料、法、環等方面明確檢測的性能,但在臨床實驗室日常開展檢測的過程中,實驗室還必須嚴格遵循SOPs并監控性能驗證過程中所確認的各項關鍵質量控制點,才能真正實現可靠檢測的目的。性能驗證的過程并不是一個獨立的、靜態的過程,而是一個動態、變化、發展的過程。實驗室在開展某項自身抗體檢測時,所需要做的不僅僅是在開展檢測前完成性能驗證。受到人、機、料、法、環等方面因素的影響(如操作者輪崗、儀器老化、試劑批次改變等),實驗室在日常檢測中還需持續進行室內質量控制(internal quality control,IQC),定期參加室間質量評價(external quality assessment,EQA),以此才能持續保證檢測結果的準確和可信。因此,從某種程度上來說,日常檢測中持續進行的IQC及EQA是對檢測系統性能的延伸驗證。
其中,實驗室每天都需要完成的IQC是實現對檢測系統性能進行延伸驗證的最佳途徑。通過對隨機放置在臨床樣本中的已知弱陽性質控品和陰性質控品進行持續檢測和結果統計分析,即可實現對初始準確度和精密度驗證數據的補充。具有良好準確度的檢測應具有將陰性和弱陽性質控品完全正確定性檢出的能力。若檢測質控品出現了持續的定性檢測錯誤,則證明檢測系統準確度性能存在不可接受的問題,需從人、機、料、法、環等各方面尋找錯誤來源并進行改進。對于IIF、ELISA、CLIA等用滴度或數值判定結果的檢測,還可通過統計弱陽性質控品的定量檢測數值(如滴度值、S/CO值、檢測濃度值等)計算均值、標準差及變異系數(coefficient of variation,CV)以進行檢測精密度(包括重復性及中間精密度)的持續驗證。對于弱陽性質控品的檢測值,可計算均值和標準差隨后繪制Levey-Jennings質控圖以更加直觀地進行觀測。通過對每月結果的匯總分析,實驗室不僅可獲得重復性的驗證數據,同時還可獲得中間精密度及再現性的驗證數據。例如,通過對不同批次試劑、不同操作者或不同儀器檢測得到的數據進行分類,隨后利用公式計算分析,即可得到批間、日間、操作者間、試劑批次間和/或儀器間檢測精密度,從而進一步補充初始較為簡化的性能驗證數據。若統計得到的各項精密度CV在預定值之內、能夠滿足檢測預期用途,則可視為檢測精密度良好;若某項精密度出現了較大變化,CV超出預定范圍,無法實現預期檢測用途,則指示檢測系統中存在一定問題,還需從檢測系統各方面尋找錯誤來源并加以改進。實驗室需注意的是,試劑盒所設置的陰、陽性對照樣本通常是用于cut-off值計算,并不能作為IQC質控品使用。當有條件時,實驗室應當采購第三方質控品進行IQC;而當無第三方質控品時,實驗室可通過收集既往陽性臨床血清樣本,經混合、滅活、稀釋、定值、驗證穩定性和均勻性后形成自制質控品以進行IQC。
除了IQC外,參加定期開展的EQA亦可實現對初始性能驗證準確度數據進行補充的目的。國家衛生健康委臨床檢驗中心、中華醫學會風濕學會專業委員會、中國醫師協會風濕免疫專科分會、美國病理協會等EQA活動組織者通常制備包含數支、覆蓋不同抗體類型且具有明確結果的真實臨床樣本以構建EQA樣本盤。通過與EQA樣本盤的預期結果進行比對,即可實現對初始準確度性能驗證數據的補充。準確度良好的檢測系統應能對預期可檢出的質評樣本百分之百檢出。若對于具有明確結果的質評樣本無法準確檢出(如定性結果判斷錯誤、核型判斷錯誤、滴度判讀差距較大等),則證明檢測準確度存在不可接受的問題,還需從檢測系統各方面尋找錯誤來源并加以改進。
除此之外,實驗室還可對臨床患者的日常檢測結果進行橫向比較以進行檢測系統準確度的判斷。例如,將檢測項目開展后一段時間內(如1周、1個月或3個月)的自身抗體檢測結果進行橫向匯總,統計其中陽性結果的百分比,隨后與院內既往該自身抗體的檢出陽性率進行比較。在相對穩定的情況下,其月均檢測陽性率通常不可能出現顯著波動。若出現日常檢測陽性率顯著升高的情況,則需考慮之前經過性能驗證的檢測系統是否在實際檢測過程中出現了問題,從而導致實際檢測準確度發生了變化。
隨著醫療技術水平的不斷提高,越來越多的自身抗體被證實在AID的診斷、病情評估、治療監測及預后判斷中具有潛在價值,部分自身抗體檢測也已經被列入最新的疾病診斷標準中。但是,想要這些自身抗體檢測能在臨床上得以有效應用,首先需要確保的便是檢測結果的準確可靠。在正式臨床檢測開展前的性能驗證是保證實驗室所使用檢測試劑/系統可在實際使用的條件下實現其確定臨床預期用途的重要環節。通過對檢測系統的分析性能特征進行驗證,實驗室可以此為依據完善配套的檢測系統、明確日常檢測的關鍵質量控制點、形成規范化SOPs并建立室內質控及其失控規則。在隨后的臨床檢測過程中,通過嚴格地遵循規范化SOPs并監控驗證時所建立的關鍵質量控制點,并通過開展IQC及參加EQA發現可能存在的影響檢測實際應用的問題,持續改進,從而實現對患者樣本的持續可靠檢測。