CCTS工作組 賀 佳(執筆)
·CCTS共識·
臨床試驗統計分析計劃及統計分析報告的考慮
CCTS工作組 賀 佳(執筆)
統計分析計劃(statistical analysis plan,SAP)是對臨床試驗的統計學考慮及擬對數據進行統計分析的清晰描述。統計分析計劃可以是獨立的文件,其內容涵蓋試驗中所涉及的所有統計學考慮,且具有技術性和可操作性,包括了設計的類型、比較的類型、隨機化與盲法、主要指標和次要指標的定義與測量、檢驗假設、數據集的定義、療效及安全性評價和統計分析的詳細計劃。另外,臨床試驗方案中也包括統計分析計劃或統計學考慮部分,其內容是獨立的統計分析計劃的主要部分。統計分析報告(statistical analysis report,SAR)是依據統計分析計劃,對試驗數據進行統計分析后形成的報告,是臨床試驗結果的重要呈現手段,是撰寫臨床研究報告(clinical study report,CSR)的關鍵依據。針對統計分析計劃和統計分析報告所涉及的內涵,中國臨床試驗生物統計學工作小組(CCTS)經過充分討論,形成如下共識。
一、意義
為了有效地控制分析偏倚,保證試驗結論的科學性,應在試驗設計階段計劃最終的統計分析策略,數據鎖定前應確定統計分析計劃,數據鎖定后按計劃進行統計分析。統計分析報告是提供給主要研究者撰寫臨床試驗總結報告的關鍵文件,是科學、完整、準確、合理地撰寫臨床試驗報告的依據。本文主要針對藥物臨床試驗的要求進行闡述,相關內容也可以作為醫療器械等臨床試驗的參考。
二、統計分析計劃的制定時間
試驗方案中的統計分析計劃應與試驗方案同時完成,是統計分析的核心內容。作為獨立文件的統計分析計劃初稿應形成于試驗方案和病例報告表確定之后,是方案中的統計分析計劃的擴展,在臨床試驗進行過程中以及數據盲態審核時,可以進行修改、補充和完善,不同時點的統計分析計劃應標注版本,正式文件在數據鎖定之前完成并予以確認。如果試驗過程中試驗方案有調整,則統計分析計劃也應作相應的調整。如果涉及期中分析,則相應的統計分析計劃應在期中分析前確定。
三、統計分析計劃的基本內容
臨床試驗的統計分析有其特殊性,統計分析計劃應當由具有參與臨床試驗經驗的統計學專業人員起草,并與主要研究者商定后完成,要求全面而詳細地陳述臨床試驗數據的分析方法和表達方式,以及對統計分析結果的解釋。
統計分析計劃包括的基本內容:(1)試驗概述; (2)統計分析;(3)統計分析圖表模板。
1.試驗概述
研究方案中與統計學相關的部分,常可直接摘錄自方案。試驗概況一般包括以下主要內容:
(1)研究目的:臨床試驗的主要目的和次要目的。
(2)設計類型:如平行組設計、交叉設計、析因設計、成組序貫設計等。
(3)對照的類型:如安慰劑對照、陽性對照、劑量組對照等,若采用無對照試驗設計,需說明理由。
(4)隨機化方法及其實施:明確隨機化方法,如區組隨機、分層隨機及其分層因素、中央隨機化及其所控制的基線因素等。
(5)盲法及設盲措施:說明盲法是單盲還是雙盲,設盲措施是雙盲單模擬、雙盲雙模擬等,以及保持盲態下執行統計分析的措施。
(6)主要評價指標和次要評價指標的定義:清晰描述主要指標和次要指標的定義,包括具體觀察和測量的方法、觀察時點、指標屬性。如果主要指標需要計算得到,則需給出相應的計算公式。明確主要指標數據缺失的填補方法及理由。
(7)比較類型及檢驗假設:明確臨床試驗的比較類型,如優效性檢驗、非劣效性/等效性檢驗及其界值等。明確寫出主要指標進行統計學檢驗的原假設和備擇假設、I類錯誤率、II類錯誤率等。
(8)樣本量:摘錄方案中的計劃入組的受試者數量及其計算依據。
(9)分析數據集的定義:一般情況下,臨床試驗的分析數據集包括全分析集(full analysis set,FAS)、符合方案集(per protocol set,PPS)和安全性數據集(safety set,SS),或其他的數據集(如抗感染試驗中細菌學檢查的數據集)等。根據不同研究目的,在統計分析計劃中需明確描述數據集的定義。在定義分析數據集時,需遵循兩個原則:①盡可能地減小偏倚;②防止I類錯誤的增加。明確不同數據集在有效性和安全性評價中的地位。對主要指標缺失值的填補方法需要明確說明。當涉及亞組分析時,需要對亞組給出明確定義。
(10)協變量:主要指標分析模型中是否需要納入協變量,納入協變量的理由需要事先明確說明。
(11)依從性分析:包括研究時間、藥物暴露時間、藥物使用量以及方案偏離發生率的組間比較。試驗期間的未禁止使用的合并用藥、合并治療的分析方法應明確。
(12)敏感性分析:對于非事先規定的缺失數據的填補、亞組分析、不同數據集分析、不同協變量的調整等,可進行敏感性分析,考察對試驗結果的影響。將所分析的結果作為參考,與事先確定分析的結果進行比較,分析所得結論的一致性,考察結果的穩定性。敏感性分析可以作為主要分析的附加支持,但不能作為結論的主要依據。
2.統計分析
統計分析計劃中,應當說明統計分析所用的方法、檢驗假設及檢驗水準,所用統計軟件及其版本信息等內容。臨床試驗的統計分析應當采用國內外公認的、可靠的統計分析軟件。
(1)統計分析方法
臨床試驗數據分析應采用國內外公認的統計分析方法,應根據研究目的、試驗方案和不同指標明確所選擇的統計分析方法。
①描述性統計分析
一般多用于病例篩選情況、人口學資料、受試者分布、基線資料、依從性和安全性資料,包括對主要指標和次要指標的統計描述。
②參數估計和假設檢驗
參數估計和假設檢驗是對主要指標及次要指標進行評價的必不可少的手段。統計分析計劃中,應當說明要檢驗的假設和待估計的處理效應、以及相應的統計分析方法和/或統計模型。處理效應的估計應同時給出置信區間,并說明估計方法。假設檢驗應說明所采用的是單側還是雙側檢驗。
③協變量分析
對主要指標進行分析時,若需考慮某些協變量的影響,如受試者的基線情況、分層因素、中心效應等,應在統計分析計劃中明確哪些因素作為協變量,明確相應的統計模型。
對于多中心臨床試驗,在分析主要指標時,通常要考慮中心效應,需描述各中心不同組別的療效。此外,還需檢驗中心與處理組別的交互作用,用于分析中心間處理效應的異質性。如果不存在中心與組別的交互作用,可認為各中心的處理效應同質,估計處理效應的統計模型中不應包含中心與組別的交互作用項;反之,則說明各中心處理效應異質,應進行相應的敏感性分析,遵從保守的原則解釋效應異質性對試驗的統計學結論的影響。
④安全性分析
安全性指標的分析方法需在統計分析計劃中指明。
安全性評價常用統計指標包括各種不良事件發生率、不良反應發生率、重要不良事件發生率、嚴重不良事件發生率,以及實驗室檢查指標由基線時的正常變為隨訪時的異常率。
在大多數試驗中,對安全性指標的分析常采用描述性統計分析方法,所有的不良事件均需列出。當樣本量足夠時,可用χ2檢驗、Fisher精確概率法、Poisson模型等方法進行組間比較,必要時輔以置信區間。
⑤缺失數據和離群值的處理
缺失數據是臨床試驗中偏倚的潛在來源之一。在統計分析計劃中需要事先說明對缺失數據的處理方法。目前對缺失數據的處理沒有統一的標準,一般需要考慮所采用的缺失數據處理方法對統計分析結果的影響,并進行敏感性分析。如果在方案中沒有事先說明對缺失數據的處理方法,則需要同時對未填補和填補后數據進行分析,并比較兩者的結果。
離群值問題的處理,應當從醫學和統計學專業兩方面去判斷,尤其應當從醫學專業知識判斷。探索離群值對結果的影響,需要注意的問題與缺失數據的處理類似。
⑥其他問題
如果試驗有衍生變量,需要在統計分析計劃中對衍生變量的計算方法,所涉及的變量進行詳細描述。
(2)檢驗水準
統計分析采用單側檢驗還是雙側檢驗以及檢驗水準應當具體說明。傳統差異性檢驗通常為雙側檢驗,α常不大于0.05;非劣效性試驗或優效性試驗通常為單側檢驗,α常取0.025;等效性試驗為雙單側檢驗(two one-sided tests),兩次檢驗的α通常都統一取單側0.025(也即雙側的0.05)。生物等效性試驗的α取單側0.05(即雙側的0.10)。
(3)期中分析
如果要進行期中分析,則需要在統計分析計劃中對期中分析的事件數、信息時間、次數、α調整方法、具體的假設檢驗或參數估計方法、提前終止臨床試驗的標準等做出詳細說明。
(4)亞組分析
如果臨床試驗需要進行亞組分析,需要在統計分析計劃中詳細定義亞組,并說明分析的指標、分析方法等,說明亞組分析結果與結論的關系。如果亞組分析的結果是試驗的主要結論,則樣本量估計時需要考慮亞組的樣本量,以保證有足夠的檢驗把握度。
(5)多重性問題
如果臨床試驗涉及多重性問題,需要在統計分析計劃中詳細說明分析方法、檢驗水準的調整等。
3.統計分析圖表模板
統計分析結果通常以統計分析表或圖的形式呈現。統計分析表格應該以簡明的格式、精煉的文字描述所有相關信息。在統計分析計劃中,應該對統計分析結果呈現的相關表格的內容、格式和布局進行設計,利用統計分析圖表模板對統計分析報告中結果的形式輪廓進行描述。
統計分析計劃中的所有分析考慮都應清楚地標出分析所用數據集、分析的指標(包括單位)、訪視時間、處理組別、分析方法等。為了便于閱讀、更新和管理,在統計分析計劃上注明版本、產生日期、頁碼和參考文獻等。
統計表格的設計應明確主謂,分清層次,簡明扼要,統一格式,方便閱讀。統計表格應避免過長、過大、過于擁擠。內容較多時,可拆分成幾個表格。
表格應按照指標重要性依次排列,將最重要的表格放在最前面。
四、統計分析報告
數據鎖定后,程序員根據統計分析計劃完成編程和計算,統計分析專業人員根據統計分析計劃和計算得到的結果完成統計分析報告,然后提供給臨床研究的主要研究者用以撰寫臨床試驗報告。統計分析報告中應寫明具體的統計分析人員、程序員,并簽字。
1.統計分析報告的基本內容
統計分析報告是對臨床試驗的統計設計、分析、結果的總結,是臨床試驗報告的基礎和依據,其基本內容應包括:(1)試驗概述;(2)統計分析方法;(3)統計分析的結果與結論:一般采用統計表、統計圖表示。統計分析報告中的所有結論應采用準確的統計學術語闡述。
統計分析報告中的試驗概述、統計分析方法應與統計分析計劃一致。
2.統計分析報告中的統計圖表
統計分析報告中的統計圖表一般應包括以下八部分。
(1)受試者的分布
統計分析報告中應寫明所有入組的受試者的分布情況,包括篩查人數、剔除人數及原因、參與隨機化的人數、各組脫落/剔除受試者的例數、百分比等。除文字、表格描述外,應采用流程圖的方式描述受試者的分布情況。參見圖1。
(2)脫落/剔除的受試者
脫落(drop out)是指臨床試驗過程中受試者由于各種原因不能完成試驗規定的全部流程而提前退出。脫落的原因可以是不良事件、缺乏療效、失訪、主動撤回知情同意書等。剔除(removal)是指在試驗過程中或數據盲態審核時,試驗者發現受試者嚴重違背入選標準、未接受試驗藥物治療等原因而停止對該受試者進行臨床試驗或剔除在分析集以外。
(3)各分析數據集的分布
在盲態數據審核時,需要明確每位受試者進入的分析數據集,列表說明各分析數據集的分布,詳細描述每一位因脫落/剔除等原因未進入各分析數據集的受試者的情況,如受試者編號、中心、入組時間、脫落/剔除原因及時間等。
(4)依從性情況
根據依從性定義,明確各受試者完成試驗的情況,列表描述依從性差的受試者、依從性差的具體原因及進入分析數據集情況。
(5)基線可比性分析
對于人口學資料、既往病史、家族史、藥物過敏史以及療效指標的基線值等數據常采用統計描述的方式進行可比性分析。計量資料一般用均數、中位數、標準差、四分位數、最大值和最小值等進行描述;計數及等級資料一般用頻數和百分比描述。
(6)療效分析
對于反映療效的主要和次要指標,需根據事先確定的統計分析方法進行統計描述和統計推斷,包括指標基線情況、治療后各訪視點的測量值及前后變化情況,以及變化值組間差異的描述性統計量、置信區間和組間比較的檢驗統計量及P值等。對于主要指標,還需要根據事前確定的模型進行綜合分析,采用控制基線協變量、中心效應等因素的模型比較組間差異,根據事先確定的標準,從統計學角度,判斷主要指標的優效性/非劣效性/等效性的假設是否成立。
(7) 安全性分析
安全性評價的資料主要來源于受試者的主訴、癥狀、體征以及實驗室檢查結果等。所有的安全性指標在評價中都需要高度重視。
對不良事件發生的分析,常按照嚴重程度分為不良事件、重要不良事件和嚴重不良事件,并按照是否與試驗藥物有關分為肯定有關、可能有關、可能無關、無關、無法判定5個等級,將肯定有關、可能有關、無法判定的不良事件列為不良反應。常用事件發生的頻數、頻次和發生率描述,并進行組間發生率的比較,需要分類列出各種不良事件、不良反應的發生率并進行組間比較。列表描述每位受試者每項不良事件/不良反應發生的詳細情況,包括不良事件的類型、嚴重程度、發生和持續時間、結局以及與試驗藥物及藥物劑量的關系等。
對實驗室指標的比較和評價,主要關注治療前正常而治療后異常的發生情況,以及治療前異常但在治療后加重的受試者,需列表描述上述兩種情況。生命體征、心電圖、體格檢查以及其他安全性相關指標的分析與實驗室檢查指標的分析類似。必要時,進行實驗室指標前后變化及組間比較的分析。
在大多數試驗中,對安全性指標的分析常采用描述性統計分析方法,必要時輔以置信區間。
(8) 合并用藥分析:關于試驗期間的合并用藥分析,與不良事件的分析方法類似。需列出合并藥物的詳細情況,如受試者編號、中心、組別、合并藥物名稱、使用原因、開始時間、結束時間等,進行組間合并用藥的比較。
五、常見問題回答
1.在統計分析計劃中,當主要指標在FAS和PPS數據集中的分析結論不一致時,如何考慮?
答:在確證性試驗中,FAS和PPS在優效性試驗和非劣效性、等效性試驗中的作用是不一樣的。在優效性試驗中,FAS通常是主要的分析集,因為它納入了依從性不好的受試者,因此更加保守。但是在非劣效性試驗或者等效性試驗中,FAS的結果則不一定保守,因此使用時需要謹慎。通常要同時對FAS和PPS進行分析,如果兩個分析集的結果出現結論不一致時,應對其原因進行詳細分析、討論和解釋。
2.在統計分析計劃中,如何考慮基線不均衡的指標?是否需要引入統計模型對主要指標的分析進行校正?
答:在方案中應盡可能地考慮到影響療效評價的混雜因素,并利用隨機化、統計模型等方法對其進行校正,但必須在方案中事先規定好要考慮的因素。對于方案中沒有事先規定的因素,即使后來的分析結果顯示組間不均衡也不必對其進行校正。但需考慮敏感性分析,討論不一致的原因。
3.數據鎖定后,需要修改統計分析方法,是否可以?
答:一般不可以。若要修改事先確定的統計分析方法,必須給出充分的理由,并按照規定的批準程序履行手續后方可實施。
4.對于輕度違背方案的受試者,是否可以進入符合方案集(PPS)?
答:納入符合方案集的受試者一般具有以下特征:(1) 完成事先設定的試驗藥物的最小暴露量:方案中應規定受試者服用藥物的依從性達到多少為治療的最小量。若未達到,則作為重大的違反方案而從符合方案集中剔除;(2) 主要指標可以測定:通常指試驗前后主要指標均可以測得;(3) 未對試驗方案有重大的違背。對于未達到方案中事先規定的“重大違背方案”標準的輕度違背方案者,仍可考慮進入符合方案集。為慎重起見,凡屬分析數據集確定時遇到的疑問,都應該由參加盲審的各方共同討論決定。另外,如何界定違背臨床試驗方案是輕度還是重度,不同的臨床試驗,判斷的標準不盡相同,需要特別討論,并事先定義。
5.多中心臨床試驗中,對主要指標進行分析時如何考慮中心與組別的交互作用?
答:對于多中心臨床試驗,在分析主要指標時,通常要考慮中心效應,需描述各中心不同組別的療效。此外,還需檢驗中心與處理組別的交互作用,用于分析中心間處理效應的異質性。如果不存在中心與組別的交互作用,可認為各中心的處理效應同質,估計處理效應的統計模型中不應包含中心與組別的交互作用項;反之,則說明各中心處理效應異質,應進行相應的敏感性分析,遵從保守的原則解釋效應異質性對試驗的統計學結論的影響。
[1]化學藥物和生物制品臨床試驗的生物統計學技術指導原則GCL4 -1.2005.
[2]ICH Steering Committee.Statistical Principles for Clinical Trials (E9)//International Conference on Harmonization of Technical Requirements for Registration of Pharmaceuticals for Human Use.International Conference on Harmonization,1998.
[3]ICH E.General considerations for clinical trials//London,UK:International Conference on Harmonization.1997.
[4]International Conference on Harmonization Working Group.ICH harmonized tripartite guideline:guideline for good clinical practice E6 (R1)//International Conference on Harmonization of Technical Requirements for Registration of Pharmaceuticals for Human Use,1996,10.
[5]North PM.Ensuring good statistical practice in clinical research:guidelines for standard operating procedures (an update).Drug Information Journal,1998,32(3):665-682.
[6]ICHE.Structure and content of clinical study reports//London,UK:International Conference on Harmonization.1995.
[7]鄧偉,賀佳主編.臨床試驗設計與統計分析.北京:人民衛生出版社,2012.
(責任編輯:郭海強)
中國臨床試驗生物統計學組成員(按姓名拼音排序):陳峰、陳平雁、陳啟光、賀佳、黃欽、金丕煥、李康、李寧、李衛、李曉松、凌莉、劉玉秀、蘇炳華、孫高、王武保、王彤、魏朝暉、夏結來、姚晨、易東、尹平、于浩、張羅漫、趙耐青。