弓孟春 劉 莉 彭 郁 管 音
(南方醫科大學衛生與健康管理研究院 (南方醫科大學南方醫院 (神州數碼醫療科技股份有限公司廣州 510000) 廣州 510000) 北京 100080)
鄧光璞 楊 越 楊之洵 母建康 路正鵬 史文釗
(南方醫科大學南方醫院 廣州 510000) (神州數碼醫療科技股份有限公司 北京 100080)
朱 宏
(1南方醫科大學衛生與健康管理研究院 廣州 510000 2南方醫科大學南方醫院 廣州 510000)
全球范圍內人類傳染病暴發事件正逐步增加[1]。近年來全球共同面對埃博拉病毒、H1N1流感和寨卡病毒等新發疫情時,能否迅速開展設計縝密的臨床研究是制定有效醫療對策、盡快控制疫情擴散和預防未來暴發的關鍵因素[2]。傳染病暴發期間,疫情防控涉及跨機構、跨地區協作,因此如何平衡疫情信息披露、數據共享和患者隱私保護是首先應注意的問題。開展臨床研究涉及的患者知情同意應充分考慮疫情狀況,結合實際降低暴露風險和時間成本。可信的臨床研究結果有賴于高質量研究數據,傳染病數據更需要考慮數據采集完備性和可操作性,以產生更具意義的研究結果。統計方案設計應結合疫情實際情況,由于短期內大量新發確診病例的出現會造成醫務人員數量短缺,導致醫療數據質量降低,出現數據完整性、溯源性不足等問題,可利用統計方法學進行彌補。本文依據臨床研究開展流程,探討傳染病暴發期間進行臨床研究需關注的4部分內容:隱私、倫理、數據治理和統計,結合國際及國內經驗,尋找解決策略并制定預案,以應對未來可能出現的重大傳染病暴發流行。
隨著我國信息技術與醫療行業不斷融合,區域醫療大數據共享平臺構建、維護與發展逐漸成為跨機構建設重點。數據共享是醫療數據發展內在要求,由于醫療數據特殊性,個人隱私保護在數據共享時面臨極大挑戰[3]。《信息安全技術個人信息安全規范》對個人數據收集、存儲、傳輸及共享等各個環節提出具體要求。該規范幾乎將所有與醫療行為相關而產生的數據都定義為個人敏感數據,強調收集個人敏感信息時的知情同意,同時考慮到公眾安全規定幾項醫療行業征得授權同意的例外情況。這些例外情況必須是與公共安全、公共衛生、重大公共利益直接相關的研究,如果對外公布研究結果必須對個人隱私數據進行去標識化處理[4]。數據隱私安全是數據共享流程中的根本問題。國內《傳染病防治法》、《艾滋病防治條例》、《執業醫師法》等均有患者信息保護相關條款,是數據共享時傳染病患者隱私保護的有力支撐[5]。國際上,美國《健康保險流通與責任法案》(Health Insurance Portability and Accountability Act,HIPAA)以及歐盟的《通用數據保護條例》(General Data Protection Regulation,GDPR)都體現出發達國家對個人隱私保護的重視[6-7]。
數據隱私安全問題離不開信息技術支持,可通過建立醫療領域數字身份驗證、數據限制訪問信息系統、升級加密手段等加強對隱私數據保護。當前廣泛應用的技術有:標準加密方法、數據失真技術、基于密碼學可逆置換算法。另外數據共享使用涉及風險再識別問題,在量化隱私再識別風險方面可使用g-distinct分析法,該方法的有效性已經在有關文獻[8]中被驗證。當前新型冠狀病毒肺炎傳播面廣、潛伏期長,是涉及公共安全的嚴重事件,根據《信息安全技術個人信息安全規范》,在保護患者的同時有必要對社會共享其部分信息[6-7]。患者發病前后接觸史、活動軌跡、就醫情況等是工作人員尋找傳染源、傳播途徑的關鍵,有助于保護更大范圍人群。因此疫情期間保護患者隱私同時公布其部分信息是不可避免的。但是在此過程中要明確劃分個人權責,兼顧社會利益,同時實現個人隱私保護與公共衛生安全的最優權衡。
在應對疫情過程中,通過臨床研究尋找并驗證特定醫學防控措施(Medical Counter Measures, MCM,包括診斷技術、治療藥物及疫苗)的有效性及安全性極為重要。在新型冠狀病毒肺炎疫情發生后短時間內多國科學家發表針對新型冠狀病毒感染引起的肺炎病原學、病例報道及流行病學研究[9-11]。各研究所采取的倫理審查辦法各有不同,包括豁免審查和機構審查(Institutional Review Board, IRB)等。已有機構開始申報某些藥物的隨機臨床對照試驗,如Remedisivir[12]。這些研究的倫理審查是保證受試者權益、確保研究順利進行、最大化其疫情防控作用的關鍵舉措。世界衛生組織(World Health Organization,WHO)在既往甲型流感病毒、埃博拉病毒流行期間曾對公共衛生緊急情況下開展臨床研究所采用的倫理審查方法組織了多國專家研討,給出相應指導意見[13]。公共衛生緊急情況下臨床研究應遵循的倫理準則與一般生物醫學研究大致相同,不同之處在于:對于風險、獲益及信任的評估存在差異,必須被納入倫理審查過程;研究執行機構可靠性和透明性需被高度重視;需要考慮緊急情況下完成標準倫理審查時間不足。盡管存在一些差異,在各類公共衛生緊急情況中,國際及國內倫理學指南所規定的準則和價值觀必須得到體現和遵守。如果需要完成完整的倫理委員會審查流程,應考慮建立審查快速通道,但不應縮小審查范圍或降低標準。快速通道辦法包括:調整倫理委員會成員面對面會議與線上交流時間比例;使用疾病暴發前研究方案庫中的方案或其中某些部分,提交后進行預審;成立緊急狀態下特別倫理審查委員會,可以是國家級或地區級;無法實施其他措施情況下,更多依賴事后審查;同時設置相應措施以核查違規及不達標的倫理實踐。
在傳染病緊急暴發期間,如何平衡臨床研究開展效率和公眾權益保障是面臨的主要知情挑戰。臨床試驗需要制定和提交詳細研究方案,獲取入組患者知情同意,響應倫理審查委員會意見,在疫情期間將極大阻礙臨床試驗的迅速開展。疫情期間相關監管機構反應能力會降低,阻礙臨床試驗開展的靈活性。因此在許多公共衛生實踐中,為應對疫情所進行的患者信息和標本收集工作可以在沒有知情同意時開展,但不允許用作其他疾病和將來的研究。美國食品藥品監督管理局(The US Food and Drug Administration,FDA)有相應條例允許在緊急情況下進行研究無需知情同意[14],但該規則適用于研究參與者無法授予知情同意的臨床狀況,如重大創傷、心臟驟停等,而不是針對傳染病緊急響應所進行的臨床研究。對于因為疫情被隔離或者需要危重護理的患者而言,知情同意的獲取需要考慮以下幾點:需盡量減少研究人員與受試者接觸時間,知情同意內容簡單易懂;現場執行知情同意簽署的人員培訓困難,要確保核心內容表達清楚;傳遞紙質材料可能導致病原傳播,可考慮電子分發和簽署;患者可能危重或被隔離,考慮家屬代為簽署。在最小暴露風險和患者負擔情況下,讓臨床研究入組患者明確風險和義務,以保障研究順利開展。
暴發性傳染性疾病流行往往涉及多種類型人群,包括城市、鄉鎮、流動人口、特殊聚集人群(如游輪、定點隔離人群、監獄等)。通過移動設備采集一般人群健康情況信息、利用信息化技術采集各醫療機構臨床數據、借助專業人員(臨床研究執行人員、基層行政人員等)采集特殊人群信息等,都是可行的數據采集方式。中心化云平臺架構是疫情緊急情況下合理高效的選擇,適于在多個醫院進行數據共享、整合多種平臺的開發環境,保障多個地區病例上報和協作分析。云架構可以隨著疫情進展對硬件資源進行彈性配置,以隨時響應不同數據體量、流量、用戶數量及功能需求。例如在一些疫情防控信息綜合平臺中[15],云平臺架構能夠支撐微信平臺健康人群監測數據采集及分析、院內數據整合及分析、抗體實驗室病例上報、危重癥患者預警及臨床研究等工作。
4.2.1 方法 在疫情流行期間資料收集面臨諸多挑戰,體現為不規范、不及時或不完整。其中重要資料或數據缺失對于臨床研究影響最大,提高數據完整性的方法如下:一是全面收集可獲取的信息。從健康人群使用的系統、院內臨床信息系統、公共衛生體系信息系統、第3方檢測平臺系統、媒體輿情監測系統等多個渠道獲取資料,通過個人主索引進行互相關聯,建立盡可能全面的個人信息系統。二是對于院內臨床信息系統中未記錄的重要臨床信息,尋找可能記錄的電子格式,包括醫生及護士臨時記錄的電子文檔、各設備系統內部記錄數據及軟件后臺數據庫可讀取數據。三是借助人工對重點人群定向采集信息。例如對疫情地返鄉人員、隔離點醫學觀察人員、發熱門診就診人員等,可通過疫情期間基層防控體系收集信息,提高個人信息上報系統使用率,確保及時、有效地采集新發癥狀、體溫、不良情緒等信息。
4.2.2 疾病預防控制中心相應措施 全球各國都有以各級疾病預防控制中心(簡稱疾控中心)為數據節點構建的疫情監測系統,在各地衛生服務機構信息化水平不一致情況下,保障病例上報數據完整性,對疫情披露和防控決策十分重要。在上報過程中應采取一些質控手段保障數據完備性和可溯源,包括:明確數據整合日期(與發病日期、上報日期等區分),在疫情快速發展時間窗內尤為重要;明確報告時間,疾控中心應向各地衛生機構明確上報時間點,防止重復上報;明確數據來源和上報形式,上報數據是手工謄錄還是經由醫院信息系統、檢驗信息系統自動生成,需向各地衛生機構明確,統一上報格式對于后續數據整理和分析尤為重要;明晰監測病例定義,需要監測的病例是疑似、確診或者產生結局(包括轉院、治愈、死亡);定義上報管轄權,對于一些交界地帶的衛生服務機構需要明確指定上報的疾控中心,以免產生重復數據。數據完備性還可能受到其他因素影響,如可用診斷工具、有效控制措施、公眾對特定傳染病的認識以及地方公共衛生官員可用資源等。
4.3.1 概述 數據完備性保障措施保證疫情數據傳輸過程中的真實度,而標準化則是對數據進行處理保障可操作性。臨床癥候群總結可能較快完成,但命名及術語標準制定在時效性上往往滯后,使疾病診斷、疾病分型、病原微生物檢測、臨床藥物研發等數據支撐的相關臨床研究不夠敏捷,因此需要完善數據標準化技術以提高信息可操作性。具有統一臨床術語體系后,應確定對關鍵臨床字段標準化處理策略,這需要結合地方一線衛生從業人員習慣,將同一概念不同叫法進行標準化。對新確定的病原微生物及由其引發的臨床癥候群進行定名及編碼等標準化工作,對于公共衛生政策制定及執行、信息共享及臨床研究具有極其重要的意義,要兼顧因地制宜與國際協同,也要考慮語言使用習慣及文化差異等,以科學的方法和扎實的數據為基礎。
4.3.2 臨床癥候群命名 中國國家衛生健康委員會于2020年2月7日發布的暫定命名中,中文為新型冠狀病毒肺炎,簡稱“新冠肺炎”,英文為Novel Coronavirus Pneumonia (NCP)。這準確反映了目前中文語境下對于這一癥候群的最常用描述,有利于我國社會各行各業、各年齡段及不同教育水平人群使用,對于疫情防控指揮、政策宣導貫徹、全民積極應對等各方面具有重大意義。世界衛生組織公布其對于此臨床癥候群的命名為"Coronavirus Disease 2019",縮寫為"COVID-19",中文譯法尚無統一標準(學界推薦為“2019冠狀病毒病”或“2019冠狀病毒疾病”)。該命名依據各國際組織間的既有共識,遵循世界衛生組織協調下全球公共衛生工作中對于疾病相關命名的常用做法,避免與地理位置、某種動物、個人或者群體相關聯,防止名稱使用不準確或是對相關事物“污名化”[16]。該命名規避對于肺炎的特定指向,這與目前已發表的臨床研究中對于該臨床癥候群的描述是一致的。該疾病存在多個系統受累的臨床表現,肺外臨床癥狀及嚴重程度在多項研究中均得到證實。
4.3.3 臨床癥候群編碼 全球范圍內最早對新型冠狀病毒引起的臨床癥候群進行命名和編碼的醫學術語本體系統是SNOMED CT,這也是全球使用最廣泛的臨床術語本體系統。在疫情暴發期間,SNOMED CT迅速引入由2019-nCoV(病毒臨時命名)感染所導致疾病的臨時命名和編碼,即840539006|Disease caused by 2019 novel coronavirus (disorder)|,在2020年2月13日將病毒臨時命名2019-nCoV更新為國際病毒分類學委員會命名“SARS-CoV-2”,同時“Disease caused by 2019 novel coronavirus”更新為“COVID-19”,與世界衛生組織統一命名匹配[17]。SNOMED CT在全球近50個國家用于臨床診療及公共衛生數據分析處理,其命名邏輯體現了對該疾病臨床表現復雜性的認識和各個國家在整理分析數據方面的技術要求,同時術語體系快速迭代也反映出衛生機構在抗擊疫情時的全球協作。國際疾病分類編碼 (International Classification of Diseases, ICD)是由世界衛生組織負責定期維護發布的全球通用疾病診斷編碼系統,為全球各國廣泛采用。面對全球范圍內暴發性的致病因素未明疾病,ICD提供U00-U49作為可選的代碼字段。在疫情等公共衛生緊急狀態下,快速使用特定編碼可保證在電子系統可用情況下,對疾病及疾病亞型進行正確編碼。2003年WHO緊急公布U04.9作為SARS相關疾病的分類編碼,2016年發布U06作為寨卡病毒感染相關疾病的編碼,作為新型冠狀病毒感染所致的急性呼吸系統疾病,WHO統一發布其ICD編碼:U07.1。這為準確、有效整理患者臨床資料、高效分析臨床診療情況和尋找疾病診治規律、及時準確整理及研判疾病流行趨勢等提供重要技術手段。
當缺失數據較少時(如<5%),可考慮直接刪除有缺失數據病例后進行分析。當缺失數據較多時,可利用多重插補法(Multiple Imputation)來減少數據不完整對最終結果的影響。根據國外學者傳染病研究經驗,當某變量的數據缺失比例<25%時可用多重插補法對數據進行補充,若缺失比例>25%則不應在后續研究和模型擬合時考慮該變量[18-19]。多重插補方法基本原理是基于回歸、決策樹、貝葉斯估計等模型,通過已觀測到的值對缺失值進行預測。主流醫學統計軟件(如SAS、R和STATA)都有成熟模塊和函數來實現多重插補法,具體步驟可分為3步:通過現有數據建立插補函數,估計待插補的值,加上不同偏差,生成多組候選的插補值,與現有數據共同組成多個完整數據集;利用每個數據集進行研究計劃的統計分析;評價各個數據集結果,根據模型評分選擇最佳補插值。
5.2.1 選擇偏倚和誤差控制 相比于簡單隨機,序列改變區組隨機化(Permuted Block Randomization)可以更好地對入組患者進行隨機分組。在區組時可分為大小兩組,并對大組和小組設置不同的藥物分配比例,避免負責發放藥物的臨床醫生猜出藥物種類,進而有針對性地將某種藥物交給病情更嚴重的患者[20],減小選擇偏倚。在暴發性傳染病流行期間,高死亡率、間歇性暴發,最快速度找到有效治療方式的迫切需求等因素都支持略寬松的統計設計。因此在針對埃博拉的研究中,美國學者以雙側Boschloo 確切檢驗(α=0.05)為標準來分析主要結局變量[21]。相比于傳統的將雙側一類錯誤概率嚴格設定為0.05的做法,利用Boschloo確切檢驗需要的樣本量更小,更容易實現。
5.2.2 階段性監測 在疾病暴發前期與療效有關的數據幾乎為零,因此必須對研究進行階段性監測來不斷評價和預估實驗結果,以便在發現實驗組有確鑿的危害或療效時迅速停止試驗。根據美國國立衛生研究院在埃博拉暴發期間的研究經驗[22-23],兩組比較的階段性監測中,如果A組比B組療效更好的貝葉斯后驗概率達到99.9%及以上,即可認為A組更優而終止試驗。在多種藥物比較時也可在階段性監測中排除明確無效的藥物組。若對照組的死亡人數超過臨界值,則中止該藥使用,不再將新患者分配至該組,將優于其的實驗組視為新對照組。通過這種方式可以在實驗正式結束之前停止藥效差的藥物使用,既保證RCT的正常進行,又最大化入組患者利益。
截至2020年3月22日在中國臨床試驗注冊中心登記的新型冠狀病毒相關臨床試驗多達509項,而其中以治療為目的臨床試驗共有222項[24]。本文分4部分探討傳染病暴發流行期間臨床研究數據治理所面臨的挑戰和應對措施。隱私保護方面,跨機構數據共享時要保證患者人口學信息安全。倫理方面,特殊時期的“簡化協議”或快速審查小組來加快批準傳染病相關臨床研究。標準化方面,在臨床數據收集、處理和分析過程中要保障數據完備性,統一癥狀命名,對關鍵字段標準化保證數據有效分析。統計方面,方法學的考量需要盡早納入,以保證結果真實、可信。這些隱私、倫理、標準化和統計方面的方法學總結可在類似傳染病流行再次出現時為及時、有效開展臨床研究數據治理提供參考。