牟奕 肖恒怡 董碧蓉
(1成都市第八人民醫院,四川 成都 610083;四川大學華西醫院 2老年病研究室;3老年醫學中心)
現代醫學一直遵循精準理念,不斷融入新理論、新技術、新設備以提高臨床實踐的準確性和客觀性〔1〕,比如CT、磁共振成像、染色體診斷等技術。精準理念克服傳統醫療的盲目性,減少漏診和誤診,避免治療不足或過度,是現代醫學進步的推動力。在世界范圍內,精準醫學被研究者廣泛接受〔1,2〕。精準用藥是精準醫學的重要分支;在美國,三分之一的處方藥被認為無效,每年浪費約7 126億元人民幣(1 000億美元);對患者健康不僅無益,反而具有潛在危險性〔3〕。藥物反應與個體遺傳差異的密切聯系早已引起研究者重視,并先后提出了藥物遺傳學和藥物基因組學(PGx)〔4〕的概念。如ryanodine受體基因突變是導致全身麻醉藥后高熱的重要原因之一〔5〕。所以,基于藥物遺傳的精準用藥可以減少臨床用藥的試錯法,避免患者暴露于無效或有毒的藥物。鑒于藥物遺傳研究是實現精準用藥和精準醫學的必要途徑,本文主要綜述藥物遺傳的重要領域PGx全基因組關聯研究(GWAS),闡述藥物遺傳研究的策略共性和特點、最新的進展和發展趨勢。
藥物遺傳學和PGx的概念并不嚴格區分。但特指研究方法時,兩者也存在差異:藥物遺傳學是從單基因水平研究藥物反應;而PGx是基因組水平的研究。藥物反應多數屬于復雜性狀;復雜性狀是由許多遺傳和環境因子共同作用的結果;其中,每個基因對性狀的遺傳貢獻非常微弱〔5〕。
藥物遺傳學和PGx的研究思路存在明顯區別。藥物遺傳學研究多采用候選基因法,即根據已有的藥理學知識推測相關的基因并加以驗證的方法,包括藥物轉運蛋白和代謝酶。然而,許多藥物反應的生物機制并不清楚,這限制了候選基因法的藥物遺傳研究。PGx采用全基因組關聯研究的方法,這種方法無須假設,可系統地檢測基因組中成千上萬的遺傳變異,無須任何相關先驗知識,甚至可發現復雜的生物機制。
藥物的臨床轉化不能遺漏任何與藥物反應有重要關系的遺傳因子,PGx GWAS可以排除未知基因對藥物反應的影響,比如,最初華法林和氯吡格雷在臨床研究開展之前都進行了GWAS驗證。事實上,研究者已經知道華法林的劑量穩定性與維生素K環氧化物還原酶復合體(VKORC)1和細胞色素氧化酶(CYP)2C9基因相關,但并不清楚是否存在其他影響華法林劑量的基因〔6〕。
值得注意的是,GWAS的主要研究領域是常見病和常見表型研究,包括老年視網膜黃斑退行性變、2型糖尿病、炎癥性腸病、肥胖等;而PGx GWAS發展則相對較為緩慢,PGx GWAS在全世界所有的GWAS研究中所占比例非常小,還不到10%〔7〕。截至2017年,GWAS catalog一共收錄了216個關于藥物治療的PGx GWAS研究;其中145個是關于藥物療效,69個是關于藥物不良反應(ADR)或毒性反應〔7〕。研究者認識到,藥物反應的遺傳效應可能要比常見疾病的要強,有助于發現新的藥物靶點、闡明病理生理和促進精準治療〔8〕。
2.1GWAS的方法學 概括地說,PGx GWAS是在符合藥學特點的流行病學設計基礎上,收集大量符合納入條件受試者的基因組DNA,在基因組水平進行遺傳關聯研究〔9〕。遺傳關聯是研究基因型和表型關系的重要方法;有學者1996年提出了GWAS,適用于常見疾病/復雜表型的遺傳研究,可檢驗等位基因頻率和表型在人群中的統計差異;單核苷酸多態性(SNP)是當時基因分型的主要技術之一〔10〕。GWAS研究主要基于常見疾病-常見變異假設(CD-CV)和常見疾病-多重稀有變異(CO-MRV)假說。GWAS不僅是一種復雜的系統研究方法,而且其快速發展使標準流程建立存在困難。本節就GWAS在流行病學設計、基因分型和數據處理、統計分析與數據解釋等共性問題進行簡要概述。
同所有GWAS研究一樣,PGx GWAS流行病學設計的第一步是準確界定藥物反應的表型(或性狀),分為定性和定量兩類;表型定義的嚴謹性會影響統計分析。PGx GWAS主要采用病例-對照、隊列研究,而橫斷面研究和家系的樣本較難獲得〔6〕。研究設計必須充分考慮各種因子間潛在的修飾效應或效應交互作用,其是指一種風險因子改變另一種風險因子同疾病的關聯強度,可能會影響檢出疾病風險因子的能力〔6〕。常見病SNP的遺傳效應微弱,因此GWAS所需樣本量非常大。遺傳富集來提高GWAS的統計能力,有助于減小樣本量和篩選出更可能攜帶遺傳風險因子的個體〔11〕。
SNP基因芯片、外顯子組和全基因組測序是目前主要的基因分型方法。SNP基因芯片的遺傳信息含量遠高于傳統常規測序且市場價格相對低,在PGx GWAS的研究中有很大的應用前景。本文以SNP基因芯片為例,論述GWAS在PGx中的應用。SNP是GWAS研究的重要分子標記〔次要等位基因頻率(MAF)>0.01〕。第一例SNP基因芯片的報道是在1998年;高密度基因分型芯片是目前市場上主要的產品,比如Illumina公司已開發出能檢測1.1M的SNP位點的芯片。自2005年,SNP的GWAS研究方法已經趨向成熟,研究結果重復性好,提供了許多關于遺傳變異、生物路徑、人類性狀之間內在關系的認識。藥物反應是一類特別的表型,在臨床藥物治療中非常重要,為遺傳研究提供了獨特的機遇和挑戰〔4〕。
SNP基因芯片的工作原理是基于堿基的互補,SNP基因芯片的數據需要嚴格的質量控制,避免細微偏倚累積所導致的假陽性結果〔12〕,包括數據的清除和增補。數據增補可能會帶入一些稀有變異,但對次等位基因頻率小于1%的位點需要進行測序證實〔13〕。質量控制需要在SNP、個體和人群三個水平依次進行〔12〕。
GWAS基因分型的統計學研究通常被分成發現階段和重復階段。遺傳學中,重復被認為是關聯研究的金標準。GWAS重復研究是在另一個獨立樣本中驗證發現階段提示有全基因組顯著性的遺傳位點,這能減少發現階段的大量假陽性結果(Ⅰ型錯誤)〔14〕。
遺傳關聯是研究需要區分不同的模式包括加性、顯性和隱性等。表型的性質不同,檢驗方法也有所差異;定性性狀采用常用基因型檢驗或等位位點趨勢檢驗。常用基因型檢驗是一種基于人群的列聯表統計,近似于卡方分布,采用卡方檢驗。關聯強度可以采用相對風險和比值比來進行衡量,關聯強度>3被認為是強關聯。趨勢檢驗是判斷被檢驗位點是否為表型的協變量,采用Cochran-armitage檢驗。定量性狀的常用基因型檢驗可以采用單因素方差分析(ANOVA),加性模型采用線性回歸模型。GWAS數據依靠統計軟件來完成,包括基于人群的連鎖分析軟件(PLINK);GWAS統計顯著性水平通常為P<5× 10-8。為防止大量的統計分析產生的假陽性,GWAS可采用多參數回歸模型、分層分析和Mantel-Haenszelχ2檢驗等多種方法,尋找獨立效應的風險因素〔10〕。
2.2PGx GWAS的特點 PGx GWAS同常見疾病GWAS方法學有很多共性,同時PGx GWAS也存在一些特性,主要是指樣本量、表型特征、結果重復和效應量〔4〕。首先,復雜疾病GWAS所需樣本量巨大,PGx GWAS對樣本量的需求視情況而定。截至2012年2月,如果以P<10-7為統計顯著性標準,PGx GWAS的樣本量多數是幾百例,極少有超過1 000例受試者;而常見病GWAS在初篩階段,受試者常需數千例〔15〕。但是,大樣本量依然是PGx GWAS不可忽視的潛在限制因素。
其次,效應量與遺傳力缺失。效應量是指GWAS所發現的遺傳關聯位點占遺傳度的百分數。遺傳度是指個體間遺傳差異引起人群表型差異的比例,遺傳度的統計估計來自于疾病集群的家系研究。實際效應量小于預測遺傳度的現象被稱為“遺傳力缺失”,比如關于身高的GWAS研究可以解釋10%~16%的身高的遺傳變異,遠遠小于30%~40%的預測值〔4〕。PGx GWAS中,藥物反應相關的遺傳位點的效應量可以超過10%,這與常見病GWAS顯著不同。
第三,GWAS 有助于闡明藥物反應的群體遺傳結構。GWAS可以獲知群體中各種基因型在數量上的分布情況,即群體遺傳結構。藥物反應分為藥物療效和ADR兩大類。藥物療效的PGx GWAS主要關聯到微弱到中等的遺傳效應,這與常見疾病相似。ADR的遺傳結構更接近于孟德爾疾病,表現出較大的遺傳效應(OR>3),這提示ADR存在較強的藥物-機體相互作用。目前尚不清楚這種PGx 發現是一種例外或是正?,F象〔15〕。
第四,PGx GWAS作為無偏倚的研究方法,可以在沒有先驗證知識的情況下尋找關聯的遺傳因子,實驗結果常常超過候選基因法的預期〔4〕。編碼區是候選基因法的主要研究對象,然而PGx GWAS發現的遺傳關聯位點僅有18%位于基因編碼區;換言之,更多與藥物反應關聯的遺傳位點多位于非編碼區的DNase超敏位點〔16〕。DNase超敏位點通常是基因調節區,這有助于更好地理解藥物反應的生物機制。
第五,PGx GWAS研究很少采用家系作為研究對象。藥物基因學采用病例-對照研究和隊列研究比收集擴展家系和核心家系更為容易,因為患者的家屬并不一定都接受藥物治療,也無從知道藥物反應的表型。
2.3PGx GWAS研究進展 藥物反應是繼常見病/常見表型之后的GWAS研究熱點領域,近兩年主要集中在藥物肝毒性、心血管疾病、內分泌代謝性疾病、精神疾病和鎮痛相關的藥物,比如依法韋侖〔14〕、米諾環素〔17〕、多黏菌素〔18〕、氯吡格雷〔19,20〕、血管緊張素轉化酶抑制劑(ACEI)〔21〕、二甲雙胍〔22〕、帕利哌酮〔23〕、芬太尼〔24〕和瑞芬太尼〔25〕等。
肝是藥物代謝的重要器官,藥物誘導的肝毒性(DIH)是臨床關注的重要問題,具有顯著的自體免疫特征。GWAS研究證實HLA-B *35:02與米諾環素〔17〕、SNP rs199650082和依法韋侖〔14〕、rs4842407和依法韋倫-抗結核藥聯合治療〔14〕的DIH存在統計顯著性關聯。多黏菌素是用于嚴重革蘭陰性菌感染抗生素,具有顯著的細胞毒性;GWAS研究發現轉化生長因子β誘導的同源異形盒1因子(TGIF1)和同源異形盒基因(HOX)D10同細胞毒性存在密切關系。氯吡格雷是心血管事件二級預防的常用藥物,第一例氯吡格雷活性代謝產物的GWAS研究提示CYP2C19是決定代謝產物的最強遺傳決定因子〔19〕;另一項漢族冠狀動脈性心臟病患者的研究中發現了新的氯吡格雷的活性代謝產物濃度相關遺傳位點〔溶質運載體基因家族成員14變異體(SLC14)A2 rs12456693,ATP結合盒轉運體(ABC)A1 rs2487032和N6-甲基轉移酶(N6AMT)1 rs2254638〕〔19〕。芬太尼的鎮痛效果受遺傳因素影響,rs13093031,rs12633508和rs6961071同冷加壓誘導的疼痛顯著關聯〔24〕;瑞芬太尼的術中鎮痛效果與TMEM8A基因的rs199670311和SLC9A9基因的rs4839603存在顯著性關聯〔25〕。在抗精神藥物帕利哌酮的PGx研究中,12項GWAS結果的Meta分析提示ADCK1內含子的rs56240334可以預測帕利哌酮的療效〔23〕。Meta分析是改善GWAS統計顯著性的重要途徑,來自鹿特丹研究和Tayside蘇格蘭研究的ACEI不耐受者進行了GWAS研究,發現了8個SNP位點達到了基因組水平的顯著性,結果提示相關基因可能增加ACEI的不良反應〔21〕。
然而,PGx GWAS發現了許多微弱效應的遺傳位點,其中不少遺傳變異參與了用藥的風險,但由于全基因組關聯的多重檢驗而達不到統計的顯著性水平;構建遺傳風險評分(GRS)用于概括大規模關聯研究中達不到顯著性的單個遺傳標記的組合分值〔26~28〕。如果組合分值同被研究性的關聯達到統計顯著性,那么就具有對個體性狀的預測價值。這個方法可應用于GWAS無顯著性發現、尋找相關疾病的共同遺傳基礎和構建風險預測模型。偏頭痛個體差異的遺傳因素據估計是在38%~53%,是許多作用微弱、常見變異的聯合效果,可用于分析不同頭痛類型與偏頭痛的內在表型、評估藥物遺傳的效果,比如即將上市的偏頭痛治療的降鈣素基因相關肽單克隆抗體。在他汀藥物治療反應的研究中,研究者采用隨機森林模型構建了加權的GRS(wGRS),wGRS是評估他汀藥物反應的遺傳加性效應的有力工具〔27〕。遺傳性QT評分包括了61個常見遺傳變異,能解釋相當一部分藥物誘導的QT延長和作為藥物誘導的尖端扭轉型室速的重要預測因子〔28〕。
老年人群是臨床用藥的特殊人群,PGx GWAS的成果逐漸引起老年領域的關注。抑郁癥在老年人群中高發,而服用三環/四環抗抑郁劑常常導致QT間期的延長,增加心血管疾病的發病率和死亡率〔29〕。為此,基因組流行病學的心臟與衰老隊列研究(CHARGE)開展了一項三環/四環抗抑郁劑與RR/QT間期的GWAS研究,顯示歐洲人的RR間期受BRE和泛素結合酶2E2基因(UBE2E2)基因同三環類藥物相互作用的影響,拉丁人的QT間期受到TGFBR3遺傳變異同三環類藥物相互作用的影響〔29〕。老年人是服用他汀藥物的主要人群,rs7412、 rs4420638、rs2002042和rs646776對他汀藥效有重要影響;在75~80歲的人群中,wGRS同低水平的低密度脂蛋白膽固醇(LDL-C)顯著相關〔27〕。
借助科技的日新月異,精準醫學將不斷得以完善。一方面,隨著測序成本的降低,全基因組測序(WGS)會最終取代基于芯片的基因分型;但GWAS作為遺傳研究方法,依舊保持重要作用。另一方面,基因組雖是精準醫學的重要支柱,但精準醫學的發展不會局限在遺傳領域〔30〕,還將延伸到包括轉錄組、蛋白組、干細胞、營養、代謝、微生物、微量元素等多個領域,形成環境-社會等外界因素與人體自穩態維持為核心的多層次健康管理模式。老年用藥風險和醫藥支出需要精準醫學的支持。衰老過程中,由于老年人器官功能及功能儲備下降、多病共存及多藥聯用等因素,老年藥物不良反應的發生率是青年人的7倍。例如,鎮靜、催眠和抗抑郁藥物增高了老年跌倒風險〔31〕。據報道,藥物遺傳檢測能使65歲以上患者的住院率從16.1%下降到9.8%,每個患者平均節約1 553元人民幣(218美元)〔32〕。因此,精準醫學和精準用藥將會成為老年醫學探索的重要未知領域,并為臨床提供診療的指南。