吳建樺 金衍 吳雨璐 王強
多基因風險評分(polygenic risk score,PRS)作為全基因組關聯研究(genome-wide association study, GWAS)的補充方法,已廣泛應用于各類復雜性狀疾病的遺傳學研究中,精神疾病一直是PRS應用的重要領域。國際上關于PRS的研究范式漸趨成熟。國內關于PRS方法的綜述主要關注于復雜性狀疾病的總體進展[1-2],或將其作為遺傳風險分析方法的一種類型進行介紹[3],關于PRS應用于精神障礙研究的相關中文文獻幾近空白。在遺傳學研究的后全基因組時代,精神病學相關領域也急需新的遺傳學研究方法及范式[4],以推動該領域不斷向前發展?;诖耍揪C述將結合既往研究分析PRS在精神障礙研究中的應用情況,對研究范式進行總結分析,以期為國內相關研究提供思路。
PRS是根據全基因組關聯研究信息,重新構建遺傳易感位點權重的評分策略。其基本原理是對成千上萬個可能影響某性狀的遺傳位點的貢獻大小進行評分加權,再根據需要的統計檢驗水準(即P值)篩選不同的位點組成集合,在獨立樣本中為這些位點的集合計算總體加權分數。其中,性狀可以是疾病診斷、具體癥狀、特定環境等變量。將疾病相關的診斷、癥狀、環境因素等作為性狀進行研究時,可對其進行PRS計算,再將對性狀的PRS作為代表遺傳變量,結合其他變量進行研究。性狀間的相關性研究,例如對比兩個疾病患者基因的PRS評分,可以在生物學指征上對癥狀表現相類似的疾病進行進一步細化區分,如對精神分裂癥及抑郁型分裂性情感障礙進行鑒別診斷[5],或通過對比患者基因在不同環境或癥狀影響下的PRS評分,更進一步了解特定疾病的風險因素。在研究單個性狀時,對比同疾病下個體與群體的PRS評分,可以幫助預測個體患病風險、預測藥物療效、進行疾病早期篩查等。因此,PRS在精準醫療的大趨勢下具有巨大應用前景。在此基礎上,PRS還具有建模成本低、流程標準化、可操作性強等優點。首先,數據集可從已有研究中獲得,在GWAS信息基礎上進行PRS,可減少建模成本。其次,在國際上已經擁有標準化的操作流程,對數據準備及質控、模型構建、結果驗證三個步驟進行規范。國內既往綜述已對此部分進行具體介紹[6],此處不再贅述。最后,國際上已經設計多種針對不同研究目的、研究設計及研究內容的PRS計算軟件,如Ldpred (https://github.com/bvilhjal/ldpred)、Lassosum (https://github.com/tshmak/lassosum)、PRSicc-2 (https://www.prsice.info)、PRS-CS(https://github.com/getian107/PRScs)等,研究人員可以根據研究設計選擇適合的軟件,按步驟進行操作便能獲得相應的結果。
PRS的應用場景廣泛,適用于大部分研究設計,如證明特定疾病的多基因遺傳模式[7],分析不同疾病之間的遺傳相關性[8],探索遺傳與環境之間的影響及關系[9],預測個體患病風險(臨床應用),等等。在精神障礙研究中,PRS也可用于疾病的基礎研究及臨床應用。
2.1 多疾病之間的遺傳相關性研究在PRS的計算中,用于基礎建模的參考數據集與目標樣本數據集可以來自于同種疾病,如對精神分裂癥患者的抗精神病藥物療效研究[10],也可以分別來自不同的疾病,如對精神分裂癥和雙相障礙的遺傳重疊性進行研究[8]。如果將疾病作為不同的性狀納入分析,則可研究兩個疾病之間遺傳因素的重疊情況。在精神分裂癥、雙相障礙、重性抑郁障礙及注意缺陷多動障礙的PRS研究中,所選擇的基因評分集合除了與單個疾病本身相關,還常常與其他精神疾病存在較高關聯。這一現象提示,這些疾病的遺傳因素可能存在廣泛重疊。除了精神疾病與精神疾病之間的關聯,研究還發現精神疾病的PRS與非精神疾病存在關聯,如有研究發現注意缺陷多動障礙與2型糖尿病的遺傳因素存在正相關[9]。這些遺傳重疊因素的發現,可以幫助更好地了解疾病發生的遺傳學及生物學機制,并能夠為臨床鑒別診斷提供參考。
2.2 單疾病風險預測及診斷PRS可用于疾病風險預測及診斷。首先,在二分類診斷(即區分疾病和正常)上,2017年一項研究提供了可參考的范式[11]。該研究利用全球樣本量最大的精神疾病基因組聯盟(PGC)精神分裂癥GWAS結果來計算PRS得分,在歐洲和非洲血統的首發精神分裂癥患者和248例慢性精神病患者中,評估PRS區分病例組與健康對照組的能力,并報告了PRS區分精神分裂癥與其他精神疾病的效能。該研究發現,在歐洲的首發精神分裂癥患者樣本中,PRS對疾病與健康有較好的區分能力,可解釋9.4%的疾病易感性變異,同時在歐洲患者群體中還能將后來被診斷為精神分裂癥的受試者與發展為其他精神疾病的受試者區分開來[11]。盡管對首發精神分裂癥患者的判別準確率(0.65)尚不足以廣泛應用于臨床,但此研究初步顯示精神分裂癥患者與正常對照組之間所獲得的PRS分數顯著不同。其次,PRS可以在發病早期或發病前中期幫助臨床醫生更有效地識別高危患者。如利用PRS在精神分裂癥前驅期之前預測個體發作的可能性,在發病早期發現精神分裂癥高危人群并干預,將極大改善患者及其家庭后期生活質量[12-13]。最新研究顯示,精神分裂癥PRS分數最高的10%者比最低的10%者精神分裂癥患病率高4.6倍[14]。最后,PRS有助于疾病亞型的區分。例如,在首發精神分裂癥患者中,PRS得分較高的患者在12周后隨訪中,精神病性癥狀評分更高,這表明PRS得分較高者比得分較低者對治療的反應可能要更差,因此,根據PRS評分結果將精神分裂癥分為不同亞型或許能夠更好地反映患者預后情況[10]。
2.3 療效研究及療效預測PRS可用于針對高危人群或患者進行更有效的早期干預及藥物治療研究中。早期干預方面,將PRS與患者其他信息,包括家族史、認知水平和其他臨床特征等相結合,可有針對性地進行預防性干預[15]。國外已有利用PRS對精神障礙高危人群進行評估和識別的研究,結果顯示PRS能夠為精神障礙高危人群的早期篩查及預防提供可靠的指標[16]。該研究提示,如果能夠在早期篩查結果基礎上對精神疾病高風險人群實施針對性預防手段(如心理教育、生活方式改善建議,以及增加臨床檢測和預防性用藥指導等),PRS或許可以幫助降低精神障礙高風險人群最終發病的概率,并為精神障礙高風險人群提供個性化預防用藥,以及為改善生活方式提供指導。藥物療效方面,對于已經確診的患者,PRS能反映出個體對藥物或替代療法的反應情況,并一定程度上預測個體對特定治療方法的耐受程度[17]。2019年的一項研究顯示,PRS可預測首發精神分裂癥患者使用抗精神病藥物的療效反應,為檢測精神障礙藥物療效的研究提供了范本[10]。此研究通過4個獨立的首發精神分裂癥患者隊列發現,精神分裂癥患者的PRS評分越高,經抗精神病藥物治療后癥狀改善越不明顯[10]。待相關研究逐漸成熟后,PRS或許可以作為預測療效和預后的方法,在臨床上顯示出更重要的應用價值。
現階段的PRS運用仍存在一定局限。首先,PRS評價的位點尚無法包括整個基因組變異,如結構變異。PRS通常側重衡量個體常見單核苷酸變異的貢獻,尚不能包含所有的遺傳信息,因此現有的PRS方法還不能完全解決GWAS中遺傳度缺失的問題(即芯片遺傳度遠低于雙生子遺傳度的現象)。其次,PRS的預測水平與論證力度有限。目前PRS的研究結果雖達到嚴格的統計學顯著水平,但變異的方差解釋比例遠低于臨床實施風險預測所需的水平;同時,受精神疾病遺傳風險評分的低預測性和高多效性(pleiotropy)影響,PRS對因果關系的論證力度有限,且無法區分基因多效性和介導多效性——對于兩種表型的PRS關聯分析,PRS可能對兩者是獨立的貢獻,也可能是增加其中一種可能性而進一步介導了另一種可能性[11]。最后,PRS的樣本廣泛度目前嚴重不足。雖然精神疾病本身具有高遺傳度的特性,但不同的種群背景可能存在遺傳差異。種族、等位基因頻率、估計效應大小的差異都會影響PRS結果,不同的診斷標準、社會人口結構、流行病學風險因素的差異也會造成各研究中關聯強度和效應大小估計值的波動,這些因素都限制了PRS廣泛應用[18]。尤其對中國人群的研究,尚缺乏大樣本的GWAS,這意味著PRS對漢族人群的預測能力目前還十分有限,擴大研究樣本量是在中國人群中開展PRS研究的當務之急。
盡管PRS目前存在諸多局限,但是,由于當前生物醫學研究的數據比以往任何時候都更加龐大,它仍是目前最具潛力的、能夠將遺傳研究數據與臨床應用相結合的重要研究方法。為能盡早實現PRS在國內的臨床應用,應盡早建立中國人群的遺傳數據庫,挖掘中國人群的遺傳變異類型,為PRS提供更多的基礎數據。而且,為能更好地整合PRS研究結果,研究設計及報告應盡快推出統一標準。參考國際遺傳風險預測報告標準(PRS-RS)[19],我國也應綜合利用流行病學及統計學方法,設計PRS研究在群體選擇及方法解釋上的本土化標準,從而更好地推動國內PRS研究的發展,指導相關研究的未來應用方向。此外,計算機運算力提升、人工智能高速發展,以及方法學不斷地完善,如基于貝葉斯方法的PRS計算方法等明顯地提高了PRS的預測精度,也可能實現對因果關系鑒定。
綜上,隨著GWAS的重要性不斷被各國臨床及科研工作者所了解,各國和地區研究樣本量呈現出不斷增長的趨勢,以及全基因組測序費用的降低,PRS計算和預測的準確性將會大大提高,極大地推動PRS在精神疾病病因學和臨床中的運用。其在風險評估、治療反應及對疾病亞型的區分上在未來將會體現出更多、更重要的臨床價值。