一種強而有力的研究手段能夠鑒定遺傳變異和生物學特征之間的關聯改變科學家對復雜性疾病及其治療方法的理解。
早在二十年前,羅伯特.克萊因等人就在《科學》(志上發表了一篇具有里程碑意義的論文,描述了最早的全基因組關聯研究(GWAS)之一。這種基因組學方法徹底改變了科學家識別個體遺傳背景(基因型)和個體特征(表型)之間關聯的能力,尤其是在疾病背景下。復雜性疾病一譬如糖尿病、關節炎、癌癥和癡呆一構成了極大的公共衛生負擔,是由遺傳因素和環境因素間的相互作用引起的。通過了解復雜性疾病的遺傳結構,科學家能夠弄清楚引發這些疾病的生物學過程,定位相關組織,找到藥物靶點和治療方法,并識別出具有相似疾病風險特征的個體群體,以便進行精準干預。
遺傳變異可以通過基因型分型或是測序技術進行分析,這些技術依賴于人類基因組參考序列。在全基因組基因型分型技術出現之前,復雜性疾病的遺傳學研究主要集中在單個候選基因和單個遺傳變異上,這限制了研究的發現潛力。全基因組連鎖研究在有多個患病成員的家庭中,分析了散布在基因組中的少數遺傳標記,但這類研究往往分辨率不足,結果的可重復性也不高。
盡管GWAS的概念已經被提出多年,也有早期研究識別出單核苷酸遺傳變異和心臟病風險之間的聯系,但克萊因及其團隊在2005年發表的研究中首次報告了遺傳變異和生物學特征之間存在統計學上顯著的強關聯。研究中,作者們利用全基因組基因型分型技術比較了96位年齡相關性黃斑變性(AMD)患者和50位無癥狀對照者基因組中超過10萬個遺傳變異的頻率。
AMD是導致嚴重視力喪失的主要原因之一。預計到2040年,全球范圍內AMD患者數量將達到2.88億。早期AMD的生理病理學表現是眼球視網膜下出現細胞外脂質、礦物質和蛋白質沉積,這些沉積物被稱作玻璃膜疣。研究表明,AMD具有較強的遺傳特征,遺傳因素可以解釋高達 71% 的AMD嚴重性變異。這一遺傳率高于大多數與年齡相關的復雜性疾病。在克萊因及其團隊的研究發表前,AMD的遺傳關聯研究都是基于候選基因方法和家族連鎖研究,但在識別致病基因方面取得的成果有限。
克萊因等人在他們的全基因組關聯研究中發現了AMD風險與染色體上的編碼補體因子 H (CFH)基因內的遺傳變異具有強關聯。盡管研究中的樣本量較少(AMD患者只有96人,對照者僅50人),但統計學上的關聯性非常強, P 值小于 5×10-8 一這是GWAS中廣泛接受的顯著性閾值。這一顯著性水平體現了該遺傳變異對AMD風險的影響很大。
CFH蛋白參與調控補體系統,該系統能起到抗感染作用。研究者在患有AMD的人類和小鼠的玻璃膜疣中都觀察到了補體系統成分,這提示AMD可能是由異常的炎癥活動引起的,包括不適當的補體激活。自克萊因及其團隊的論文發表以來,全球最大的公共GWAS數據庫GWASCatalog又收錄了30余篇AMD相關的研究。CFH基因所在基因組區域的疾病關聯性目前已經被反復驗證, P 值低至驚人的 4×10-421 —這已經遠遠超過了2005年研究中報告的顯著性水平,主要得益于大樣本量帶來的統計效能提升。
克萊因及其團隊的論文不僅在AMD研究中具有開創性,也對整個復雜性疾病遺傳學領域產生了深遠影響。該研究促進了多個第一代GWAS的設計,尤其是威康信托病例對照聯盟(WTCCC)計劃,幫助定義了全基因組數據處理、分析和報告的金標準。研究者還更好地理解了整個基因組中遺傳變異之間的關系,并進一步開發統計技術來推斷未直接研究過的變異基因型。這些研究進展使得多個GWAS能夠以薈萃分析的框架結合起來,進一步增加了統計學效力,并帶來數十萬項關于廣泛復雜性疾病遺傳關聯的穩健發現。
國際合作是GWAS成功的基石。許多國際聯盟因此而成立,每個都專注于特定表型,通過整合所有可用數據以促進最大化發現。天規模生物樣本庫(記錄了包括基因組和表型數據在內的生物樣本)的出現極大地增加了樣本數量。這使得研究者能夠在全球范圍內對數以百方計的個體的全基因組數據進行薈萃分析。
盡管取得了這些進展,GWAS領域仍存在顯著短板,即參與這些大型研究的人群多樣性不足。當前,大規模全基因組測序使得研究相對少見的遺傳變異成為可能,而將環境風險因素整合入GWAS分析中也有利于揭示基因和環境之間的相互作用。
過去二十年的GWAS使得科學家對復雜的人類疾病遺傳風險因素有了更深入的理解。復雜性疾病可能由數千個具有小效應的遺傳變異所驅動。識別這些變異,揭示相關的基因和通路,有助于提供有關健康和疾病的洞察。這使得藥物靶點的識別成為可能,也有助于更好地理解如何調節這些基因、基因產物或通路以應對導致疾病的失調過程。將GWAS數據與人體組織的詳細分子特征研究相結合,還可以靶向疾病發生和發展中特定的細胞種群。
GWAS的發現具有轉化潛力,能夠改善人類健康狀況。這些生物學發現能夠帶來新的藥物靶點以及“老藥新用”的機會。事實上,具有人類遺傳學證據的候選藥物在臨床試驗中成功的可能性要比沒有相關證據的藥物高2.5倍。基于遺傳學風險評估對患者進行分層能夠進一步個性化地幫助個體匹配正確的治療方案,這也被稱作精準醫學。
此外,GWAS能夠支持預防性醫學(而非反應性醫學)的發展。遺傳生物標志物能夠用于識別出可能從干預措施中受益的個體,以延遲、阻止甚至預防疾病的發生。基于遺傳風險評分的精準預防方法,結合臨床或其他生物標志物時,可針對高風險個體進行定向篩查,以預防疾病或防止發展為嚴重并發癥和其他共存慢性病。這些方法對于制定公共衛生戰略而言也有重要價值。二十年來,GWAS持續深化了對復雜性疾病背后原因的理解,推動了臨床轉化路徑的發展,從而實現了人類健康水平的實質性提升。