李鈺華 黃杰 姬曉偉 費嘉 于婷★ 黃以寧★
地中海貧血是珠蛋白基因缺陷導致的一種溶血性疾病,為全球分布最廣、攜帶/發病人群最多的一種常染色體單基因遺傳病[1]。在中國,地貧多發于廣東、海南等南部沿海地區[2],以α型和β型最為常見,編碼ɑ-珠蛋白的HBA基因和編碼β-珠蛋白的HBB基因的突變和缺失是導致地中海貧血的直接原因。胚胎植入前單基因病檢測技術(Preimplantation Genetic Testing for Monogenic,PGT-M)通過檢測致病基因區域上下游一定范圍的遺傳學標志物,結合家系成員之間的遺傳學關系及致病基因攜帶情況,構建單體型以區分致病和正常胚胎,避免將攜帶致病基因的胚胎移植入母體。早期單體型構建主要采用PCR 法擴增與致病基因座連鎖的生物標記物[3-4],但通量低、靈活性差、易受等位基因脫扣(allele dropout,ADO)的影響[5-6],位點附近如發生重組時易引起誤診。隨著高通量檢測技術[7-9]的發展,二代測序(Next generation sequencing,NGS)和基因芯片已逐步應用于PGT-M。本研究擬對一種NGS 地貧panel 和全基因組SNP(single nucleotide polymorphism,SNP)芯片試劑的檢測性能進行評價,為胚胎植入前地中海貧血檢測選擇適宜的方法提供數據支持。
批號:360027-201901,由中國食品藥品檢定研究院研制并提供,包含4 個地中海貧血家系20 份樣本。參考品原料系以人全血建立的永生化細胞系和永生化細胞系提取的DNA,適用于對父本、母本、和(或)先證者以及胚胎檢測。
DNA 定量試劑(Qubit 1X dsDNA HS Assay Kit,美國ThermoFisher 公司),核酸純化磁珠(AMPure XP 磁珠,北京中儀康衛醫療器械有限公司),SNP 芯片試劑盒(Infinum Assay Kit,美國illumina公司),單核苷酸多態性微陣列芯片(Human CytoSNP-12v2.1,美國illumina 公司),單細胞全基因組擴增試劑盒(Discover-sc?Single Cell WGA Kit,南京諾唯贊生物科技有限公司),多重靶向擴增試劑盒[MultipSeq?Custom Panel,艾吉泰康生物科技(北京)有限公司],測序反應通用試劑盒(MiSeqTMDx Reagent Kit v3,美國illumina 公司)。
SNP 芯片掃描儀(型號:iScan,美國illumina 公司),Life ECO 基因擴增儀(型號:TC-96/G/H(b)C,杭州博日公司),高通量測序儀(型號:Miseq,美國Illumina 公司)。
市售用于胚胎植入前地中海貧血基因檢測的試劑盒包括:基于NGS 方法的地貧panel、基于全基因組SNP 的芯片試劑盒。文獻中[5,6,8]進行胚胎植入前單基因病遺傳學檢測的全基因組SNP 芯片主要來源于illumina 公司,其芯片產品包括:HumanCyto-12、ASA 芯片、GSA 芯片。分別對3 款芯片及NGS panel 的SNP 位點設計數量、最小等位基因頻率進行統計分析,評估NGS panel 和全基因組SNP 芯片試劑盒的檢測性能。
國家參考品中4 份模擬胚胎樣本(含3~5 個細胞)采用單細胞全基因組擴增試劑盒進行多重置換擴增,產物定量后與gDNA 樣本進行后續檢測。按照SNP 芯片試劑盒說明書操作步驟,對參考品進行處理和芯片雜交,芯片包被后通過iScan掃描儀掃描獲得數據。
同時樣本按照MultipSeq?Custom Panel 文庫構建流程進行文庫制備,文庫經稀釋混合變性后,在Miseq 高通量測序儀上進行測序。將iScan 和Miseq 下機數據上傳至嘉寶仁和公司PGX Cloud 云平臺進行數據分析,選取HBA和HBB基因及上下游2 Mb 范圍構建單體型,并統計有效位點數量。
除HBA基因上游外,所有類型芯片在其它位置設計的SNP 位點數量均大于NGS panel。見表1。ASA 和GSA 所設計的位點最小等位基因頻率(Minor allele frequency,MAF)集中在0-0.1,與NGS 地中海貧血panel 及Cyto-12 芯片相比偏低。見圖1、圖2。

表1 目標區域位點數量Table 1 Number of loci in target area

圖1 HBA 基因上下游位點MAF 值分布Figure 1 Distribution of MAF values of upstream and downstream loci of HBA gene

圖2 HBB 基因上下游位點MAF 值分布Figure 2 Distribution of MAF values of upstream and downstream loci of HBB gene
基因組DNA 樣本數據質量良好,4 個模擬胚胎活檢樣本質控參數的質量偏低,尤其是30 X 覆蓋度(58.71%~88.50%)和SNP 檢出率(0.595 9~0.701 1)。見表2。

表2 數據質量參數Table 2 Data quality parameters
2 種方法在HBA基因上游2 Mb 范圍內獲得2個以上有效位點,但均未在基因下游0~1 Mb 范圍內檢測到有效位點。在HBA基因下游1~2 Mb 范圍內,除4 號家系男方樣本兩種方法均未獲得有效位點外,NGS 地貧panel 在其它樣本上獲得的有效位點數總體多于SNP 芯片,在1 號家系中,NGS 地貧panel 檢測到了短串聯重復序列(Short tandem repeats,STR)位點。見表3。

表3 HBA 基因SNP 有效位點Table 3 SNP effective loci of HBA gene
兩種方法均能在HBB基因上下游各2 Mb 范圍內獲得2 個以上有效位點。見表4。

表4 HBB 基因SNP 有效位點Table 4 SNP effective loci of HBB gene
以1 號、4 號家系的NGS 和芯片數據構建的HBA和HBB家系單體型結果見圖3、圖4。兩種方法構建的胚胎單體型結果與國家參考品標明的致病性位點遺傳關系一致,但由于SNP 芯片在1 號家系男方HBA基因下游無有效位點,因此不能排除胚胎在HBA基因下游區域的重組風險。見表5。

表5 單體型構建結果一致性Table 5 Consistency of results for haplotype construction

圖3 1 號家系HBA 基因家系關系圖Figure 3 genealogical tree of HBA gene in family 1

圖4 4 號家系HBB 基因家系關系圖Figure 4 genealogical tree of HBB gene in family 4
備注:F0 表示男方風險染色體,F1 表示男方正常染色體,M0 表示女方風險染色體,M1 表示女方正常染色體,圖4 同。
全基因組SNP 芯片和NGS 法均為高通量檢測技術,芯片法優勢在于通用性和一體化,在進行單基因病檢測的同時給出染色體非整倍體信息[10],而胚胎植入前非整倍體篩查(Preimplanation Genetic Testing for aneuploidy,PGT-A)的加入與單獨的胚胎植入前單基因遺傳學檢測(preimplantation genetic testing for monogenic,PGT-M)周期相比妊娠率顯著增加(68.4% vs 45.4%)[11]。NGS 法從檢測成本考慮,全基因組測序的深度及分辨率不足以實現大多數單基因病的檢出[12],需通過多重PCR 靶向擴增,對目標區域富集后檢測以達到較高測序深度,其缺點在于需針對每一種單基因病定制靶向富集引物,且無法同時給出PGT-A 檢測結果。但對于基因組的特殊區域(如端粒區),NGS 方法表現相對靈活,可根據實際情況添加或刪除檢測位點,因此在解決部分疑難病例上更有針對性。
本研究首先篩選了適用于進行胚胎植入前地貧檢測的試劑盒,其中NGS panel 在千人基因組數據庫中篩選最小等位基因頻率大于等于0.1 的SNP 位點,去除含有多聚核苷酸及上下游100 bp范圍內GC 含量大于70%的SNP 及STR 位點。針對SNP 芯片方法,分析了3 款芯片(ASA、GSA、Cyto-12)參數,前兩者位點數量較多,但位點MAF值偏低,且定位于全基因組關聯分析研究,大部分位點為低頻位點,不適合用于胚胎植入前單基因病遺傳學檢測;而Cyto-12 芯片位點MAF 值較其他芯片更高,應用相對成熟,已有文獻報道廣泛應用于胚胎植入前遺傳學檢測和產前診斷[13]。
地中海貧血國家參考品樣本來源清晰,突變位點均已確認,故用于對NGS panel 和SNP 芯片試劑盒進行評價。有效位點統計結果表明,HBA基因上游2 Mb 范圍內,兩種方法均能獲得足夠的有效位點,但在基因內部和下游2 Mb 范圍內有效位點數量大幅減少,在HBB基因上下游2 Mb 范圍內,NGS panel 和Cyto-12 芯片試劑盒均獲得足夠的有效位點。由于HBA基因下游靠近16 號染色體端粒,端粒區域多為高度重復區域,不利于探針和引物的設計。對于芯片來說,探針設計時為提高探針雜交成功率和準確性,除需滿足類似于NGS panel 引物設計的條件外還需滿足其它條件:例如探針60 bp 范圍內不能存在未測明的N 堿基,25 bp 內不能存在其它SNP 位點等,這導致對于基因組特殊區域來說,芯片的多家系適用性降低。單體型構建結果表明,針對HBA基因,芯片在1 號家系男方樣本的基因下游未獲得有效位點,因此不能排除基因該側在胚胎中的重組風險。而NGS panel 在該區域能夠獲得足夠的有效位點,且同時在1 號和3 號家系中檢測到了STR 位點,因此可給出胚胎致病性的明確判斷。STR 是PGT-M 檢測中常見的遺傳標志物之一[14],單個STR標志物的信息含量相當于3 個SNP[15]。采用SNP+STR 標志物的方式能夠增加排除胚胎染色體重組的靈敏性,提高家系單體型分析的可靠性。
綜上所述,在地中海貧血國家參考品HBB基因家系分析中,采用NGS 地中海貧血panel 和全基因組SNP 芯片均可給出基因致病性判斷,但對于HBA基因,SNP 芯片在部分家系中由于有效位點不足無法排除胚胎重組。說明該芯片針對HBA基因胚胎植入前檢測存在一定風險,應謹慎選擇,建議針對特殊區域采用NGS 法構建單體型,提高臨床檢測效率。