張立男 ,宋雨桐 ,姜磊 ,朱如心 ,李莉
(1.司法鑒定科學研究院 上海市法醫學重點實驗室 上海市司法鑒定專業技術服務平臺,上海 200063;2.華東政法大學,上海 200063)
單核苷酸多態性(single nucleotide polymorphism,SNP)是指在基因組水平上由單個核苷酸變異引起的DNA序列多態性,是人類可遺傳變異中最常見的一種,占所有已知多態性的90%以上。SNP具有突變率低、可穩定遺傳、部分位點與個體外觀表現有關[1]、有利于降解檢材分析[2]、便于高通量自動化分型檢測等優點[3]。
Y染色體為男性特有的性染色體,除非發生突變,否則同一父系的男性后代均具有相同的單倍型,故可以用來揭示不同人群的起源、遷徙及親緣關系等。Y染色體上SNP位點(Y-SNP)分型檢測方法的建立,可以輔助現有的Y-STR檢測體系,協助進行疑難案件的鑒定。本研究采用多重PCR聯合基質輔助激光解吸/電離-飛行時間質譜(matrix-assisted laser desorption/ionization time-of-flight mass spectrometry,MALDI-TOF-MS)技術對西北漢族人群71個Y-SNP位點進行多態性調查,并結合前期研究所得,篩選同時適用于西北、華南和華東漢族群體的位點,旨在為法醫學應用提供基礎數據。
在知情同意原則下,收集西北新疆地區漢族男性無關個體血樣202份,每份樣本取200μL。
DNA抽提試劑盒QIAamp DNA Blood Mini試劑盒(德國Qiagen公司),基因分型系統Complete iPLEX?Gold Genotyping Reagent Sets(96 Format,美國 Agena公司),9700型PCR儀(美國AB公司),MassARRAY?飛行時間質譜儀、MassARRAY?納升點樣儀RS1000(美國Agena公司),MassARRAY Typer 4.0軟件(美國Agena公司)。
通過Y染色體系統樹、Hapmap數據庫[4]、美國國立生物技術信息中心(National Center for Biotechnology Information,NCBI)數據庫[5]進行檢索,結合《法醫SNP分型與應用規范》(SF/Z JD0105003—2015)的要求,從Y染色體上篩選出在東亞人群中具有多態性的71個SNP位點,用Agena Bioscience公司的在線工具[6]設計用于PCR擴增的引物和單堿基延伸反應的引物。
依據各個位點之間的距離并避免引物之間的相互干擾,將71個位點分成W1、W2、W3復合體系(表1)進行檢測,PCR擴增子的大小為80~120bp,單堿基延伸產物的相對分子質量為4429~8710。

表1 3個復合擴增體系所包含的Y-SNP位點
用QIAamp DNA Blood Mini試劑盒進行DNA抽提。擴增體系為5 μL,含10×PCR緩沖液0.5 μL、25 mmol/L MgCl20.4 μL、PCR 引物混合液 0.5 μL、25mmol/L dNTP混合液0.1μL、5U/μL PCR酶0.1μL、純水 1.4 μL、模板DNA 溶液 2 μL。PCR 循環參數:95℃ 2 min;95℃ 30 s,56℃ 30 s,72℃ 60 s,45個循環;72℃ 5 min。PCR擴增結束后,加入1.7 U/μL蝦堿性磷酸酶(shrimp alkaline phosphatase,SAP)0.30 μL、SAP 緩沖液0.17 μL 和超純水 1.53 μL,按下述條件進行酶切反應:37℃ 40min,85℃ 5min。
在純化后的產物中加入10×iPLEX?緩沖液0.20μL、單堿基延伸引物混合液0.94μL、10×iPLEX?終止 混合物 0.20 μL、iPLEX?酶 0.04 μL、超純水0.62μL,按下列條件進行單堿基延伸反應:94℃ 5s;52℃ 5s,80℃ 5s,5次小循環;40次大循環。
按參考文獻[7]中的方法對產物脫鹽后,使用Mass-ARRAY?納升點樣儀RS1000將反應產物點樣至芯片上(點樣量控制在8~12nL),將點樣完畢的芯片放入MassARRAY?飛行時間質譜儀進行質譜檢測,用Mass-ARRAY Typer 4.0軟件查看分型結果。
用直接計數法計算各Y-SNP位點在西北漢族無關男性人群中的等位基因頻率,基因多樣性(gene di-versity,GD)計算公式:

式中,n為樣本數,fi為第i個等位基因的分布頻率。單倍型多樣性(haplotype diversity,HD)[8]計算公式:

式中,n為單倍型數,Pi為第i個單倍型的頻率。用Arlequin v3.5軟件[9]計算單倍型頻率、Fst值和P值,并進行群體遺傳學比較。Fst是種群分化和遺傳距離的一種衡量方法,WRIGHT[10]建議:Fst為 0~0.05,群體間遺傳分化可以不考慮;Fst為0.05~0.15,群體間存在中等程度的遺傳分化;Fst為0.15~0.25,群體間遺傳分化較大;Fst>0.25,則群體間有很大的遺傳分化。
經過實驗和統計,得到西北地區漢族無關男性人群71個Y-SNP位點的等位基因頻率數據和GD值,有67個位點在西北漢族人群中呈多態性分布,詳見表2。

表2 西北漢族無關男性人群71個Y-SNP位點的等位基因頻率和GD值 (n=202)
表2顯示,在所選擇的位點中除M148、rs2032645、rs9306841、SRY8299外,其余67個位點都具有多態性,GD值在0.0100(rs11575897和rs9341278)~0.5022(rs17276358)。中度信息量(0.2≤GD<0.3)的位點有22個(M117、M119、rs2032631、rs2032652、rs2032678、rs2075181、 rs35284970、 rs16980391、 rs16980396、rs3900、rs4589047、rs52812045、rs7067458、rs17174528、rs17250121、rs9306845、rs9306848、rs9785908、rs17276777、rs9786502、rs9786707、rs17842387),高度信息量(GD≥0.3)的位點有25個(M122、M134、rs2032674、rs11096432、rs2196155、rs13447361、rs2267801、rs16980363、rs3853054、rs16980426、rs16980601、rs16980610、rs16980641、rs16981290、rs917759、rs17269396、rs17269816、rs17269928、rs17286338、rs17276358、rs9786394、rs17316007、rs17316543、rs17316592、rs17323322)。
使用Arlequin v3.5統計軟件分析71個Y-SNP位點的單倍型發現,本群體共有170種單倍型,其中頻率最高的為0.034 8(7/202),頻率最低的只有0.005 0(1/202)。經計算,HD為0.9930。
結合前期的實驗結果[7,11],用 Arlequin v3.5 軟件計算Fst值和P值,對華東、華南和西北漢族無關男性人群的等位基因分布進行比對分析(表3)。

表3 71個Y-SNP位點在華東、華南和西北漢族無關男性人群的等位基因分布差異

續表3
表3數據顯示:華東與西北漢族無關男性群體之間有7個位點存在中等程度以上的分化,華東與華南之間只有4個位點存在中等程度以上的分化,西北與華南之間有15個位點存在中等程度以上的分化。
71個位點中,分別有11個位點在華東與西北漢族群體的差異具有統計學意義(P<0.05)、8個位點在華東與華南漢族群體的差異具有統計學意義(P<0.05)、36個位點在華南與西北漢族群體的差異具有統計學意義(P<0.05)。
結合本實驗結果與前期研究取得的華南、華東漢族群體的遺傳學數據[7,11],通過評價GD值,篩選出在西北、華南和華東群體具有較高信息量的Y-SNP位點。統計結果表明,在西北、華東和華南3個地域群體均具有應用價值的Y-SNP位點共有26個(表4)。

表4 在西北、華東和華南漢族群體中具有中、高度信息量的位點

續表4
觀察本實驗結果,分析檢測的71個Y-SNP位點在西北漢族無關男性人群的多態性及等位基因分布頻率,可知有67個Y-SNP在西北漢族男性人群中呈多態性分布,GD值在0.010 0~0.502 2,中度信息量(0.2≤GD<0.3)的位點有22個,高度信息量(GD≥0.3)的位點有25個。本課題組前期研究結果[7,11]顯示,華南和華東漢族人群中分別有66、67個位點存在遺傳多樣性,中度信息量的分別有18、31個,高度信息量的分別有13、18個,整合本研究結果可知,同時適用于西北、華南和華東群體的中高度信息量的位點有26個。他們在親權鑒定和個體識別中具有一定的應用價值,可以作為STR、Y-STR檢測的補充。
經比較分析P值,發現華南和西北漢族群體之間的差異最大,華東與西北漢族群體之間的差異次之,華東與華南漢族群體之間的差異最小。分析比較Fst值發現,西北與華南之間分化的程度最高,華東與西北漢族無關男性群體之間分化程度居中,華東與華南之間分化程度最低。由此可見,Y染色體上SNP標記的等位基因分布具有一定的地域差異,用于法醫學鑒定時,需要使用相應區域的群體遺傳學數據。
目前,SNP在法醫學中的研究主要有兩個方面:(1)對SNP位點進行篩選,獲得不同人群的分布頻率,建立數據庫,用于個體識別和親權鑒定;(2)對SNP位點的功能進行分析,通過對現場遺留的生物檢材的部分位點進行分型,提供嫌疑人的一些特征,如毛發顏色、眼睛顏色等[12]。
本研究對西北漢族男性無關個體的71個Y-SNP位點進行分析,共檢測出170種單倍型,其中頻率最高的為0.034 8(7/202),頻率最低的只有0.005 0(1/202)。HD為0.993 0,得到了較大的群體遺傳信息,可應用于涉及男性的個體識別和親權鑒定的案例中。例如,在進行父系關系檢驗的時候,某些情況下僅僅憑借Y-STR分型的結果難以出具鑒定意見,不能因為幾個STR的分型結果不同而否定父系關系[13],針對這種案例,對高信息量的Y-SNP位點進行分型檢測可以視為一種補充鑒定的手段。
同時,本實驗也比對了華南、華東地區漢族男性Y-SNP位點的分布特點,篩選出26個在西北、華南和華東漢族具有普適性的位點,這將有助于完善法醫DNA檢驗手段。