劉媛媛, 陳靜, 張晗, 金珊珊, 劉頂浪, 羅雍蘭, 周林, 季晶焱
(貴州醫科大學 法醫學院, 貴州 貴陽 550004)
貴州省是中國民族最多樣化的省份之一,由于境內地形山脈眾多,使得各民族人群在空間上得以獨立存在,形成其獨特的基因類型。苗族素有“世界民族”之稱,不僅在中國境內有廣泛的分布,在歐洲,美洲等地也有分布。作為貴州省內人口數量最多的少數民族,其遺傳結構以及與其他人群間的遺傳關系一直是研究熱點[1]。人類Y染色體為正常男性所特有,其約95%的區域為非重組區,具有單倍型連鎖遺傳及父系遺傳等特點;擬常染色體區約占5%,減數分裂時可以發生交換[2-3]。Y染色體上的遺傳標記具有男性獨特遺傳、地域特異性等優勢,使其廣泛地運用于復雜親緣關系識別、個體識別、群體遺傳學以及人類起源、遷徙和進化的研究中[4],在法醫鑒定中用于父系家族關系鑒定、混合斑男性個體檢驗等[5]。評估Y-STR鑒別能力的法醫學參數是遺傳差異度(genetic diversity, GD),對于連鎖的遺傳標記,不能采用乘積定律,需先計算單倍型頻率,再計算個人識別率[6]。本研究使用Y filerTMPlus試劑盒,對貴州苗族的27個Y-STR基因座(DYS19,DYS385a/b,DYF387S1a/b,DYS389I/II,DYS390,DYS391,DYS392,DYS393,DYS437,DYS438,DYS439,DYS448,DYS449,DYS456,DYS458,DYS460,DYS481,DYS518,DYS533,DYS570,DYS576,DYS627,DYS635,Y_GATA_H4)進行群體遺傳學調查,并結合已發表的其他17個人群數據分析貴州苗族與國內不同地區的人群之間的遺傳距離和遺傳關系,為后續法醫父系鑒定建立法醫Y-STR數據庫,以及后續的群體遺傳學研究提供科學的基礎數據。
本研究樣品收集于貴州醫科大學司法鑒定中心日常檢案,所有樣本采集均遵循知情同意原則。采集方式為采血卡采集,共收集貴州地區苗族418名健康無關男性個體血樣,所有樣本收集時已回溯三代內父母皆為苗族。本文研究由貴州醫科大學倫理委員會審批并批準,倫理審批號為2020 倫審第(057)號。
根據Y filerTMPlus試劑盒(美國Applied Biosystems公司)說明書,用直接擴增法(免提取)[7-8]對前述樣本進行PCR擴增,使用9700PCR儀(美國Applied Biosystems公司)進行PCR擴增。PCR反應體系為10 μL,具體為:PCR Master Mix 5.0 μL、Primer Mix 2.5 μL、ddH2O 2.5 μL,1.5mm直徑血卡,PCR循環參數見表1,每次擴增均加入2800 M Control DNA做陽性對照和無菌雙蒸水做陰性對照。PCR擴增產物均在ABI3500遺傳分析儀上進行毛細管電泳檢測,使用96孔板進行上樣,每孔上樣體系為擴增產物1μL、Hi-DiTM去離子甲酰胺10 μL、CC5IS500內標0.4 μL,每加入15個樣品后加入一個等位基因分型標準物Allelic(ladder)(美國Promega公司)。電泳結束后,使用GeneMapper?ID-X1.3軟件(美國Thermo Fisher Scientific公司)對STR反應產物進行等位基因片段分析和數據收集。

表1 Y filerTMPlusPCR擴增循環參數Tab.1 Parameters of Y filerTM PlusPCR amplified cycle
貴州苗族27個Y-STR基因座的遺傳差異度(genetic diversity, GD)和單倍型多樣性(haplotype diversity, HD)按公式GD/HD=(n/n-1) (1-ΣPi2)(Pi為等位基因或單倍型頻率,n為樣本數)計算,其中雙拷貝基因座DYS385a/b和DYF387S1a/b作為單倍型計算。Y-STR基因座單倍型結構使用YHRD參考數據庫(Y-STR haplotype reference database,http://www.yhrd.org/search)進行分析,應用 YHRD 在線工具進行分子方差分析(analysis of molecular variance,AMOVA),計算貴州苗族群體與其他17個民族(青海撒拉族[9]、克拉依瑪維吾爾族[10]、甘肅藏族[11]、內蒙古達斡爾族[12]、湖南侗族[13-14]、海南黎族[15-16]、廣西壯族[17-18]、湖南瑤族[19]、貴州仡佬族[20-21]、貴州布依族[22]、四川回族[23]、貴州漢族[24-25]、吉林白山滿族[26]、北川羌族[27]、湖南苗族[13]、貴州土家族[28]、貴州貴陽彝族[29])的遺傳距離RST值,分別采用MEGA 7.0[30-31](http://www.megasoftware.net/)軟件,使用NJ法(neighbor-joining)對貴州苗族和其他參考群體的系統發育樹,使用SPSSv18.0軟件進行多維尺度分析(multi-dimensional scaling,MDS)。
貴州苗族群體的27個Y-STR基因座的等位基因頻率見表2。27個Y-STR基因座共觀察到240個等位基因,各基因座分別檢出3~12個等位基因。其中,本研究在DYS449基因座上檢測到微變異,等位基因為30.2。在DYF387S1a/b上檢出了9種三等位基因情況,在雙拷貝基因座DYS385a/b共檢出12個等位基因,49種單倍型。27個Y-STR基因座共觀察到240個等位基因,等位基因頻率為0.002 4~0.892 4。貴州苗族群體的27個Y-STR基因座的GD值見表3。23個單拷貝的Y-STR基因座的GD值為0.195 0~0.879 1,除了DYS390、DYS391、DYS437、DYS438、Y_GATA_H4五個基因座以外,其余基因座的GD值>0.5。

表2 貴州苗族27個Y-STR基因座等位基因頻率(n=418)Tab.2 Allele frequencies of 27 Y-STR loci in Guizhou Miao group population(n=418)

續表2

續表2

表3 27個Y-STR基因座的GD值Tab.3 GD value of 27 Y-STR loci
基于27個Y-STR基因座,計算貴州苗族和其他參考群體的RST值見表4。基于RST值使用鄰接法構建了貴州苗族與其他17個參考群體的系統發育樹,見圖1。根據遺傳距離對貴州苗族與其他17個參考群體的進行MDS分析,見圖2。
本研究調查結果顯示,27個Y-STR 基因座在貴州苗族群體中的GD值為0.195 0~0.912 8,其中23個單拷貝的Y-STR基因座的GD值為0.195 0~0.879 1。除了DYS390、DYS391、DYS437、DYS438、YGATAH4這5個基因座以外,其余基因座的GD值均大于0.5,其中基因座DYS390的GD值是0.4615,基因座YGATAH4的GD值是0.473 4均比較接近0.5。本研究發現DYS391、DYS437、DYS438基因座的遺傳多態性較低,這與既往國內關于不同人群的研究報道基本一致[32-34],考慮所用商業試劑盒位點參考數據以歐美人群為主這一原因。兩個多拷貝基因DYS385a/b和DYF387S1a/b的GD值分別是0.9128和0.9002。本次研究所得的27個Y-STR基因座GD值結果表明,Y filerTMPlus試劑盒中有24個Y-STR基因座在貴州苗族群體中顯示出較高多態性。本次研究的27個Y-STR基因座中,DYS385a/b、DYF387S1a/b為多拷貝基因座,此類基因座的一對引物在Y染色體上有多個結合位點,因此會出現擴增出多個片段長度不同的PCR產物的情況,這可能和染色體結構有關[35]。本研究的418個樣品中,在DYF387S1a/b基因座檢出三等位基因9例,在DYS385a/b基因座中沒有檢出三等位基因,說明在DYF387S1a/b基因座上出現特殊型的情況更多,這一現象在之前的研究中也有報道[36]。本研究在DYS449基因座上檢測到微變異,該等位基因為30.2,提示后續可對該基因座是否存在貴州苗族特殊的等位基因進行深入研究。

表4 貴州苗族和其他對比群體的遺傳距離RstTab.4 Genetic distance Rst values among Guizhou Miao group and other populations
遺傳距離是表示群體間或物種間遺傳差異或遺傳分化最重要的參數,本次研究基于群體的RST值構建了貴州苗族和其他民族群體的系統發育樹。從該發育樹上可以發現,貴州苗族與內蒙古達斡爾族、青海撒拉族、克拉依瑪維吾爾族、甘肅藏族之間的遺傳距離相對較遠,推測原因是這些人群主要居住的地方處于高原地帶,人群之間流動比較少。本研究還通過建立MDS圖得到貴州苗族與其他人群更明顯的地理和種族聚集特征,從MDS的結果可以看出,包含貴州苗族在內的18個人群大致可以劃分為6個類群:第一類群,青海撒拉族、克拉依瑪維吾爾族、甘肅藏族;第二類群,內蒙古達斡爾族、湖南侗族;第三類群,海南黎族、廣西壯族、湖南瑤族、貴州仡佬族、貴州布依族;第四類群,四川回族、貴州漢族、吉林北山滿族、北川羌族、貴州苗族;第五類群,湖南苗族、貴州土家族;第六類群,貴州貴陽彝族。貴州苗族與四川回族、北川羌族和吉林滿族的遺傳距離相對較近,與內蒙古達斡爾族、湖南侗族、海南黎族、克拉瑪維吾爾族的遺傳距離相對較遠,這一結果與系統發育樹所得的結果基本一致。從MDS可以發現,遺傳距離與地域和民族群體都有著密不可分的聯系。本研究中貴州苗族與地理位置相近的貴州其他人群也有一定的遺傳差異,由此推測即使地理位置相近,但是不同民族群體之間的差異因素也會對群體遺傳關系有較大的影響。從近期國內外研究來看苗族在群體遺傳上是一個較為獨特的群體。在利用全基因組SNP對貴州苗族人群的相關研究中指出,苗瑤語系的人群起源于長江流域中部的古百越,并經歷了從四川和貴州向南遷移到越南和泰國的過程,在這個過程中苗族經歷了非常復雜的人群混合歷史。研究發現,作為國內主要苗族分支之一的湖南苗族與福建的畬族及南方漢族群體有更多的遺傳同源性,而貴州苗族與壯侗語系的人群有更多的共享基因,更具遺傳親和力,且與東南亞的人群也有混合的歷史。因此對于貴州苗族的群體遺傳結構需要使用更全面全基因組數據來進行進一步的研究與刻畫[1,37]。
綜上所述,本次研究中的27個Y-STR基因座組成的單倍型計算的遺傳距離結果與各參考群體地域分布基本一致,表明Y染色體遺傳標記在群體間的遺傳距離和基因漂流的評價中起到了重要作用。該27個Y-STR基因座在貴州苗族人群中具有豐富的遺傳多態性,可為貴州苗族父系親緣關系的鑒定提供有價值的信息。同時,本次研究的數據可以為父系譜系在法醫學應用和群體遺傳學方面提供有用的信息。