徐沖沖 ,王 上 ,魏 巍 ,張 檸 ,黎 寬 ,連心情 ,王詩旭 ,周雪梅 ,盧曉筱 ,鐘樹榮
(1)昆明醫科大學法醫學院,云南 昆明 650500;2)北京市公安局法醫中心,北京 100192;3)北京通達首誠司法鑒定,北京 100089;4)昆明醫科大學司法鑒定中心,云南 昆明 650500)
短串聯重復序列(short tandem repeat,STR)也稱微衛星DNA 或簡單串聯重復序列,是由2~6 bp 串聯重復單位組成的DNA 片段,約占人類基因組的5%,其中大部分位于非編碼區[1]。STR 基因座具有遺傳多態性高等特點,是法醫DNA 分型的主流遺傳標記。目前已開發了多種包含不同STR 基因座的復合擴增體系,極大地促進了STR 遺傳標記在法醫學中的應用[2-3]。
苗族是云南省少數民族中人口較多的民族之一。根據《2021 年云南統計年鑒》[4],2020 年云南省苗族總人口為125.36 萬人,占云南少數民族總人口的8.02%,主要分布在文山、紅河等地區(http://stats.yn.gov.cn)。文山紅河地區位于我國西南邊陲云南省東南部,其東鄰廣西壯族自治區百色市,西臨玉溪和普洱地區,北接昆明和曲靖市,南部與越南接壤。文山紅河地區苗族人群極具跨境民族特色,有著獨特的群體遺傳結構特征,與其他群體間存在復雜的關聯,因此研究其遺傳多態性對該地區苗族人群的法醫學應用和群體遺傳學研究具有重要意義。本研究采用PowerPlex?21試劑盒對文山紅河地區苗族人群2 209 例無關個體20 個常染色體STR 基因座的遺傳多態性進行調查,旨在了解該地區苗族群體的遺傳背景和遺傳結構,為法醫DNA 分析和群體遺傳研究提供基礎數據。
根據知情同意原則,收集云南省文山壯族苗族自治州和紅河哈尼族彝族自治州2 209 例無關健康苗族個體的口腔拭子或血樣。
采用Chelex-100 法提取樣本DNA,并置于-20 ℃冰箱保存。采用PowerPlex?21 System 試劑盒(Promega 公司,美國),并使用ABIVeriti?PCR 儀(AB 公司,美國)對20 個常染色體STR 基因座(D3S1358、D1S1656、D6S1043、D13S317、Penta E、D16S539、D18S51、D2S1338、CSF1PO、Penta D、TH01、vWA、D21S11、D7S820、D5S818、TPOX、D8S1179、D12S391、D19S433和FGA)進行復合擴增。每批次待測樣本以標準品2800M 作為質控的陽性對照,ddH2O 作為陰性對照。用Applied Biosystems?3130 遺傳分析儀(AB 公司,美國)對PCR 擴增產物進行毛細管電泳分離,采用GeneMapper? ID v3.2 軟件(AB 公司,美國)進行基因分型。STR 分型和命名遵循國際法庭科學遺傳學會(ISFG)的命名原則。
使用Modified-Powerstats 軟件計算20 個常染色體STR 基因座的等位基因頻率(allele frequency,AF)、隨機匹配概率(matching probability,Pm)、觀測值雜合度(observed heterozygosity,Ho)、多態性信息含量(polymorphism information content,PIC)、個體識別概率(discrimination power,DP)、非父排除概率(probability of exclusion,PE)、親權指數(paternity index,PI)等法醫學參數,并對各基因座進行 Hardy-Weinberg 平衡檢驗,采用Bonferroni 多重校正,以P< 0.002 5 為差異有統計學意義。計算累積個人識別概率(cumulative discrimination power,CDP)和累積非父排除率(cumulative probability of exclusion,CPE)。使用Arlequin v3.5 軟件[5]計算文山紅河地區苗族與24個已發表群體[6-29]的遺傳分化指數(Fst)和P值,經Bonferroni 多重校正,P< 0.003 3 為差異有統計學意義。使用Phylip 3.69 軟件包計算Nei's 標準遺傳距離(http://evolution.genetics.washington.edu/phylip.html)。基于Nei's 遺傳距離,使用Mega 7.0 軟件[29]構建25 個群體的相鄰連接(neighboringjoining,N-J)系統發育樹,并采用SPSS v24.0 統計軟件(IBM 公司,美國)進行多維尺度(multidimensional scaling,MDS)分析。
文山紅河地區苗族2 209 例無關個體20 個常染色體STR 基因座的等位基因頻率及法醫學參數見表1 和表2。共檢出265 個等位基因和1 080 種基因型,等位基因頻率分布范圍為0.000 2~ 0.571 8(D13S317),各基因座等位基因數目為7(D3S1358)~25(FGA)。對20 個STR 基因座進行Hardy-Weinberg 平衡檢驗,經Bonferroni 校正,各基因座等位基因頻率和基因型頻率分布均符合Hardy-Weinberg 平衡定律(P> 0.05/20=0.002 5)。20 個STR 基因座的法醫學參數如下:Pm 和Ho值的范圍分別為0.013 2(Penta E)~0.232 2(TPOX)和0.571 1(TPOX)~0.903 1(Penta E),PIC 值的范圍為0.521 1(TPOX)~0.910 8(Penta E)。DP 值的范圍為0.767 8(TPOX)~0.986 8(Penta E),CDP值為0.999 999 999 999 999 999 999 932 674 151。PE 值的范圍為0.257 6(TPOX)~0.801 8(Penta E),計算該分型系統的CPE 值達0.999 999 935 545 335。

表1 文山紅河地區苗族群體20 個STR 等位基因頻率分布(n=2 209)(1)Tab.1 Allele frequency distribution of 20 STR loci in Miao population from Wenshan and Honghe regions(n=2 209)(1)

表1 文山紅河地區苗族群體20 個STR 等位基因頻率分布(n=2 209)(2)Tab.1 Allele frequency distribution of 20 STR loci in Miao population from Wenshan and Honghe regions(n=2 209)(2)

表2 文山紅河地區苗族人群20 個STR 基因座法醫學參數(n=2 209)Tab.2 Forensic parameters for 20 STR loci in Miao population from Wenshan and Honghe regions(n=2 209)
文山紅河苗族和24 個其他群體的Fst 值和P值見表3。經Bonferroni 校正(P< 0.05/15≈0.003 3),文山紅河苗族與新疆喀什維吾爾族、云南佤族、越南京族、印度安得拉人、廣西侗族、西藏昌都藏族、長春漢族、廣東梅州客家人、云南哈尼族、新疆阿勒泰漢族、山東濟寧漢族、重慶漢族和新疆伊犁維吾爾族之間有統計學差異的基因座數目最多,有15 個;其次為海南黎族、廣東漢族、愛沙尼亞人、云南漢族和四川漢族,有14 個;與新疆維吾爾族、貴州仡佬族、重慶萬州漢族和云南布朗族在13 個基因座上存在差異;與北意大利人和云南越南人群的差異基因座數目分別為5 個和4 個。

表3 文山紅河苗族與24 個參考群體的Fst 值和P 值(1)Tab.3 Pairwise Fst and P values between Wenshan and Honghe Miao and 24 reference populations(1)

表3 文山紅河苗族與24 個參考群體的Fst 值和P 值(2)Tab.3 Pairwise Fst and P values between Wenshan and Honghe Miao and 24 reference populations(2)

表3 文山紅河苗族與24 個參考群體的Fst 值和P 值(3)Tab.3 Pairwise Fst and P values between Wenshan and Honghe Miao and 24 reference populations(3)
根據本研究群體與24 個已報道人群的群體數據計算得到Nei's 標準遺傳距離矩陣,見表4。其中,文山紅河苗族與云南越南人群的遺傳距離最小(0.026 537),與愛沙尼亞人群的遺傳距離最大(0.904 458)。通過構建NJ 系統發育樹進一步剖析這些群體的遺傳關系,結果顯示文山紅河苗族與云南越南人群聚為一支,見圖1。基于Nei's 遺傳距離進行MDS 分析,同樣觀察到文山紅河苗族與云南越南人群相距較近,而與愛沙尼亞人群相距較遠。此外,不同地區的漢族和維吾爾族分別聚為一簇,見圖2。

圖1 基于Nei’s 遺傳距離構建的文山紅河苗族與24 個參考群體的NJ 系統發育樹Fig.1 The phylogenetic tree based on Nei’ s genetic distances between Wenshan and Honghe Miao and 24 reference populations

圖2 基于Nei’s 遺傳距離對文山紅河苗族與24 個參考群體的MDS 分析Fig.2 Multidimensional Scaling(MDS)analysis based on Nei’ s genetic distances between Wenshan and Honghe Miao and 24 reference populations

表4 文山紅河苗族與24 個參考群體的Nei's 遺傳距離Tab.4 Nei’s standard genetic distances between Wenshan and Honghe Miao and 24 reference populations
本研究報告了文山紅河地區苗族人群20 個常染色體STR 基因座的等位基因頻率和相關法醫學參數,評估了PowerPlex?21 系統在該人群中的法醫學應用價值。PowerPlex?21 分型系統是一種廣泛使用的商業試劑盒,該試劑盒包含DNA 聯合索引系統(CODIS)推薦的17 個位點,還增加了Penta E,D6S1043和Penta D基因座。DP 和PE 值反映STR 分型系統在個體識別和親權鑒定中的能力,一般認為DP > 0.80、PE > 0.50 的基因座具有高鑒別能力。本研究中,Penta E,D6S1043和Penta D3 個基因座的DP 和PE 值分別為0.986 8,0.971 1,0.932 7 和0.801 8,0.715 7,0.585 5,可見這些基因座屬于高度多態性。在所有20 個基因座中,Penta E的Pm 值最小,DP、PIC、PE、Ho 值最大。分析國內外其他群體發現,該基因座具有極高的鑒別力和多態性,法醫學應用價值較高[6-11]。本研究群體在20 個STR 基因座的CDP和CPE 分別高達0.999 999 999 999 999 999 999 932 674 151 和0.999 999 935 545 335,這表明PowerPlex?21 復合擴增體系在文山紅河苗族人群中具有極高的系統效能,可用于該地區苗族人群的個體識別和親權鑒定。
遺傳距離是表征群體間遺傳異質性或遺傳分化的重要指標,本研究通過計算群體間遺傳分化指數Fst 值和Nei's 遺傳距離,構建N-J 系統發育樹和MDS 分析,探索了文山紅河苗族人群與其他24 個群體之間的遺傳關系。結果表明文山紅河地區苗族與云南越南人群的親緣關系較近。文山紅河地區的馬關、金平、屏邊、河口等縣與越南北部的河江、老街、萊州等省(市)接壤。在邊境線上跨界而居的民族很多,包括文山紅河地區的苗、彝、壯等民族,以及越南北部的越(京)、赫蒙(苗)等民族[29]。由于長期跨界而居,中越邊境民族互相通婚,彼此形成了“民族共宗,文化同源,江河同流”等特點[29]。這可能是文山紅河苗族與云南越南人群親緣關系較近的原因之一。方玲等[30]分析了不同民族線粒體DNA 中9 bp 重復序列的缺失頻率,結果表明中國南方苗族人群與越南人群在遺傳上有較為密切的關系,本研究從常染色體STR 的角度驗證了前人的研究結果。此外,不同地區的漢族群體(云南漢族、重慶漢族、四川漢族、廣東漢族、山東漢族、新疆漢族和長春漢族)以及3 個維吾爾族群體(新疆伊犁維吾爾族、新疆維吾爾族和新疆喀什維吾爾族)分別聚為一簇,彼此間遺傳關系較為密切,證明了不同地區同一民族在共同起源上的潛在關聯,說明常染色體STR 遺傳標記在評價群體遺傳結構和族源推斷方面具有一定作用[31-33]。
本研究報告了文山紅河地區苗族人群2 209例無關個體20 個常染色體STR 基因座的等位基因頻率及法醫學參數。結果表明,20 個常染色體STR 基因座在文山紅河苗族人群中具有較高的遺傳多態性和較好的系統效能,可滿足法醫學個體識別和親權鑒定,亦可為群體遺傳學研究提供基礎數據。