潘賢輝,周康奇,陳 忠,杜雪松,黃 姻,覃俊奇,文露婷,潘志忠, 鄧 潛,羅 輝,葉 華,林 勇
(1.廣西壯族自治區水產科學研究院,廣西水產遺傳育種與健康養殖重點實驗室, 廣西水產良種南繁基地,南寧 530021; 2.西南大學,魚類繁育與健康養殖研究中心,重慶 402460)
禾花鯉(Procyprismerus)又名禾花魚,在原產地因以稻田的禾花為食而得名。原產于廣西桂林、灌陽、全州等地區的禾花鯉,因體色烏黑,又被稱為禾花烏鯉或烏鯉[1]。這種禾花鯉的體形粗短、個體小、細葉鱗、皮薄、腹部呈紫褐色且隱約可見內臟。而產于廣西融水、三江等地區的禾花鯉,較其他普通鯉魚而言,其脊背處兩側各有金黃色的長條紋,又名為金邊禾花鯉。以上兩種禾花鯉都具有肉多刺少,肉質細嫩清香,無腥味的特點,一般上市個體在50~250 g之間,從外部形態和體色上明顯區別于廣西野生鯉魚。
線粒體DNA(mtDNA)屬于核外遺傳物質,具有分子小、結構簡單、進化速度快、不發生重組且遵循母系遺傳等特點,已成為研究群體遺傳結構、近緣物種進化關系、基因流動、物種起源的重要遺傳標記[2,3]。mtDNACOI基因具有進化速率適中的特點。而mtDNA D-loop多態性豐富,進化速度快,是遺傳高變區,兩者都被廣泛應用于種屬系統進化關系和遺傳多樣性的研究中[4,5]。目前,禾花鯉是“十三五”廣西桂西北農民扶貧攻堅中主導養殖品種,也是廣西重要的地理標志產品。因此為防止禾花鯉種質資源退化、混雜現象的發生,進而影響其產品質量和經濟效益,本研究擬采用mtDNA D-loop區和COI基因序列共同對全州禾花鯉(QuanzhouP.merus)、融水禾花鯉(RongshuiP.merus)和野生鯉魚的遺傳多樣性與遺傳結構進行分析,并初步探討禾花鯉種質資源鑒定和評價方法,以及闡述2個地區禾花鯉與野生鯉群體的分子系統進化關系。從而為禾花鯉的種質資源保護、人工選育及資源的合理開發利用提供有效的科學依據。
32尾全州禾花鯉(簡稱QZ)采自廣西桂林綠淼生態農業有限公司七星鄉禾花鯉稻田養殖基地,體長為(14.1±0.2)cm,體重為(8.3±0.2)g;32尾融水金邊禾花鯉(簡稱RS)采自廣西融水縣融榮水產品養殖專業合作社金邊禾花鯉科技繁育基地,體長為(34.3±1.9)cm,體重為(231.2±3.6)g;32尾野生鯉(簡稱YS)采自廣西那龍鎮廣道水產養殖場,體長為(22.1±1.2)cm,體重為(201.0±4.1)g。分別取鰭條組織,置于95%無水乙醇中儲存,放于-20 ℃保存備用。以上樣品分別用于mtDNA D-loop區和COI基因分析。
每個個體剪取50 mg鰭條用于提取DNA,用mtDNA D-loop區和COI基因擴增的提取方法按照天根DNA提取試劑盒說明書進行,最終獲得的DNA溶液置于-20 ℃保存備用測序。mtDNA D-loop區擴增引物序列:
D-loop Pro:5′-TCCCAAAGCTAGGATTCTAAAC TAAAC-3′
D-loop Pre:5′-TTCATCTTAACATCTTCAGTGTT ATGC-3′[4]
每個反應體系都為50 μL,含25 μL 2×Es Taq Master Mix(Dye),10 μmol/L的上、下游引物各2 μL,DNA模板3 μL,ddH2O 18 μL。PCR反應程序為:94.0 ℃預變性3 min;94.0 ℃變性30 s,55.0 ℃退火30 s,72.0 ℃延伸1 min,30個循環;最后72.0 ℃延伸10 min,4 ℃保存。PCR產物用1%的瓊脂糖進行凝膠電泳檢測,凝膠成像系統觀察并拍照保存。COI基因擴增引物序列:
L5956-F:5′-CACAAAGACATTGGCACCCT-3′
H6855-R:5′-AGTCAGCTGAAKACTTTTAC-3′[6]。
PCR反應體系、反應程序和產物檢測與擴增D-loop區相同。以上兩對引物都由生工生物工程(上海)股份有限公司合成。PCR產物純化后,委托生工生物工程(上海)股份有限公司進行雙向測序,測序所用引物為PCR擴增引物。
所獲得測序結果運用Vector NTI軟件進行拼接,用ClustalX 1.83軟件對測序結果進行比對與校正。用DnaSP 6.12.01軟件計算單倍型數、單倍型多樣性(Hd)指數以及核苷酸多樣性(π)、單倍型間核苷酸差異數(k)等遺傳多樣性指數,并進行遺傳分化和中性檢測分析。用MEGA5.0軟件對不同序列間的變異位點、堿基組成和簡約信息位點等進行分析,并計算群體內和群體間遺傳距離[7],以及基于Kimura雙參數法(Kimura 2-parameter,K2p)模型采用鄰接法(Neighbor Joining,NJ)構建系統進化樹。用Arlequin3.0軟件對群體內和群體間方差進行分子方差(AMOVA)分析[8]。用Network軟件中的中介法(Median joining,MJ)構建單倍型網絡圖。
將測序結果經ClustalX軟件比對和人工校正后,獲得93條mtDNA D-loop區序列長度為927~930 bp(QZ為30尾,RS為32尾,YS為31尾)及95條mtDNACOI基因序列長度為897~899 bp(QZ為32尾,RS為31尾,YS為32尾)。基于mtDNA D-loop區序列分析結果顯示(表1),在序列中A、T、G、C堿基平均含量分別為33.4%、32.9%、14.0%和19.7%,其中A+T(66.3%)明顯高于G+C(33.7%)。而基于COI基因序列分析結果表明,序列中A、T、G、C堿基平均含量為26.7%、28.5%、17.8%和27%,同樣A+T(55.2%)高于G+C(44.8%)。而COI基因序列中的4種堿基在第1、2 和3位密碼子分布不均勻,出現較為明顯的偏倚性,其中堿基A明顯偏向第3位密碼子(37.6%),堿基T明顯偏向于第2位密碼子(40.5%),堿基G則在第1位密碼子上出現頻率(30.2%)最低。

表1 基于線粒體D-loop區和COI基因序列的堿基組成Tab.1 Nucleotide composition based on mtDNA D-loop region and COI sequences %
基于mtDNA D-loop序列分析獲得3個群體的遺傳多樣性參數,從表2可以看出QZ的單倍型數(h)為17個,分別多于YS(15個)和RS(13個)的單倍型數量,QZ的單倍型多樣性(Hd)為0.938,也大于YS(0.86)和RS(0.889)的單倍型多樣性指數,而在核苷酸多樣性(π)指數上,YS(0.009 31)>QZ(0.008 62)>RS(0.004 84)。基于mtDNACOI基因序列分析發現在變異位點、簡約信息位點和單一突變位點上YS均大于其余兩個群體。在遺傳多樣性參數信息上可以看出,YS的單倍型數(14個)、單倍型多樣性(0.893)、核苷酸多樣性(0.003 76)和平均核苷酸差異數(3.371)4個參數上都高于其余兩個群體;其次在QZ中的單倍型數(14個)和單倍型多樣性(0.857)2個參數要高于RS(6,0.789),但余下核苷酸多樣性和平均核苷酸差異數2個參數QZ(0.002 5,2.244)低于RS(0.002 9,2.605)。綜合D-loop區和COI基因序列分析結果可知,3個群體的單倍型多樣性和核苷酸多樣性都較高。
利用K2p法計算3個群體內和群體間遺傳距離與遺傳分化指數(表3)。基于D-loop序列的分析結果顯示,3個群體的群體內平均遺傳距離分別為0.004~0.009,大小順序為YS>QZ>RS;各群體間遺傳距離為0.007~0.01,其中QZ與YS群體間遺傳距離最大(0.01)。基于COI基因序列的計算結果表明,RS與QZ的群體內平均遺傳距離都為0.003,YS的群體內距離為0.004;RS和QZ與YS群體間的遺傳距離都為0.004,而RS與QZ群體間的遺傳距離為0.003。用DnaSP軟件進行遺傳分化和基因流分析結果揭示,基于D-loop區和COI基因序列分析總體3個群體的近鄰統計(Snn)值分別為0.948 92(P<0.001)和0.829 26(P<0.001),表明3個群體已出現極顯著分化現象;3個群體的基因流(Nm)為0.149 95~0.309 53和0.153 04~0.252 8,基因流均處在0~1之間,說明種群間基因交流較弱,群體間分化程度較大[9]。此外,3個群體間遺傳分化指數(Fst)分別為0.150 03~0.309 67和0.153~0.250 86,遺傳分化指數均大于0.15,達到顯著水平(P<0.05),表明3個群體間出現顯著分化(表3)。

表2 基于線粒體D-loop區和COI基因序列進行遺傳多樣性分析Tab.2 Parameters of genetic diversity based on mtDNA D-loop and COI sequences

表3 基于線粒體D-loop區和COI基因序列的 遺傳距離和遺傳分化分析Tab.3 The genetic distance and genetic differentiation based on mtDNA D-loop region and COI sequences
注:左下角表示群體間遺傳距離;對角線上表示群體內遺傳距離;右上角表示群體間遺傳分化;*表示P<0.05。
將3個群體基于D-loop區和COI基因序列進行Tajima′s D test和Fu′s Fs test中性檢驗,結果均不顯著,表明3個群體均符合中性進化假設,且3個群體未發生種群擴張。基于D-loop區序列的AMOVA分析顯示,3個群體主要變異來源群體內(77.54%),其遺傳變異高于群體間(22.46%);而基于COI基因序列AMOVA分析結果與D-loop區相似,3個群體內變異(80.86%)高于群體間遺傳變異(19.14%)。
將D-loop區和COI基因測序結果經ClustalX軟件比對和Dnasp軟件進行序列定義,分別獲得了40與25個單倍型。在D-loop區序列的單倍型中,所有單倍型都為1個群體特有,未發現共享單倍型;根據不同單倍型在群體中的比例顯示,QZ的優勢單倍型有Hap11和Hap17,占QZ單倍型數的20%和16.7%;RS的優勢單倍型Hap12較為明顯,其占比46.9%,其次是Hap6占比為12.5%;YS的優勢單倍型為Hap31,占比32.3%。在COI基因序列的單倍型中,除Hap9和Hap13為QZ和RS群體的共享單倍型外,其余群體間未存在共享單倍型;QZ的優勢單倍型有Hap2、Hap3、Hap9和Hap13,占比分別為18.8%、15.6%、31.2%和15.6%;RS的優勢單倍型為Hap5、Hap13和Hap17,占比分別為16.1%、54.8%和19.4%;YS的優勢單倍型為Hap4和Hap16,占比分別為25%和18.8%。由此看出,各群體間擁有較少的共享單倍型,在3個群體內獨有的單倍型占有量非常豐富,而獨有單倍型大量的存在說明3個群體間出現一定程度的分化。
基于K2p模型分析D-loop序列的40個單倍型間遺傳距離為0.021~0.336,總體平均遺傳距離為0.246;COI基因序列的25個單倍型間遺傳距離為0.038~0.449,總體平均遺產距離為0.186。采用NJ法構建進化樹分析結果顯示,在D-loop的進化樹上發現YS中是Hap25、26、27、28、29單倍型聚為一支,QZ中的Hap17、18、19、20、24、35、36、38單倍型聚為一小支。而含有RS單倍型的分支中都存在著其它群體的單倍型,并沒有形成該群體的單系(圖1-a)。此外發現QZ單倍型Hap24與YS單倍型Hap30分別單獨成一支。在COI基因的進化樹上未發現3個群體單獨形成的分支,每條分支內都分布著2個或2個以上不同群體來源的單倍型(圖1-b)。

圖1 基于線粒體D-loop區(a)和COI基因(b)序列構建的NJ系統進化樹Fig.1 Neighbor-joining tree based on mtDNA D-loop and COI sequences ■為YS,▲為QZ,●為RS,存在2個圖標表示共享單倍型。
運用Network軟件中的Median-joining法,基于D-loop區的40個單倍型序列構建單倍型網絡圖(圖2-a)顯示,3個群體都以各自群體主要的單倍型為中心向其他單倍型發散,其中QZ是以Hap17單倍型為中心,YS是以Hsp25和Hap31兩個單倍型為中心,RS是以Hsp12為中心。此外,在網絡圖上還發現QZ中的優勢單倍型Hap11是由RS的Hap12單倍型突變形成。基于COI基因25個單倍型序列構建單倍型網絡圖(圖2-b)發現未呈現單一星狀散射分布,不同群體單倍型的來源都由共享單倍型Hap9(QZ和RS)直接或間接突變后形成。另外,在圖中明顯觀察到2個回路結構特征,一是Hap9→Hap16→Hap26→Hap7→Hap12→Hap4→Hap9,二是Hap9→Hap3→Hap4→Hap9。

圖2 基于線粒體D-loop區(a)和COI基因(b)序列構建禾花鯉單倍型網絡圖Fig.2 The haplotype network of mtDNA D-loop region and COI sequences of P.merus populations 圓圈面積大小表示單倍型頻率,縮寫代碼同表2,紅色圓圈表示缺失單倍型。
將本研究所獲得的3個群體的93條D-loop區和95條COI基因序列放入NCBI數據庫進行BLAST比對結果顯示,所得3個群體的2種序列與鯉魚相對應序列相似度均達到99%,說明所獲得的D-loop區和COI基因序列為本次研究對象序列。從獲取的3個群體D-loop區和COI基因序列的堿基組成可以看出,D-loop區和COI基因序列都表現出很強的堿基組成偏向性,即在A、T、G、C共4種堿基中,G的含量明顯低于其他3種堿基的含量,這與廖健等[10]研究結果相似;另外,3個群體的D-loop區和COI基因序列中A+T(66.3%,55.2%)含量都較C+G(33.7%,44.8%)高,其他硬骨魚類mtDNA D-loop區和COI基因序列同樣具有類似情況,說明3個群體的堿基組成符合脊椎動物線粒體基因組中4種堿基分布不均這一特點[11,12]。
一般而言,物種遺傳多樣性與其生存、適應能力和進化潛力緊密相關,物種的遺傳變異是適應生境的必要條件[13]。同時,遺傳多樣性也是生物多樣性形成的基礎和物種進化潛能的保證[14]。而物種遺傳多樣性評價主要是以單倍型多樣性(Hd)、核苷酸多樣性(π)和單倍型平均遺傳距離(P)3個內容來作為衡量指標[15],數值越大,說明種群或群體的遺傳多樣性越高。從mtDNA D-loop區和COI基因單倍型序列的P值上看,3個群體P值分別為0.241和0.186,而當P值大于0.01時,則表明群體間變異較大[16]。根據Grant等[17]的研究結果,將Hd=0.5、π=0.005作為分界點,在基于mtDNA-loop區研究發現3個群體的單倍型性多樣性和核苷酸多樣性均較高,而基于COI基因分析發現3個群體則為高單倍型多樣性和低核苷酸多樣性。COI基因分析結果與D-loop區存在差異,一方面是受COI基因本身特性所影響;另一方面是COI基因為編碼蛋白序列,而D-loop區為非編碼序列,兩者在進化速率上前者要比后者慢,所以導致在遺傳多樣分析上COI基因的靈敏度要低于D-loop區[10,18]。在本研究中,從D-loop區和COI基因序列分析所獲得的各遺傳多樣性參數(表2)也能看出相似的結果。因此,本研究將以D-loop區遺傳多樣性分析結果為準。
高單倍型多樣性和高核苷酸多樣性的類型在臺灣鏟頜魚[19]、鰱[20]、松江鱸[21]、斑點叉尾鮰[22]等淡水魚類上普遍存在。已有學者依據單倍型多樣性和核苷酸多樣性數值的大小劃分為低單倍型多樣性和低核苷酸多樣性、高單倍型多樣性和低核苷酸多樣性、低單倍型多樣性和高核苷酸多樣性以及高單倍型多樣性和高核苷酸多樣性共4個模式[17]。按其分類本研究結果應屬于第4類模式,預示著3個群體是由一個大而穩定的種群經過長時間演化所產生。這與全州和融水兩地縣志中記載的關于全州禾花鯉和融水金邊禾花鯉的稻田養殖發展歷史相符,2個群體的出現時間可追溯到清代乾隆年間或更早。基于mtDNA D-loop區和COI基因序列的遺傳多樣性分析結果可以看出3個群體遺傳豐富度的大小順序為YS>QZ>RS,說明YS對環境適應能力、生存能力和突變頻率都要強于QZ和RS。總體而言,目前稻田養殖的2個禾花鯉群體的遺傳多樣性較YS有所下降,因此在后續人工選育工作中應加強親本的選擇,以保證在稻田養殖過程中禾花鯉種群遺傳多樣性豐富度,從而提高禾花鯉的種質。
遺傳分化指數(Fst)又稱固定系數,是衡量群體間遺傳分化的重要指標,當Fst在0~0.05為極小遺傳分化;在0.05~0.15為示中度遺傳分化;在0.15~0.25為較大遺傳分化;大于0.25,則為極大遺傳分化[23,24]。本研究基于mtDNA D-loop區和COI基因序列進行AWOVA分析所得總體Fst值分別為0.224 59和0.191 43,處于0.15~0.25范圍內,表明3個群體間出現較大的遺傳分化。此外,遺傳距離是群體間分類的一個重要依據,結合mtDNA D-loop區和COI基因序列分析所得群體內和群體間的遺傳距離范圍分別處于0.003~0.009和0.003~0.01之間,都遠小于種群(0.05)遺傳距離的分類水平[25],且群體內與群體間遺傳距離差異不明顯,說明3個群體間未呈現明顯的種群分化。雖然在D-loop區構建的系統進化樹中發現部分YS和QZ各自聚在一起,形成一支獨立的單系類群,但RS、QZ與YS共同構成1個單系群,說明3個群體為3種生態型種群,并非3種有效物種。
根據mtDNA D-loop區40個單倍型序列建立的單倍型網絡圖可以看出在所有的單倍型中共享單倍型僅存在同一個群體內,群體間均不存在共享單倍型。出現這種分布方式可能是由于3個群體樣本采樣點距離較遠,產生一定的地理隔離導致3個群體之間基因交流較少,另外,遷徙能力較短可能也是影響基因流的一個原因。但是來自3個群體的單倍型之間存在親緣關系較近,突變步數1~4步不等,且存在一個群體內單倍型直接來源于另一個群體的現象,如QZ的Hap1和Hap11單倍型分別由YS的Hap2單倍型與RS的Hap12單倍型突變而來。此現象在COI基因單倍型網絡圖中也普遍存在。而依據COI基因單倍型序列構建的單倍型網絡圖顯示,QZ和RS共享2個YS沒有的單倍型(Hap9,Hap13),說明QZ和RS兩個群體的親緣關系較近,這與2個群體的遺傳距離分析結果相同。此外,依據Tenpleton等[26]對內支(inierior clade)與末支(tip clade)的定義,可判定2個共享單倍型都為內支。而因Hap9發出的連線最多,并與其它單倍型的聯系最為密切,所以推測該單倍型為古老單倍型,其進化時間要早于Hap13。同時,在COI基因單倍型網絡圖還存在回路結構特征,包含來自3個群體單倍型。這是由于回路中的所有單倍型都發生了趨同演化的結果,說明群體的生活環境條件與所面對環境選擇壓力相似,這可能是致使3群體間的遺傳分化只發生在種群內的原因之一。
目前稻田養殖的全州禾花鯉和融水金邊禾花鯉從體型、體態、體色等外部形態方面與野生鯉存在明顯的差異,推測這可能一方面是由全州縣和融水縣當地人們在人工選育過程中對鯉魚外部形態的評價標準不一致所造成的;另一方面3個群體所面臨的生境相似,使得3個各群體間機體結構未發生太大變化。綜合以上分析結果表明,3個群體的遺傳變異主要還是來源于種群內變異(以外部形態變異為主),未達到種群或以上變異程度,表明2個地區禾花鯉群體與野生鯉同屬于鯉科魚類。另外,依據表3群體間的遺傳距離大小可以看出QZ與RS親緣關系較近,其次是QZ與YS,而RS與YS親緣關系較遠,推測2個禾花鯉群體都是由YS演變而來,且QZ出現的時間要早于RS。