薛 倩,朱云芬,李國輝,曹愉夏,張會永,殷建玫,竇新紅,蘇一軍,王克華,韓 威*,鄒劍敏*
(1.中國農業科學院 家禽研究所,江蘇 揚州 225125;2.江蘇省家禽科學研究所 科技創新中心,江蘇 揚州 225125)
近交(inbreeding)是指親緣關系很近的個體間的交配,亦稱近親交配。近交會產生消極影響:(1)導致群體遺傳多樣性降低;(2)引起近交衰退(inbreeding depression)。研究表明,近交不僅會引起存活率、繁殖力、疾病易感性等適應性性狀的衰退[1],還會引起產蛋、產奶、絨毛等生產性狀的衰退[2]。此外,近交還會對骨組織、血清中的離子濃度和激素水平[3-4]以及ATP和酶活力[5]等生理生化指標造成影響。
近交衰退的發生具有不確定性[6]。據過去諸多報道,動植物近交衰退在發生的世代[7]、生長階段[8]、性狀[2,9]、性別[10-12]等方面均存在不確定現象,且近交衰退對不同物種的影響程度不同。在綿羊[13]和鳥類[14]的研究上發現,試驗種群與野生種群相比更容易發生近交衰退。同一種群相同近交程度的個體表現出的衰退也不盡相同[15-16]。此外,近交與環境具有互作效應,近交個體對冷應激[17]、熱應激[18]、氧化應激[19]等環境壓力條件更敏感,在惡劣環境中更容易表現出衰退甚至死亡。在果蠅中,隨著壓力的解除,衰退現象會減緩[10];在甲蟲中,親代撫育也會減緩近交衰退[20]。在哺乳動物綿羊[21]、馬鹿[22]中,母親的近交更容易影響到后代的體重、存活率等;在馬氏珠母貝上也發現了近交衰退與母本效應有關[23]。
但是近交也具有積極意義。在育種中,通過近交增加品系群體內等位基因純合度,減少世代傳遞過程中的基因型分離(表型分離),是純化優良基因進而提高選育品系的群體同質性和遺傳穩定性的有效技術手段。近交系也是重要的生物模型,是連鎖圖譜構建和QTL定位等遺傳學以及病理學研究的良好試驗材料。近年來,除了傳統的果蠅、小鼠等模式生物,在哺乳動物(豬)近交系的培育中也取得了突破性進展[24]。
關于近交衰退的遺傳機制,群體遺傳學研究認為近交衰退主要是由個體基因組的純合度(Homozygosity)增加引起的,并形成了兩個經典理論:(1)“顯性理論”(Dominance hypothesis),認為大多數突變是中性的或有害的,而且一般為隱性,近交增加了有害等位基因暴露的幾率;(2)“超顯性理論”(Overdominance hypothesis),認為雜合子在適應性和繁殖力等方面優于純合子。此外基因間的上位效應(Epistatic effect)[25]、偽超顯性效(Pseudo-overdominance)[26]也被證明與近交衰退有關。
隨著新一代測序技術(next generation sequencing,NGS)的發展,對近交衰退的研究逐漸深入到分子水平,并取得顯著進展。本文將圍繞全基因組信息在近交參數度量中的應用、全基因組基因表達和表觀遺傳與近交衰退的關系等幾個方面進行綜述和展望,以期為傳統學說提供補充,豐富經典理論內容,為物種資源保護及育種提供科學依據。
準確地度量個體(間)近交系數和親緣系數(relationship coefficient)是開展近交效應研究的前提基礎。在系譜記錄完整的條件下,系譜近交系數和系譜親緣系數是度量近交水平的精確指標[27],記錄的世代數越多,這種方式就越有效[28]。但是,在物種資源保護和育種中系譜記錄不完整或有錯誤現象普遍存在[29],且系譜記錄依賴于基礎群(founder population)[30]。
基于系譜信息的個體(間)近交系數、親緣系數反映的是同源等位基因標記(identity by descent,IBD)出現的概率,其值是固定的(如全同胞或半同胞);而基于分子標記信息允許有相同系譜水平的一組個體間存在分化,其值是連續的,因此個體(間)近交系數、親緣關系度量更為精確,可用于核實系譜或重建系譜。早期研究是利用隨機擴增多態性DNA(random amplified polymorphic DNA,RAPD)[31]、微衛星(microsatellite)[32-33]等低密度分子標記度量近交參數,然而由于標記數量有限,存在較大的抽樣誤差,致其準確性較低。隨著新一代測序技術的發展,使得鑒定全基因組SNP分子標記成為可能,大大提升了近交參數度量的準確性。
Wang等[34]通過模擬數據研究發現,當基因組標記數量足夠多(比如104個SNPs)時,SNP標記信息比系譜更能精確估計近交系數,尤其對于基因組小的物種,系譜估計效果更差,因為基因組近交系數很大程度上是由孟德爾分離決定的,系譜估計可能會大大偏離預期。Silió等[35]在一個可追溯到26世代系譜記錄的豬閉鎖群體中,發現利用SNP標記信息計算的近交系數與系譜近交系數有很強的相關性,利用168個中間頻率的SNP標記信息計算了基因組純合度,發現其對斷奶后仔豬生長性能的負面影響與系譜近交系數相似。Li等[36]利用高密度50K芯片檢測平臺,在綿羊群體中共發現49 034個SNP, 基于這些SNP估算群體平均分子近交系數為0.04,結果和系譜數據估計的近交系數、親緣系數幾乎是一致的,尤其是對全同胞、半同胞個體的估計更準確。在缺乏系譜的野生群體中,利用基因組信息度量近交參數更具優勢。Hoffman等[33]發現利用簡化基因組測序技術(restriction site associated DNA sequencing,RAD-seq)所得的SNP標記信息,能夠準確估計田鼠、海豹自然群體的近交程度。Huisma等[22]研究發現在野生馬鹿群體中,利用SNP標記信息計算的近交系數與繁殖成功率相關,而利用系譜信息卻低估了近交對成年個體適應性的影響,表明利用SNP標記信息是評估自然群體近交衰退的有力工具。
利用SNP標記信息估計近交系數和親緣系數的準確性會受到SNP最小等位基因頻率和標記數目的影響,SNP數量越多,等位基因初始頻率越接近0.5,準確性越高[37-38]。目前,利用SNP標記信息估計基因組近交系數常用的兩種方法是基于基因組純合度(homozygosity,HOM)和長純合片段(runs of homozygosity,ROH)。其中,ROH被認為是最優方法,長的ROH能夠反映出親緣關系近的共同祖先,短的ROH反映的是親緣關系遠的祖先[39]。Brito等[40]比較了兩個不同山羊品種的4種基因組近交系數(FROH、FEH、FVR、FLEUT)與系譜近交系數(FPED)的相關性,發現基于ROH的基因組近交系數(FROH)與系譜近交系數相關性最高,基于HOM的基因組近交系數(FEH)次之,另兩種相差甚遠,且FROH與FEH兩種基因組近交系數之間相關性達到0.9。在中國荷斯坦牛基因組近交研究中與上述結果相一致,隨著系譜的完整性增加,系譜近交系數與基因組近交系數的相關性隨之增加[41]。
使用基因組信息度量近交參數的同時,還能夠鑒定出與特定性狀近交衰退發生相關的基因組區域。Saura等[42]利用不同染色體區段的HOM近交系數,鑒定出豬13號染色體上與繁殖性狀近交衰退相關的一個特定區域,且該區域包含與胚胎附植有關的基因簇。Pryce等[43]和Howard等[44]利用ROH確定了與產犢間隔和產奶量近交衰退相關的特定基因組區域。Ferencakovic等[45]通過ROH度量奶牛的基因組近交系數,并通過線性回歸分析找到了與精子發生和活力相關的基因組區域。
當然,單獨使用某一方面的信息度量近交參數仍是欠缺的,將表型記錄、系譜和基因組標記信息相結合是最佳選擇。
基因表達調控是構成復雜表型變異的重要基礎[46],探討基因表達變異對近交衰退的影響是受重點關注的研究方向之一。已有的研究借助于qPCR(quantitative real-time reverse transcription-PCR)檢測技術發現的候選基因數目較少[47],QTL定位[48]和全基因組關聯分析(genome-wide association studies,GWAS)[49-50]也難以鑒定對近交衰退有貢獻的基因。一些學者認為,近交衰退可能由大量微效基因的累加效應引起,也有學者認為是由少數主效基因引起[51-52]。鑒于多數重要生產性狀為多基因控制,推測整個基因組的大部分與近交衰退相關。
在基因表達水平上研究近交衰退最為深入的是模式生物果蠅,對于近交衰退的最初認識也是來源于果蠅近交系研究[53]。Kristensen等[54]最早報道了近交對果蠅全基因組轉錄表達影響,在近交系與低近交系中發現466個差異表達基因,近交速率并沒有顯著影響基因表達模式;富集分析表明差異基因主要參與壓力反應和新陳代謝通路。Kristensen等[55]發現近交衰退與環境壓力存在互作效應,在壓力條件下近交和遠交系間差異表達基因為176個,遠多于非壓力下的12個。Ayroles等[56]構建了6個3號染色體替換果蠅近交系,以雄性競爭生殖率衡量近交衰退程度,發現567個差異表達基因,差異基因也是集中于新陳代謝、壓力反應和防御反應通路;通過定位差異表達基因的染色體分布,發現近交衰退中的相當一部分是由相對較少的基因通過順式調節或上位互作產生通路級聯效應引起。Garcia等[15-16]構建了來源于同一基礎群的4個不同近交系與遠交系,以產卵力和后代蛹成活率評價近交衰退程度。通過比較每個近交品系內近交衰退程度最高與最低3個亞系及遠交系之間基因表達,發現多數差異表達基因可能主要是減緩近交衰退,作為對抗近交效應的一種響應;只有14個基因具有明顯的組別表達特異性,推測它們可能是導致近交衰退的候選基因[57]。Vermeuln等[18]構建了熱敏感果蠅近交系,通過比較其與對照組全基因組基因表達差異,發現隨著熱應激程度的加劇,差異表達基因數量相應增加,其中一些基因可能包含有與熱敏感表型相關的突變,并推測這些突變是該近交系所特有。Franke等[47]以熱帶蝴蝶為研究對象,構建了包含3個溫度梯度和3個不同近交參數的試驗組,發現熱應激處理后,對照組熱休克蛋白基因的表達顯著上調,而近交組個體的表達僅微弱上調,近交強烈干擾了熱休克響應,這可能是近交個體適應性降低的一種機制。
國內學者在此領域也開展了一些探索性研究,王宇等[58]發現親本來源相同的自交扇貝和雜交扇貝閉殼肌有大量差異表達基因。傅強等[59]研究發現蝦夷扇貝的自交家系的基因總體上調,且上調基因參與了各種宏觀蛋白表達,下調基因顯著富集在與生長顯著相關的EGF家族基因。李俊輝等[23]研究馬氏珠母貝發現近交系礦化基因的相對表達量明顯低于雜交系,與近交系生長緩慢特征相吻合。王竹青等[5]研究三疣梭子蟹發現隨著近交系數的增加,各代F-ATPaseβ基因的表達量在肝胰腺和心臟中均下降且顯著低于F0代。
以上研究均表明近交衰退與轉錄組變化相關,近交個體中大量基因表達的差異可能是導致近交個體衰退的原因,或是作為一種減緩近交衰退的保護性應答。
表觀遺傳學(epigenetics)是獨立于序列變異之外調控基因表達的重要機制,包括DNA甲基化(DNA methylation)、組蛋白修飾(histone modification)和RNA干擾(RNA interference)等。環境因素誘導的表觀修飾能夠遺傳給后代,其變異與表型的多樣化密切相關。Biémont[60]已有研究表明,表觀過程可能參與了近交效應的調節:一種解釋認為近交導致的同質性增加可能破壞了同一位點不同等位基因間的表觀交互,這會引起部分基因的沉默,并因此導致近交衰退,如哺乳動物雌性個體一條X染色體失活就是受表觀調節[61]。另一種解釋認為近交破壞了參與表觀修飾的酶促作用通路[62]。另外,全基因組表觀修飾變異同樣也被證實與近交衰退對立的極端表現-雜種優勢(heterosis)和遠交衰退(outbreeding depression)相關[63]。然而,表觀變異與近交衰退的關系研究較少。
在植物上,Vergeer等[64]通過檢測灰藍盆花近交系和遠交系基因組中的甲基化水平差異,證明表觀變異在近交衰退中發揮重要作用。Dapp等[65]通過對擬南芥全基因組的轉錄譜分析,發現轉錄組的表觀遺傳多樣性和表觀遺傳調控在雜種優勢和近交衰退中起重要作用。Lauss等[66]發現擬南芥親代之間特定基因座的甲基化分化能夠直接或間接引發雜種優勢。羅少杰[67]應用甲基化敏感多態性擴增技術(MSAP)比對馬氏珠母貝自交家系與雜交家系的甲基化模式差異,發現14條存在DNA甲基化修飾差異的序列,且自交子代的甲基化水平高于雜交子代;楊晶淼等[68]構建了馬氏珠母貝的近交家系與雜交家系,利用MSAP檢測甲基化差異水平發現近交家系的甲基化比例和總條代數均顯著性高于雜交家系,且家系的平均殼長、體重等生長性狀與甲基化存在明顯負相關。Venney等[69]在鮭魚的研究中發現,近交衰退與特定基因的甲基化差異表達有關,可能是受環境和性成熟的影響,而且這種差異表達還會隨著年齡的增長而增加。因此,近交衰退發生的不確定性可能與易受環境影響的表觀遺傳修飾密切相關。
新一代測序技術的發展使得對近交效應的研究深入到全基因組水平,為進一步豐富和發展近交衰退經典理論提供了新思路、新方法。目前,利用基因組學、轉錄組學及表觀組學等多組學聯合分析,探討物種特定性狀近交衰退分子機理的研究仍較少,亟待進一步探索。