劉 帥,蔣 麗
(1.上海海洋大學水產科學國家級實驗教學示范中心,上海 201306;2.中國水產科學研究院農業農村部水生動物基因組學重點實驗室,北京 100141)
日本沼蝦(Macrobrachiumnipponense)俗稱青蝦、河蝦,屬于節肢動物門(Arthropoda)甲殼綱(Crustacea)十足目(Decapoda)長臂蝦科(Palaemonidae)沼蝦屬(Macrobrachium),廣泛分布于我國及東南亞大部分地區,由于其肉質鮮美,營養豐富,是我國重要的淡水養殖蝦種之一。雌雄差異及群體均勻度低是制約集約化養殖產量的主要因素,因而,從基因組水平對其體重相關的基因進行解析,進而培育具有較高均勻度且增重快的新品種對其養殖業發展具有戰略意義。
全基因組關聯分析(genome-wide association study,GWAS)是現代分子育種的重要輔助手段,通過單核苷酸多態性(single nucleotide polymorphism,SNP)與目標性狀之間的關聯檢驗,實現相關基因的定位,在水產動物育種中發揮著重要作用。經典的GWAS只針對單一性狀進行分析,但當不同性狀間存在遺傳相關時,考慮性狀間協方差的多性狀分析相較于單性狀分析具有更高的檢驗功效[1]和參數估計的精度[2]。已有研究證明,多性狀聯合 GWAS分析對顯著遺傳變異的檢測能力更強[3],且更具生物學意義[4]。基于此,筆者對日本沼蝦體重和出肉率性狀進行聯合分析,實現對相關基因的定位和篩選,以期為日本沼蝦生長增重的基因表達解析提供理論支撐,進而促進其養殖業發展。
1.1 試驗群體及表型測量試驗用蝦養殖于中國水產科學研究院淡水漁業研究中心宜興大浦基地,收集日齡52 d的成熟蝦,隨機挑選200尾健康蝦(雌雄各100尾)編號,記錄體重,收集蝦尾部的肌肉并稱重,尾部肌肉與體重的比值為出肉率。此外,收集的肌肉需轉入凍存管中于-80 ℃保存,以便進行DNA提取。
1.2 DNA提取、測序及基因型數據的獲取以收集的肌肉組織為材料,根據酚-氯仿法[5]提取DNA,使用1%瓊脂糖凝膠評估提取DNA質量,并將其濃度調整至2.5 μg/μL,最終在北京華大基因完成序列測定。原始測序數據經工具包NGS QC Toolkit[6]質控過濾后,通過軟件BWA[7]與日本沼蝦參考基因組(GCA_015104395.1)進行對比分析,通過軟件Picard(https://github.com/broadinstitute/picard)去除對比結果中的重復序列,最終由軟件GATK(https://github.com/broadinstitute/gatk)實現SNP位點的篩選,從而完成基因分型。獲得的分型數據需要通過PLINK[8]軟件進一步質控和過濾,去除樣本分型成功率≤90%,最小等位基因頻率≤5%的位點并生成二進制基因型數據。
1.3 全基因組關聯分析分別對體重、出肉率性狀進行單性狀的全基因組關聯分析,并對2個性狀進行多性狀聯合分析,其中單性狀分析使用GEMMA[9]軟件中的單性狀混合模型分析,多性狀聯合分析采用GEMMA軟件中的多性狀線性混合模型。以Bonferroni校正閾值[10]為界限篩選與性狀顯著相關的SNP位點,并通過R語言繪制曼哈頓和Q-Q圖。
1.4 基因注釋根據檢驗顯著SNP位點于參考基因組上的物理位置,提取其上下游區域250 kb范圍內的序列,通過軟件KOBAS(http://kobas.cbi.pku.edu.cn/kobas3)調整參數“-e 1e-5”實現對提取序列的注釋,根據NCBI數據庫及文獻檢索實現注釋的功能注釋。
2.1 表型及基因型描述統計剔除體重、出肉率表型數據中的缺失項后共獲得181尾蝦的表型數據(表1),性狀間的相關關系及分布見圖1~3。基于181尾蝦分型獲得的基因型數據中剔除分型成功率≤90%及最小等位基因頻率≤5%的位點后,共獲得7 793個高質量SNP位點。

表1 表型描述性統計Table 1 Descriptive statistics of phenotype

圖1 日本沼蝦體重性狀分布Fig.1 Distribution in traits of body weight for Macrobrachium nipponense
2.2 全基因組關聯分析對體重、出肉率進行單一性狀的全基因組關聯分析及兩性狀的聯合分析,結果如圖4所示。觀察圖4 d~圖4f,根據統計檢驗概率P值擬合的實際曲線均與理論曲線有較高的一致性,且基因組控制值(λ)位于1.00附近[11],說明關聯檢驗的統計準確性較高,進而可說明曼哈頓圖中檢測到的SNP具有較高的可信度(圖4a~c),水平線表示Bonferroni校正閾值(0.05/7793,6.42e-06)分布于水平線上方的位點具有與性狀的顯著相關性。由圖4a可知,在體重單性狀關聯分析中,僅檢測到1個SNP位點與之相關;在出肉率的單性狀關聯分析中(圖4b),并未檢查測到顯著SNP位點;在兩性狀的聯合分析中(圖4c),共檢測到6個SNP位點,且體重單性狀分析檢測到的SNP位點也被包含在內,這證明多性狀聯合分析對SNP檢測的效率具有顯著提升作用。

圖2 日本沼蝦出肉率性狀分布Fig.2 Distribution in traits of meat rate for Macrobrachium nipponense

圖3 日本沼蝦體重和出肉率性狀相關關系Fig.3 The correlation between trait of body weight and meat rate in Macrobrachium nipponense

圖4 日本沼蝦體重、出肉率單一分析及聯合分析的曼哈頓和Q-Q圖Fig.4 The manhattan and Q-Q plot of single and combine analysis for body weight,meat rate in Macrobrachium nipponense
2.3 候選基因根據日本沼蝦體重和出肉率聯合分析獲得的顯著SNP 位點為探針,提取其所在日本沼蝦全基因組位置上下游250 bp區域內的序列,通過數據庫kobas完成候選基因的在線注釋與鑒定,共鑒定出5個候選基因(表 2),分別為Jrkl(JRK like)、Tep2(Thioester-containing protein 2)、ZNF84(zinc finger protein 84)、CG12299和swm(second mitotic wave missing)。通過KEGG通路注釋分析,這些候選基因主要參與基因表達調控、轉錄調控、細胞信號轉導、蛋白酶解、內肽酶分析及先天性免疫系統發育等生物學過程,在機體分化發育方面發揮著重要作用。

表2 日本沼蝦體重和出肉率兩性狀聯合分析的顯著位點與基因Table 2 Significant loci and genes of joint analysis for body weight and meat yield in Macrobrachium nipponense
隨著測序成本的下降及多種水產動物基因組全測序的完成,GWAS技術逐漸應用于水產動物的基因定位及育種領域。吳碧銀等[12]通過GWAS分析技術發現了影響低氧環境下鯉耐受性的23個候選基因。陳小明等[13]利用GWAS檢測到26個與大黃魚耐高溫相關的基因。徐鴻飛等[14]對紅羅非魚低溫體色變異現象進行GWAS分析,發現了19個與之相關的功能基因。
盡管GWAS在水產動物已有諸多應用,但大多數都是針對單一表型的關聯分析,而水產動物的表型如體重、體長、性別之間存在顯著相關性,因而對表型進行單一性狀關聯分析時,通常會忽略某個SNP位點對多個性狀的共同影響,致使檢驗SNP位點的個數變少,篩選到的候選基因精度降低。相較于單一性狀關聯分析,多個性狀聯合分析方法在顯著SNP的定位上表現出更高的檢測能力和精確度。通過對比日本沼蝦體重和出肉率兩性狀 GWAS 與兩性狀分別進行單一性狀 GWAS 的結果發現,在相同的顯著水準下,前者檢測到 6個顯著SNP 遠多于后兩者共檢測到的1個與體重相關的SNP。基于聯合分析檢測到的6個顯著SNP位點篩選到的5個功能基因中,Jrkl為功能未知的新基因;Tep2編碼含硫蛋白2,參與代謝、細胞程序性死亡及免疫應激等有關生物學活動的調控[15];ZNF84和CG12299[16]分別編碼鋅指蛋白84和鋅指蛋白135,作為鋅指蛋白家族的成員,可通過其鋅指結構域與轉錄因子結合進而調控基因表達[17],參與細胞增殖、分化和凋亡等多種生理過程,維持組織穩態;swm編碼的蛋白是Hh信號的負調節因子[18],對細胞極性至關重要。該研究定位到的候選基因都與機體發育相關,可能在日本沼蝦體重和出肉率性狀的表現上有重要影響,因而可對日本沼蝦體重和出肉率的解析提供理論支撐。