毛楠楠 孫勇勝 陳輝 周榮艷 籍穎



摘要:為探索巖鴿(Columba livia)產蛋數相關基因及其遺傳標記,利用STAR對高產蛋數和低產蛋數巖鴿卵巢組織轉錄組數據高質量序列與參考基因組進行比對,去除重復序列后利用GATK進行單核苷酸多態性(SNP)篩選,利用VCFtools對SNP質控后進行主成分分析、進化樹構建和Fst計算,利用KEGG富集分析SNP所在基因。結果顯示,高產蛋組共有SNP數為298 957個,低產蛋組共有SNP數為296 137個,高產蛋組、低產蛋組共有SNP數為254 118個,KEGG分析結果發現,SNP所在基因顯著富集在孕酮調節的卵母細胞成熟、卵母細胞減數分裂和代謝等信號通路;高產蛋組和低產蛋組的102個特異SNP分布在14個注釋基因上(LOC110357454、KDM5A、PIGS、BNC2、GBF1、SLAIN2、FGD4、DIAPH2、KIF3B、NFIB、EPG5、OSTF1、EMB、ST3GAL3),且富集的信號通路可能與其產蛋能力密切相關。
關鍵詞:巖鴿(Columba livia);卵巢轉錄組;SNP;產蛋數
中圖分類號:S836? ? ? ? ?文獻標識碼:A
文章編號:0439-8114(2024)04-0185-06
SNP analysis of the ovarian transcriptome of Columba livia with
different egg production numbers
Abstract: In order to explore the genes and genetic markers related to egg production in Columba livia, STAR was used to compare high-quality transcriptome sequences of ovarian tissue transcriptome data from high and low egg production Columba livia with the reference genome,after removing duplicate sequences, single nucleotide polymorphism (SNP) screening was performed using GATK. After controlling SNP quality using VCFtools, principal component analysis, evolutionary tree construction, and Fst calculation were performed. KEGG enrichment analysis was used to identify the gene where the SNP was located. The results showed that the high-yielding egg group had a total of 298 957 SNPs, the low yielding egg group had a total of 296 137 SNPs, and the high-yielding and low-yielding egg groups had a total of 254 118 SNPs. The KEGG analysis results showed that the SNP gene was significantly enriched in the progesterone regulated signaling pathways of oocyte maturation, meiosis, and metabolism;102 specific SNPs were distributed on 14 annotation genes(LOC110357454, KDM5A, PIGS, BNC2, GBF1, SLAIN2, FGD4, DIAPH2, KIF3B, NFIB, EPG5, OSTF1, EMB, and ST3GAL3) in the high and low egg production groups, and the enriched signaling pathways may be closely related to their egg production ability.
Key words: Columba livia(Columba livia); ovarian transcriptome; SNP; egg production numbers
隨著生活水平的不斷提高,鴿蛋和鴿肉產品越來越受到人們青睞。但由于鴿具有一夫一妻制且需要經過孵化、哺喂乳鴿等特性,提高其繁殖能力是生產效率提升的關鍵因素之一。蛋鴿的產蛋間隔一般為9~12 d,肉種鴿在哺喂乳鴿的情況下,產蛋間隔一般為29~35 d,受外界因素的影響,會發生產蛋異常,使產蛋間隔延長而影響產蛋數量。由于繁殖性狀屬于低遺傳力性狀,通過表型選擇的遺傳進展慢,篩選產蛋數相關的主效基因及其遺傳變異,能夠為加快產蛋鴿的選育提供依據。
單核苷酸多態性(SNP)主要是指在基因組水平上由單個核苷酸的變異所引起的DNA序列多態性,其在基因組廣泛分布,數量極其豐富,是挖掘重要經濟性狀遺傳基礎的遺傳標記。轉錄組是在特定時期、特定組織中的基因表達情況,其基因種類可能隨時空改變發生變化?;谵D錄組數據進行SNP的分析是一種高效篩選轉錄區域DNA變異位點的方法[1,2]。因此,本研究基于產蛋數存在顯著差異的巖鴿卵巢RNAseq數據挖掘巖鴿產蛋數相關基因及其變異位點,為巖鴿產蛋能力、繁殖能力的提升提供理論依據。
1 數據與方法
1.1 試驗數據
從NCBI SRA數據庫下載6只巖鴿(Columba livia)卵巢RNAseq數據[3],其中3只巖鴿年產蛋數平均為(38.67±3.40)枚(SRR13218846、SRR13218847、SRR13218848),3只巖鴿年產蛋數平均為(10.00±1.63)枚(SRR13218849、SRR13218850、SRR13218851)。
1.2 SNP檢測方法
利用FastQC軟件對下載的數據進行質控,獲得高質量序列(Clean reads),利用STAR(Spliced transcripts alignment to a reference)對高質量序列與參考基因組(GCA_001887795.1)進行比對,去除重復序列后利用GATK(Genome analysis tool kit)進行SNP篩選,利用VCFtools進行SNP質控后注釋、進化樹分析和Fst計算。
2 結果與分析
2.1 SNP統計
利用 Samtools 將經過排序、去PCR 重復后的文件同參考序列進行比對,6個樣本共有的SNP為340 975個。根據變異的統計結果,對高產蛋數和低產蛋數個體的SNP突變每種變異類型分布進行統計(圖1),結果表明,6種單核苷酸變異中,C>T和G>A變異次數較多。
高產蛋組共有SNP數為298 957個,低產蛋組共有SNP數為296 137個,高低產蛋組共有SNP數為254 118個(圖2)。通過高產蛋組、低產蛋組共有SNP構建的聚類樹(圖3a)可以看出,高產蛋個體和低產蛋個體分別聚類,共有SNP的主成分分析結果(圖3b)表明第一主成分可以明確區分高產蛋和低產蛋個體。因此,選取的254 118個SNP可用于巖鴿產蛋數差異的遺傳變異篩選。
2.2 SNP所在基因的注釋
利用KOBAS(http://kobas.cbi.pku.edu.cn/)對SNP所在基因進行KEGG富集分析,發現共有5 854個基因注釋到152個通路上。統計發現 SNP所在基因顯著富集在孕酮調節的卵母細胞成熟、卵母細胞減數分裂和代謝等信號通路(圖4和表1)。
2.3 兩個群體特異SNP位點基因的生物信息分析
對高產蛋組和低產蛋組基因型進行分析,共有102個位點Fst值等于1,其中89個位于基因間隔區,2個位于內含子區,5個位于外顯子區,6個位于3′UTR區。高產蛋組和低產蛋組的102個特異SNP分布在14個注釋基因上(LOC110357454、KDM5A、PIGS、BNC2、GBF1、SLAIN2、FGD4、DIAPH2、KIF3B、NFIB、EPG5、OSTF1、EMB、ST3GAL3),可作為影響巖鴿產蛋數的候選基因(表2)。KEGG注釋結果發現,半乳糖苷α-2,3-唾液酸轉移酶3(ST3GAL3)主要參與其他類型O-糖苷生物合成,磷脂酰肌醇聚糖錨生物合成s類(PIGS)主要參與GPI錨定的生物合成(表3),推測這2個信號通路與巖鴿產蛋數相關。
3 討論
利用轉錄組數據進行SNP分析,有利于快速篩選出外顯子和非翻譯區存在的變異位點,通過對巖鴿卵巢轉錄組數據進行SNP分析,發現在高產蛋組和低產蛋組存在多個變異位點,確定了群體特異SNP分布在14個基因上,半乳糖苷α-2,3-唾液酸轉移酶3(ST3GAL3)主要參與其他類型O-糖苷生物合成,磷脂酰肌醇聚糖錨生物合成s類(PIGS)主要參與GPI錨定的生物合成,推測這2個信號通路與巖鴿產蛋數相關。
鴿屬于晚成鳥,與雞、鴨等其他家禽區別較大,每窩只能產2枚蛋,2窩間需要間隔10~20 d,年產蛋量較低。因此提高鴿繁殖能力,縮短產蛋間隔,可加快鴿產業發展[4]。不同品種鴿的繁殖能力存在差異,但同一品種同一鴿舍內產蛋數也存在明顯差異,為研究鴿產蛋數差異的遺傳基礎,?對高、低產蛋組巖鴿卵巢轉錄組數據進行分析,鑒定出34 346個mRNA和24 601個lncRNA,其中811個mRNA和148個lncRNA(??P??<0.05)為顯著差異表達[3],本研究利用該轉錄組數據進行SNP分析,篩選出高產蛋組和低產蛋組存在多個變異位點以及群體差異位點,為鴿產蛋數的分子育種提供依據。
通過對高產蛋組和低產蛋組SNP篩選發現高產蛋組和低產蛋組的102個特異SNP分布在14個注釋基因上。OSTF1基因為破骨細胞刺激因子1,該基因的敲除能夠增加小鼠小梁骨量[5]。?FGD4是一種F-肌動蛋白結合蛋白,具有GTP/GDP交換活性,對CDC42具有特異性,參與肌動蛋白細胞骨架的重組[6]。研究發現肌動蛋白解聚或聚合在卵泡發育過程中發揮重要作用[7,8]。??EPG5是一種Rab7效應子,自噬體與晚期內體/溶酶體的融合特異性與EPG5活性喪失導致自噬體與各種內吞囊泡的異常融合[9],自噬體通過自噬作用循環細胞內源物,自噬參與原發性卵泡發育和閉鎖的調節[10]。EMB(ZOV3)基因?編碼跨膜糖蛋白,是免疫球蛋白超家族的成員,可以通過介導細胞和細胞外基質之間的相互作用來參與細胞生長和發育,主要?在雞卵巢卵泡的類固醇生成細胞和胚胎性腺中表達[11],也是鴿高、低產蛋數個體卵巢差異表達基因[3],可作為鴿產蛋數差異的候選基因。SLAIN2連接微管和末端跟蹤蛋白并控制有絲分裂間期微管生長[12]。驅動蛋白??超家族??蛋白??(KIFs)????是??沿??微管??運輸??膜狀??細胞器??和??大分子??的蛋白,KIF3A和KIF3B作用于甲殼類動物的精子發生過程[13],鳥嘌呤核苷酸因子1(GBF1)通過在順式高爾基體和內質網之間的循環來調節囊泡運輸和內質網到高爾基體的轉運,而在鴿的1個產蛋周期內,血清氨基酸水平升高為蛋白形成提供物質基礎,蛋白合成和轉運相關基因表達水平發生顯著變化[14,15],內質網到高爾基體的轉運是蛋白分泌途徑中的第一步,推測蛋白轉運相關蛋白可能在蛋形成過程中起重要調控作用。
高產蛋組和低產蛋組102個特異SNP所在的13個注釋基因主要富集在糖胺聚糖生物合成/糖苷鍵合成和糖基磷脂酰肌醇(Glycosyl phosphatidyl inositol,GPI)錨定蛋白質的生物合成。蛋白質糖基化(N-和O-聚糖或糖胺聚糖)主要開始于內質網,并在高爾基小室100多個糖基轉移酶的作用下完成。高爾基聚糖在動物卵子發生中發揮重要作用[16]。缺乏O-聚糖的卵母細胞通過增加卵泡FSH敏感性、減少凋亡和修改GDF9、BMP15表達來改變卵泡發育和提高生育能力[17]。DPAGT1介導的蛋白質??N??-糖基化對于小鼠卵母細胞和卵泡發育不可或缺?[18]。ST3β半乳糖苷α-2,3-唾液酸轉移酶3(ST3GAL3)基因編碼的蛋白質是一種II型膜蛋白,可催化唾液酸從CMP-唾液酸轉移到含半乳糖的底物,存在于高爾基體中,是糖基轉移酶家族29的成員,可以將靶蛋白α-2,3-唾液酸化[19],推測其在卵泡發育過程中發揮重要調節作用。卵泡液總唾液酸水平與生發泡卵母細胞和中期I卵母細胞呈正相關[20]。糖基磷脂酰肌醇錨定蛋白的生物合成是一種廣泛存在于所有真核生物中的蛋白質翻譯后修飾類型,GPI錨定蛋白主要參與細胞與細胞、細胞與環境的作用,在精子發生、發育、精子獲能等方面具有重要作用[21]。?卵母細胞特異性敲除GPI錨定蛋白的雌性小鼠表現出不孕癥?[22]。 PIGS是催化GPI錨定蛋白生物合成途徑中的關鍵酶S亞基,推測其在卵母細胞發育過程中發揮重要作用。因此,ST3GAL3和PIGS可能在鴿卵泡發育和成熟中發揮重要作用,但其功能需要進行深入研究。
4 小結
利用高、低產蛋數巖鴿的卵巢轉錄組數據篩選巖鴿產蛋數相關SNP,發現在2個群體中共有的SNP為340 975個,C>T和G>A變異次數較多。高產蛋組和低產蛋組的102個特異SNP分布在14個注釋基因上(LOC110357454、KDM5A、PIGS、BNC2、GBF1、SLAIN2、FGD4、DIAPH2、KIF3B、NFIB、EPG5、OSTF1、EMB、ST3GAL3),且富集的信號通路可能與其產蛋能力密切相關。
參考文獻:
[1] JEHL F, DEGALEZ F, BERNARD M, et al. RNA-Seq data for reliable SNP detection and genotype calling: Interest for coding variant characterization and cis-regulation analysis by allele-specific expression in livestock species[J]. Frontiers in genetics, 2021, 12: 655707.
[2] ZHAO Y,WANG K,WANG W L,et al. A high-throughput SNP discovery strategy for RNA-seq data[J]. BMC genomics,2019,20(1):160.
[3] MAO H G, XU X L, CAO H Y, et al. Comparative transcriptome profiling of mRNA and lncRNA of ovaries in high and low ggg production performance in domestic pigeons (Columba livia)[J]. Frontiers in genetics, 2021, 12: 571325.
[4] 徐小欽, 董麗艷, 陶爭榮, 等. 白羽王鴿與泰平王鴿種鴿繁殖性能比較[J]. 養禽與禽病防治, 2017(4): 4-5.
[5] VERMEREN M, LYRAKI R, WANI S, et al. Osteoclast stimulation factor 1 (Ostf1) KNOCKOUT increases trabecular bone mass in mice[J]. Mammalian genome, 2017, 28(11-12): 498-514.
[6] BOSSAN A, OTTMAN R, ANDL T, et al. Expression of FGD4 positively correlates with the aggressive phenotype of prostate cancer[J]. BMC cancer, 2018, 18(1): 1257.
[7] 王清泉. 肌動蛋白解聚因子在小鼠卵泡的發育過程中的表達與調節[D]. 哈爾濱: 東北農業大學,2009.
[8] CHENG Y, FENG Y, JANSSON L, et al. Actin polymerization-enhancing drugs promote ovarian follicle growth mediated by the Hippo signaling effector YAP[J]. Official publication of the federation of American societies for experimental biology,2015,29(6): 2423-2430.
[9] WANG Z, MIAO G Y, XUE X, et al. The Vici syndrome protein EPG5 Is a Rab7 effector that determines the fusion specificity of autophagosomes with late endosomes/lysosomes[J]. Molecular cell, 2016, 63(5): 781-795.
[10] ZHOU J W, PENG X W, MEI S Q. Autophagy in ovarian follicular development and atresia[J]. International journal of biological sciences, 2019, 15(4): 726-737.
[11] KUNITA R,NAKABAYASHI O,KIKUCHI T, et al. Predominant expression of a Z-chromosome-linked immunoglobulin superfamily gene, ZOV3, in steroidogenic cells of ovarian follicles and in embryonic gonads of chickens[J]. Differentiation, 1997, 62(2): 63-70.
[12] VAART B, MANATSCHAL C, GRIGORIEV I, et al. SLAIN2 links microtubule plus end-tracking proteins and controls microtubule growth in interphase[J]. The journal of cell biology, 2011, 193(6): 1083-1099.
[13] LU Y,WANG Q,WANG D H, et al. Functional analysis of KIF3A and KIF3B during spermiogenesis of Chinese mitten crab Eriocheir sinensis[J]. PLoS one, 2014, 9(5): e97645.
[14] AKINTAYO A, STANLEY P. Roles for golgi glycans in oogenesis and spermatogenesis[J]. Frontiers in cell and developmental biology, 2019, 7: 98.
[15] REN Y, LI X T, HAN G F, et al. Dynamic variations in serum amino acid and the related gene expression in liver, ovary, and oviduct of pigeon during one egg-laying cycle[J]. Poultry science, 2021, 100(7): 101184.
[16] LU L Z, XU X Q, DU X, et al. Transcriptome analyses to reveal the dynamic change mechanism of pigeon magnum during one egg-laying cycle[J]. Molecular reproduction and development, 2020, 87(11): 1141-1151.
[17] GRASA P, PLOUTARCHOU P, WILLIAMS S A. Oocytes lacking O-glycans alter follicle development and increase fertility by increasing follicle FSH sensitivity, decreasing apoptosis, and modifying GDF9:BMP15 expression[J]. Official publication of the federation of American societies for experimental biology, 2015,? ? ?29(2): 525-539.
[18] LI H, YOU L J TIAN Y F, et al. DPAGT1-Mediated protein N-glycosylation is indispensable for oocyte and follicle development in mice[J]. Advanced science, 2020, 7(14): 2000531.
[19] QI F,ISAJI T,DUAN C,et al. ST3GAL3, ST3GAL4, and ST3GAL6 differ in their regulation of biological functions via the specificities for the α2,3-sialylation of target proteins[J]. Official publication of the federation of American societies for experimental biology, 2020, 34(1): 881-897.
[20] CETIN B A, OCAL P, IREZ T, et al. The association between follicular fluid sialic acid levels, oocyte quality, and pregnancy rates[J]. Reproductive sciences, 2022, 29(2): 633-638.
[21] WATANABE H, KONDOH G. Mouse sperm undergo GPI-anchored protein release associated with lipid raft reorganization and acrosome reaction to acquire fertility[J]. Journal of cell science, 2011, 124(15): 2573-2581.
[22] ALFIERI J A, MARTIN A D, TAKEDA J, et al. Infertility in female mice with an oocyte-specific knockout of GPI-anchored proteins[J]. Journal of cell science, 2003, 116(11): 2149-2155.