王新艷 張俊玲,2,3 施志儀,2,3
(1. 上海海洋大學 農業部淡水水產種質資源重點實驗室,上海 201306;2. 上海海洋大學 水產科學國家級實驗教學示范中心,上海 201306;3. 上海海洋大學 上海水產養殖工程技術研究中心,上海 201306)
色素框同源蛋白(Chromobox homolog,CBX)是組成多梳蛋白復合體(Polycomb group complex,PcG)的主要核心蛋白[1-4],目前在哺乳動物中發現該蛋白家族包含CBX2、CBX4、CBX6、CBX7和CBX8 5個成員[5]。CBXs各蛋白雖然具有共同保守的結構域,但各個成員的分子大小、組織分布及生物學功能卻存在較大的差異。由于近年來CBX2在哺乳動物人和小鼠性發育中作用的發現,逐漸成為研究的熱點[5]。
cbx2基因最早于1992年在果蠅中被發現[6],在1997年被確認是PcG復合體的組成成分[7]。該復合體作為轉錄抑制物廣泛參與細胞周期調控、X-染色體失活、干細胞分化、衰老及腫瘤發生等重要生命過程[8-10]。在人和鼠中,cbx2基因主要在性腺中表達,尤其在精巢中的表達量較高。Katoh-Fukui等[11]發現,在小鼠中對M33(cbx2)基因缺失或進行擾亂,會產生雄鼠向雌鼠轉變的性逆轉現象;在人類中,cbx2基因的缺失則會導致46,XY性別發育障礙(Disorders of sex development,DSD)[12],最新研究發現,cbx2基因有兩個亞型cbx2.1和cbx2.2,cbx2.1即為上述的cbx2,cbx2.2如果發生突變也會喪失對性別發育相關基因表達的調節,從而導致嚴重的46,XY DSD缺陷[13]。這些研究表明cbx2可能通過調節性別發育相關基因的表達進而在哺乳動物(人和小鼠)的性發育中發揮著重要的調控作用。但迄今為止,關于cbx2在低等脊椎動物,尤其是魚類性別分化和性腺發育中的作用未見報道。
牙鲆(Paralichthys olivaceus)隸屬于鰈形目(Pleuronectiforms),是我國重要的海水養殖經濟魚類之一,雌性個體較雄性個體大且生長快[14],其性腺發育與分化的分子機制一直是近年來魚類生殖發育研究的重點。鑒于cbx2基因在哺乳動物性發育中的重要作用,本研究利用PCR克隆和生物信息學方法鑒定了牙鲆cbx2基因,并采用RT-PCR技術分析了其在牙鲆不同組織的表達,旨為進一步闡明cbx2基因在牙鲆性腺發育和分化中的功能奠定重要基礎。
牙鲆成魚購自上海市銅川路水產市場,解剖取其精巢、卵巢、腦、肝臟、肌肉、胃及鰓組織。各組織樣品經焦碳酸二乙酯處理水沖洗干凈,立即置于Trizol(Invitrogen)中勻漿,再用于總RNA提取。
1.2.1 牙鲆cbx2基因的分子克隆 通過查詢NCBI數據庫(https://www.ncbi.nlm.nih.gov/),我們獲得了來自牙鲆的cbx2cDNA(XM_020094544)序列,該cDNA序列包括完整的開放閱讀框(Open reading frame,ORF)。為保證克隆cDNA序列的準確性,設計3對基因特異性引物進行PCR擴增并測序,經拼接得到其全長cDNA并推導的氨基酸序列,見圖1。
1.2.2cbx2基因的生物信息學分析 首先通過ExPASy-ProtParam在線分析牙鲆CBX2蛋白質的理化性質與疏水性;利用SignalP 4.1預測其是否具有蛋白跨膜區和蛋白信號肽;利用SMART和swissmodel預測CBX2蛋白的二級和三級結構。
然后在NCBI中查閱各物種cbx2同源基因信息,并進行基因結構比較分析;采用BioEdit對牙鲆CBX2與其他物種進行氨基酸序列比對,并利用MEGA5.1構建其系統進化樹。其他物種同源基因的序列登錄號如下:杜氏鰤(Seriola dumerili),XP_022595013.1; 尖 吻 鱸(Lates calcarifer),XP_018518344.1; 大 黃 魚(Larimichthys crocea),XP_019117076.1;尼羅羅非魚(Oreochromis niloticus),XP_005469121.1;半滑舌鰨(Cynoglossus semilaevis),XP_008327382.1;大 西 洋 鮭(Salmo salar), 青鳉(Oryzias latipes),NP_001098386.1; 人(Homo sapiens),NP_005180.1; 斑 馬 魚(Danio rerio),NP_919354.1;小鼠(Mus musculus)NP_031649;熱帶爪蟾(Xenopus tropicalis),XP_017949680。
最后,通過 Ensembl Genome Browser(http://www.ensembl.org/index.html)確定cbx2及其相鄰基因在染色體上的定位。
1.2.3 RT-PCR檢測cbx2基因的組織表達 上述總RNA經DNase I(Promega)處理以去除基因組DNA,然后在M-MLV reverse transcriptase(Promega)作用下合成cDNA第一條鏈。使用Primer5.0設計牙鲆cbx2基因和內參基因18s的PCR引物,cbx2的上下游引物序列分別為:GTCACAGATGTCACCGCTAATC和 TCAGAACCCAAATCCCCTC,18s的 上 下 游引物序列分別為:AGTTGGTGGAGCGATTTG和CTCGGCGAAGGGTAGACA。
PCR反應在C1000 TouchTM Thermal Cycler(Bio-Rad)上進行,其反應體系為:cDNA1μL,上下游引物1 μL,Taq PCR Master Mix(上海生物工程公司)10 μL及 7 μL滅菌水。PCR擴增程序為:95℃2 min;95℃ 30 s;60℃ 30 s;72℃ 30 s;進行35個循環反應;然后72℃延伸5 min。獲得的PCR產物用于2%瓊脂糖凝膠電泳,并在凝膠成像系統上觀察、拍照,以檢測cbx2在牙鲆各組織的表達情況。
經PCR克隆和測序獲得的牙鲆cbx2cDNA序列如圖1所示,其開放閱讀框長為1 584 bp,編碼527個氨基酸。

圖1 牙鲆cbx2 cDNA及推導的氨基酸序列
脊椎動物cbx2同源基因結構比較分析發現,cbx2基因在哺乳動物人和小鼠中包含6個外顯子,其編碼區與非編碼區在整個基因的分布大致相同;而在珠雞(Numida meleagris)、熱帶爪蟾、斑馬魚、青鳉、羅非魚(Oreochromisspp.)和牙鲆中則只有5個外顯子,其中牙鲆、青鳉、尼羅羅非魚的cbx2基因的編碼區與非編碼區排列分布更為相似,均具有較小的外顯子1、2、3、4和大的外顯子5,外顯子還包含了一個較大的3’-非翻譯區(Untranslated region,UTR)。

圖2 脊椎動物cbx2基因結構的比較分析
SMART和SWISS-MODEL預測牙鲆CBX2蛋白的二級與三級結構如圖3,其二級結構中包含1個染色質結構域和4個低復雜結構域(紫色區域),該染色質結構域是真核生物蛋白質模體之一,高度保守,含30-50個氨基酸,常結合甲基化氨基酸殘基,存在于動植物細胞核內參與調節染色質結構的若干蛋白質中。三級結構分析發現,牙鲆CBX2蛋白包含13.28%的α-螺旋、11.20%的延伸鏈、3.24%的β轉角和72.11%的不規則卷曲,其中以α螺旋和無規則卷曲為主,不均勻地分布于整個蛋白質多肽鏈上。

圖3 牙鲆CBX2蛋白的二級及三級結構
經SignalP 4.1分析,CBX2蛋白無信號肽、無跨膜區域,表明該蛋白既不是分泌蛋白質也不是跨膜蛋白質。在其編碼的527個氨基酸序列中包含20種常見的氨基酸,其中Ser(S)含量最高(15.9%),其次為 Lys(K)(9.7%),而 Pyl(O)和 Sec(U)的含量為0。通過ExPASy-ProtParam分析得到其分子式為C2418H3966N752O805S8,分子量為56 578.98 K,等電點為10.03,是一種不穩定的堿性親水性蛋白。
氨基酸序列比對分析(圖4)發現,牙鲆cbx2基因cDNA 推導出的氨基酸序列與杜氏鰤的同源性最高,為89%;其次是尖吻鱸和大黃魚,其同源性分別為88%和85%;與尼羅羅非魚、半滑舌鰨和大西洋鮭的同源性分別為77%、68%和60%,與青鳉、斑馬魚的同源性僅有57%和53%;與兩棲類和哺乳動物的同源性較低,如與熱帶爪蟾的同源性為42.51%,與人類和小鼠分別為41%和40.52%。但是,CBX2蛋白的同源結構域在脊椎動物是保守的,尤其是在魚類中高度一致。
系統進化樹分析發現,牙鲆CBX2與所有魚類聚為一支(圖5)。基因同線性分析顯示了cbx2基因與相鄰基因在染色體上的相對位置,雖然在魚類中與cbx2基因相鄰的基因被定名的較少,但在哺乳類的人類、小鼠和鳥類的珠雞中,與cbx2基因鄰近的基因較為一致,均有cbx8和enpp7基因(圖6)。
RT-PCR結果(圖7)顯示,cbx2基因在成體牙鲆的各個組織中均有表達,但在不同組織的表達水平差異顯著。其中牙鲆cbx2基因在精巢中表達量最高,卵巢次之,在腦中也有較高的表達,但在肌肉、胃、鰓和肝臟中的表達則較低。
本研究通過分子克隆與生物信息學方法鑒定了牙鲆cbx2基因,基因結構、氨基酸同源性和系統進化分析表明cbx2基因在脊椎動物進化中較為保守,理化性質分析結果顯示牙鲆CBX2蛋白是一種偏堿性的親水性蛋白,編碼該蛋白的氨基酸中以絲氨酸(Sr)的含量為最高,而絲氨酸富集區是磷酸化的主要位點[15]。研究表明該絲氨酸富集區的殘基正是CBX2的磷酸化位點,且在細胞內是穩定磷酸化的[16]。從魚類到人類的進化中,絲氨酸富集區的長度有所減少,其在魚類中一般有 24 個絲氨酸殘基,而在人類中有一個延伸的 16 個絲氨酸殘基[17]。在成年小鼠的肝細胞中,CBX2 的鼠同源物 M33穿梭于細胞核與細胞質之間,在快速增殖的細胞中M33蛋白僅在細胞核中以高度磷酸化的形式存在,而在休眠細胞的細胞質中,M33則主要以去磷酸化的形式存在[8]。空間結構預測發現,牙鲆CBX2蛋白以α螺旋和無規則卷曲為主,其二級結構中含有1個染色質結構域和4個低復雜結構域。研究表明,該染色質結構域常結合甲基化氨基酸殘基,主要調控異染色質與基因表達,此外還與H3K27me3結合,H3K27me3是另一種典型的表觀遺傳基因沉默標記,常位于發育相關基因的啟動子區[18],這表明CBX2蛋白在表觀遺傳調控中發揮著重要的作用。

圖4 牙鲆CBX2和其他物種的氨基酸序比對分析

圖6 脊椎動物cbx2基因的同線分析

圖7 牙鲆cbx2基因的組織表達
性別分化與性腺發育一直是生命科學領域的研究熱點,目前關于cbx2基因在性發育中的研究主要集中在人類和小鼠中,而在低等脊椎動物包括魚類中幾乎未見報道。本研究發現,cbx2基因在牙鲆精巢的表達量最高,在卵巢和腦中也有較高的表達,而在其他組織的表達量較低。基于2014年Fagerberg等[19]的RNA測序,數據分析顯示在人類正常組織中,cbx2在精巢的表達量最高,卵巢、胎盤次之,在肺中也有一定量的表達,而在其他組織中表達量較低;同樣基于2014年Yue等[20]在小鼠中的測序,顯示cbx2在腦、四肢表達量較高,在卵巢和性腺也有較高的表達,但在其他組織表達量則較低。研究表明,cbx2基因在哺乳動物的細胞周期變化[8,21]、減數分裂、同源染色體的聯會和生殖細胞增殖分化中發揮著較為重要的作用[22]。Katoh-Fukui等[23]早在 1998年發現,在小鼠中通過對m33(cbx2)基因進行擾亂或基因缺失,會產生雄性小鼠向雌性轉變的性反轉現象,且由于m33的突變會導致雌性小鼠胚胎的生殖脊發育遲緩,性腺生長的缺陷在Y染色體特定的SRY(Sex region of Y chromosome)表達時會顯現出來,暗示m33(cbx2)缺失可能是通過干擾SRY上游的某些因子從而導致了性反轉,因而推測m33(cbx2)可能是小鼠性別決定的重要基因[11]。進一步研究發現,在m33(cbx2)基因敲除的小鼠中,m33(cbx2)是ad4bp/sf1表達的上游調控基因,能刺激靶基因同向表達;在人類中的研究表明cbx2通過激活相關的啟動子區能刺激靶基因sf1/nr5a1的表達,如果cbx2突變將失去對靶基因sf1/nr5a1的調控,從而引起性別發育異常[12]。這與先前報道的CBX2作為PcGs的組成成分,是組蛋白表觀遺傳修飾的轉錄抑制因子不同,cbx2還可作為基因轉錄的激活因子發揮作用。事實上,cbx2一方面為精巢中雄性表達的特性基因;另一方面還通過調控Foxl2和Wnt4信號通路進而抑制雌性的某些信號通路[24]。因此,cbx2基因在牙鲆精巢和卵巢中的高表達,提示了該基因在牙鲆性腺發育中可能發揮著重要的作用,而具體的功能和作用機制非常值得進一步深入的研究。
本研究通過PCR克隆和測序獲得了牙鲆cbx2基因的cDNA序列,采用多種生物信息學方法明確了其分子特性,并利用RT-PCR技術證明了其在牙鲆性腺(尤其是精巢)組織具有較高的表達,初步探討了cbx2基因在牙鲆性腺發育中的作用。