楊 怡,段麗君,張紅麗,周前進(jìn),陳學(xué)秋,杜愛芳*
(1.浙江大學(xué) 動物科學(xué)學(xué)院 浙江省動物預(yù)防醫(yī)學(xué)重點(diǎn)實(shí)驗(yàn)室,浙江 杭州 310058;2.寧波市海曙區(qū)畜牧獸醫(yī)技術(shù)管理服務(wù)站,浙江 寧波 315000;3.浙江省動物疫病預(yù)防控制中心,浙江 杭州 310058;4.寧波大學(xué) 海洋學(xué)院,浙江 寧波 315211)
捻轉(zhuǎn)血矛線蟲(Haemonchuscontortus)寄生于牛、羊等反芻動物真胃,引起宿主貧血、營養(yǎng)不良甚至死亡[1]。目前該病的防治主要依賴抗蟲藥物的使用,但耐藥性問題日益突出[2],迫切需要研發(fā)新型綠色環(huán)保的防控措施[3]。疫苗研發(fā)是當(dāng)前捻轉(zhuǎn)血矛線蟲病防控方法中熱門的研究方向之一。捻轉(zhuǎn)血矛線蟲微粒體氨肽酶H11是現(xiàn)階段最有效的疫苗候選抗原之一。H11天然提取物具有出色的抗蟲效果[4-5],但體外重組蛋白卻不能誘導(dǎo)有效的免疫保護(hù)[6],這可能與H11蛋白特殊的空間構(gòu)象及存在多個(gè)亞型密切相關(guān)。
研究證實(shí)H11存在多種蛋白亞型,包括H11-1、H11-2、H11-3和H11-4等[7]。本實(shí)驗(yàn)室最先分離獲得的H11(H11-3)亞型基因完整ORF為2 919 bp,編碼972個(gè)氨基酸,基因組大小為14 959 bp,擁有25個(gè)外顯子和24個(gè)內(nèi)含子[8];后續(xù)也獲得了H11-4的ORF,大小為 2 916 bp,編碼971個(gè)氨基酸[9]。研究發(fā)現(xiàn),利用昆蟲細(xì)胞與大腸桿菌表達(dá)系統(tǒng)獲得的H11(H11-3)重組蛋白免疫山羊后,產(chǎn)生的抗體能與天然H11發(fā)生交叉反應(yīng),但免疫保護(hù)力低,不能提供針對捻轉(zhuǎn)血矛線蟲感染的有效保護(hù),沒有實(shí)際應(yīng)用價(jià)值[10]。利用RNAi技術(shù)對感染性L3幼蟲進(jìn)行H11干擾處理,再感染捻轉(zhuǎn)四矛線蟲山羊糞便蟲卵量減少57%、蟲荷減少40%,這表明單一的H11亞型可能不能提供完全的免疫保護(hù)[11],但是仍有作為疫苗候選抗原的潛力。因此,本研究克隆了H11亞型基因的完整ORF及DNA序列,利用生物學(xué)信息學(xué)方法比對分析了各亞型基因的序列結(jié)構(gòu)及剪接模式,并鑒定了各亞型基因的5′側(cè)翼區(qū)及其啟動轉(zhuǎn)錄活性,以期為進(jìn)一步明確H11參與免疫保護(hù)的機(jī)制及研發(fā)高效重組疫苗奠定基礎(chǔ)。
1.1 試驗(yàn)材料蟲株、菌株及質(zhì)粒:捻轉(zhuǎn)血矛線蟲(Haemonchuscontortus)ZJ株及秀麗線蟲(Caenorhabditiselegans)N2野生株由本實(shí)驗(yàn)室傳代保存,E.coliTOP10及尿嘧啶突變體OP50菌種由本實(shí)驗(yàn)室保存;pPD95.77(帶綠色熒光蛋白GFP)與pRF4質(zhì)粒(帶roller表型)由中科院遺傳與生物發(fā)育學(xué)研究室楊崇林研究員惠贈。
主要試劑:pMD18-T Vector、pMD18-T simple Vector、DNA抽提試劑盒、LA Taq酶、限制性內(nèi)切酶、連接酶、Genome Walking Kit等均購自TaKaRa公司;瓊脂糖凝膠DNA回收試劑盒、質(zhì)粒DNA小抽試劑盒購自Axygen Scientific Inc.;TRIzol(Invitrogen)、Reverse Transcript Kit(TOYOBO)和Super Taq酶購自上海申能博彩生物科技有限公司。
1.2 H11亞型基因ORF序列擴(kuò)增用TRIzol提取捻轉(zhuǎn)血矛線蟲ZJ株總RNA,反轉(zhuǎn)錄合成cDNA作為模板,參考已公布的H11-1(AJ249941.1)、H11-2(AJ249942.2)cDNA序列設(shè)計(jì)特異性引物,選用TaKaRa LA Taq進(jìn)行PCR擴(kuò)增,產(chǎn)物經(jīng)鑒定后測序分析。PCR反應(yīng)程序:94℃預(yù)變性2 min;94℃ 45 s,t退火30 s,68℃ 1 min,共30個(gè)循環(huán);68℃延伸10 min。引物、退火溫度、延伸時(shí)間及擴(kuò)增片段見表1。
1.3 DNA序列擴(kuò)增參考本實(shí)驗(yàn)室已發(fā)現(xiàn)的H11-3基因結(jié)構(gòu)特點(diǎn)[8]及已獲得的H11-1、H11-2、H11-4[9]ORF序列,推測3個(gè)亞型與H11-3具有相似的基因結(jié)構(gòu)與外顯子大小分布。根據(jù)預(yù)測的外顯子設(shè)計(jì)特異性引物或根據(jù)已獲得的序列設(shè)計(jì)基因步移引物進(jìn)行多段連續(xù)擴(kuò)增,擴(kuò)增順序按圖1進(jìn)行。H11-1、H11-2、H11-4分別分4,7,5個(gè)片段進(jìn)行擴(kuò)增,相鄰片段之間含有部分重疊序列,經(jīng)拼接后獲得完整DNA序列。
用DNA抽提試劑盒提取捻轉(zhuǎn)血矛線蟲ZJ株的基因組DNA為模板,選用TaKaRa LA Taq進(jìn)行PCR擴(kuò)增,H11-1部分基因序列由基因步移獲得,產(chǎn)物經(jīng)鑒定后測序分析。PCR反應(yīng)程序參照1.2,基因步移參照Genome Walking Kit操作說明書進(jìn)行。引物、退火溫度、延伸時(shí)間及擴(kuò)增片段見表1。

表1 H11亞型基因ORF及DNA序列擴(kuò)增引物及相關(guān)信息
1.4 5′側(cè)翼區(qū)序列擴(kuò)增參考已獲得的H11-1、H11-2、H11-4 DNA序列,在第1個(gè)與第2個(gè)外顯子之間設(shè)計(jì)3條同向的特異性下游引物flanking-sp1/flanking-sp2/flanking-sp3,結(jié)合Genome Walking Kit中的兼并引物AP3或者AP4,利用基因步移技術(shù)擴(kuò)增H11亞型基因5′側(cè)翼區(qū)序列。引物及擴(kuò)增片段見表2。

表2 H11亞型基因5′側(cè)翼區(qū)序列擴(kuò)增及重組質(zhì)粒構(gòu)建引物
1.5 生物信息學(xué)分析將獲得的H11-1、H11-2、H11-4序列,經(jīng)NCBI和寄生性線蟲基因組學(xué)常用數(shù)據(jù)庫(http://www.nematode.net/Speicies.Summaries/Haemonchus.contortus/index.php,http://www.sanger.ac.uk/cgi-bin/blast/submitblast/h_contortus)進(jìn)行Blast分析;利用DNAStar TMHMM-2.0預(yù)測蛋白質(zhì)結(jié)構(gòu);利用NetNGlyc預(yù)測糖基化位點(diǎn);利用MEGA對H11-3及本研究中獲得的3個(gè)亞型基因進(jìn)行同源性分析;對獲得的ORF及DNA序列進(jìn)行比對分析其外顯子、內(nèi)含子等結(jié)構(gòu)以及剪接識別序列;利用TESS (http://www.cbil.upenn.edu/tess)對H11-1、H11-2、H11-4基因5′側(cè)翼區(qū)序列進(jìn)行啟動子基序分析。
1.6 5′側(cè)翼區(qū)啟動轉(zhuǎn)錄活性分析將H11-1、H11-2、H11-4基因5′側(cè)翼區(qū)序列連接至pPD95.77載體,構(gòu)建帶GFP的重組質(zhì)粒。挑取秀麗線蟲N2野生株四期幼蟲至新的NGM培養(yǎng)基中,待其發(fā)育至子宮內(nèi)含有單排蟲卵的成蟲時(shí),將重組表達(dá)質(zhì)粒與pRF4質(zhì)粒混合,使兩者終濃度均為50 mg/L,通過顯微注射導(dǎo)入蟲體性腺。挑取具有roller表型的F1代蟲體培養(yǎng)至F2代后,挑取不同時(shí)期的蟲體進(jìn)行綠色熒光觀察。

續(xù)表1
2.1 ORF序列及同源性比對分析擴(kuò)增獲得的捻轉(zhuǎn)血矛線蟲 ZJ株H11-1基因ORF長2 937 bp,編碼978個(gè)氨基酸;H11-2基因ORF長2 919 bp,編碼972個(gè)氨基酸。序列比對分析發(fā)現(xiàn)H11-1與已公布的序列(AJ249941.1)氨基酸同源性為99.4%,第27位到第49位為跨膜區(qū)域,含有5個(gè)N-糖基化位點(diǎn)NTSV、NWTV、NYTK、NATT及NSSF(圖1);H11-2與已公布的序列(AJ249942.2)氨基酸同源性為99.3%,第13位到35位為跨膜區(qū)域,含有3個(gè)N-端糖基化位點(diǎn)NLTS、NATA及NKSS(圖2)。將H11-1、H11-2與此前已獲得的H11-3及H11-4氨基酸序列進(jìn)行比對分析(圖3),發(fā)現(xiàn)H11的4個(gè)亞型均屬于Ⅱ型整合膜蛋白,含有1個(gè)跨膜區(qū)、1個(gè)短鏈N-端胞內(nèi)尾及1個(gè)長鏈胞外區(qū),胞外區(qū)存在氨肽酶鋅指基序HEXXHXW;亞型間氨基酸序列高度同源,具有相似的胞內(nèi)區(qū)、跨膜區(qū)以及胞外區(qū),而且相對保守,胞外區(qū)域含有糖基化位點(diǎn),某些位點(diǎn)相對保守,如H11-1、H11-3、H11-4共有保守的糖基化位點(diǎn)NWTV和NSSF。
2.2 基因結(jié)構(gòu)及剪接模式分析通過多段連續(xù)擴(kuò)增方法,分別獲得的捻轉(zhuǎn)血矛線蟲 ZJ株H11-1、H11-2、H11-4基因DNA序列大笑分別為11 698,16 479,19 804 bp(MN852856、MN852857、MN852858)。生物信息學(xué)比對分析結(jié)果顯示(圖1及表1,3),3個(gè)亞型與H11(H11-3)基因結(jié)構(gòu)相似,編碼區(qū)均包含25個(gè)外顯子和24個(gè)內(nèi)含子,外顯子與內(nèi)含子之間通過典型的GT…AG結(jié)構(gòu)進(jìn)行剪接,外顯子大小位于64~201 bp ,內(nèi)含子大小不等且同源性低。

A.H11-1;B.H11-2;C.H11-4
2.3 5′側(cè)翼區(qū)主要啟動子基序分析利用基因步移技術(shù)鑒定的H11-1、H11-2、H11-4 5′側(cè)翼區(qū)序列長度分別為4 606,3 465,2 361 bp。對H11的4個(gè)亞型基因5′側(cè)翼區(qū)進(jìn)行序列比對分析發(fā)現(xiàn),它們相互之間同源性極低,但存在數(shù)個(gè)相同的啟動子元件。進(jìn)一步分析啟動子區(qū)域的主要基序,發(fā)現(xiàn)H11-1 5′側(cè)翼區(qū)無TATA-box,擁有2個(gè)CCAAT motif、8個(gè)CAC-binding site;H11-2的5′側(cè)翼區(qū)無TATA-box,擁有1個(gè)CCAAT motif、9個(gè)CAC-binding site;H11-4的5′側(cè)翼區(qū)擁有1個(gè)TATA-box、1個(gè)CCAAT motif和4個(gè)CAC-binding site;同時(shí)3個(gè)亞型的5′側(cè)翼區(qū)擁有數(shù)個(gè)腸道特異性表達(dá)的啟動子元件,如elt-2、Cdx-1以及GTAT-4等。
2.4 5′側(cè)翼區(qū)啟動轉(zhuǎn)錄活性分析構(gòu)建H11-1、H11-2、H11-4的5′側(cè)翼區(qū)部分序列的重組表達(dá)質(zhì)粒,分別與pRF4 Marker質(zhì)粒等比混合,顯微注射入秀麗線蟲N2野生株,培養(yǎng)后觀察,發(fā)現(xiàn)均可獲得具有穩(wěn)定roller表型的轉(zhuǎn)基因蟲體。將蟲體培養(yǎng)至F2代后進(jìn)行熒光表型觀察,發(fā)現(xiàn)只有H11-4 5′側(cè)翼區(qū)成功啟動了GFP強(qiáng)表達(dá),而H11-1與H11-2基因的5′側(cè)翼區(qū)未能啟動GFP表達(dá)或者表達(dá)強(qiáng)度極弱。H11-4的5′側(cè)翼區(qū)啟動GFP在線蟲胚胎期以外的其他生命時(shí)期表達(dá),表達(dá)部位集中于腸道起始和腸道末端,中段腸道亦可見GFP表達(dá),而以腸道末端表達(dá)強(qiáng)度最高,且在不同時(shí)期蟲體內(nèi)的表達(dá)等部位以及強(qiáng)弱存在一定差異(圖2)。

圖2 H11-4基因5′側(cè)翼區(qū)啟動GFP在秀麗線蟲不同時(shí)期蟲體內(nèi)的表達(dá) (標(biāo)尺: 20 μm)
微粒體氨肽酶H11天然提取物對耐藥蟲株、藥物敏感蟲株以及不同地域的蟲株均能提供免疫保護(hù)力[12-13],具有較好的疫苗研發(fā)前景。近年來,H11的研究主要集中在分子疫苗研制方面[14-15],但單一亞型的重組蛋白并不能提供有效的保護(hù)力。
本研究鑒定了H11已知亞型基因的ORF、DNA及5′側(cè)翼區(qū)序列。ORF序列分析顯示H11-1、 H11-2與已公布的序列存在個(gè)別堿基或氨基酸突變,推測可能是由不同地域蟲株差異所造成。H11氨基酸序列分析結(jié)果表明4個(gè)亞型高度同源,且具有相對保守的跨膜區(qū)、糖基化位點(diǎn)等。H11是一種糖蛋白復(fù)合物,糖基化修飾有其獨(dú)特結(jié)構(gòu),其具有高度巖藻糖化的低聚糖核心結(jié)構(gòu),在參與免疫保護(hù)中可能起著重要作用[16],H11天然提取物能提供有效保護(hù)力,而單一形式的重組蛋白不能獲得同等水平的保護(hù)力,推測與其不能完成糖基化修飾和正確空間折疊相關(guān)。同時(shí),H11含有多種亞型,免疫效果可能還與天然提取物中某種亞型或某些亞型組合在免疫保護(hù)中起關(guān)鍵作用有著密切關(guān)系。DNA序列分析顯示H11-1、H11-2、H11-4基因結(jié)構(gòu)及剪接模式與較早鑒定的H11 (H11-3)基因非常相似[8],具有真核生物外顯子與內(nèi)含子交替連接的基本基因結(jié)構(gòu)特征,但與H11在秀麗線蟲中類似物的基因結(jié)構(gòu)特征具有較大差異。真核生物中普遍存在基因選擇性剪接[17],在秀麗線蟲[18]和捻轉(zhuǎn)血矛線蟲中也存在[19]。通過比較已獲得的H11 4個(gè)亞型基因相應(yīng)位置的外顯子,發(fā)現(xiàn)他們的大小和分布規(guī)律基本一致,但對應(yīng)內(nèi)含子大小差異甚大,說明4個(gè)亞型均由獨(dú)立的基因進(jìn)行編碼,相互之間不存在選擇性剪接的方式。本實(shí)驗(yàn)室前期擴(kuò)增H11-3的5′側(cè)翼區(qū)啟動子區(qū)域時(shí),獲得了H11-4基因的最后一個(gè)外顯子和3′UTR序列,表明H11 (H11-3)與H11-4在染色體上是連鎖的,且具有相同的延伸方向[8]。而本研究鑒定的H11-1、H11-2、H11-4基因5′側(cè)翼區(qū)序列與H11-3以及此前獲得的H11-4部分序列進(jìn)行比對,未發(fā)現(xiàn)相似于H11-3與H11-4之間的基因連鎖現(xiàn)象[8],推測可能是由于本次獲得的亞型基因分別位于不同的染色體上,且H11亞型并不是由同一基因進(jìn)行選擇性剪接產(chǎn)生。
基因的非編碼序列在生物間保守性較低,但啟動子卻存在一些共同的轉(zhuǎn)錄因子結(jié)合基序,如TATA-box、GC-box、CCAAT motif、CAC結(jié)合位點(diǎn)等[20],以維持基因完成基本的轉(zhuǎn)錄;同時(shí)在特定位置表達(dá)的基因的啟動子間可能存在特殊的結(jié)合基序。分析發(fā)現(xiàn)已獲得的H11 4個(gè)亞型5′側(cè)翼區(qū)同源性較低,但是存在一些共同的基序,如真核生物的啟動子元件CCAAT motif以及CAC結(jié)合位點(diǎn)等,同時(shí)還包含數(shù)個(gè)腸道特異性表達(dá)基因的啟動子元件,如elt-2[21]、GATA-4[22]和Cdx-1[23]等,在一定程度上反映出H11各亞型在捻轉(zhuǎn)血矛線蟲體內(nèi)可能的表達(dá)分布特征。本實(shí)驗(yàn)室前期以秀麗線蟲為模式,建立了表達(dá)捻轉(zhuǎn)血矛線蟲疫苗候選抗原的轉(zhuǎn)基因技術(shù)體系,并以此分析了H11(H11-3)5′側(cè)翼區(qū)的啟動子轉(zhuǎn)錄活性,顯示該基因5′側(cè)翼區(qū)能啟動H11-3在秀麗線蟲表達(dá),但表達(dá)模式不完全相同,也不能實(shí)現(xiàn)正確的剪接[6,8,24]。本研究利用該體系驗(yàn)證了H11-1、H11-2、H11-4的5′側(cè)翼區(qū)的啟動轉(zhuǎn)錄活性,發(fā)現(xiàn)只有H11-4的5′側(cè)翼區(qū)具有明顯的轉(zhuǎn)錄活性,能夠啟動GFP在秀麗線蟲除胚胎外的各個(gè)時(shí)期表達(dá),表達(dá)部位集中在腸道。但這與H11各亞型僅在捻轉(zhuǎn)血矛線蟲四期幼蟲與成蟲時(shí)期的腸微絨毛表面表達(dá)的模式不一致[7,25],可能是由于克隆的H11-4的5′側(cè)翼區(qū)序列不含有調(diào)控基因表達(dá)時(shí)效性的相關(guān)基序,也可能是存在該基序但秀麗線蟲體內(nèi)腸道缺少相類似的轉(zhuǎn)錄因子與之結(jié)合。H11-4的5′側(cè)翼區(qū)的轉(zhuǎn)錄活性與H11-3在同一時(shí)期表達(dá)特異性方面具有一定的相似性,但在表達(dá)的組織分布方面又不盡相同[8],表明H11亞型基因的啟動子可能存在各自特有的啟動子元件。TESS分析結(jié)果顯示H11-1、H11-2的5′側(cè)翼區(qū)啟動子主要基序與H11-4存在相似的啟動子元件,但前兩者未能啟動GFP表達(dá),原因可能是轉(zhuǎn)錄活性較弱,克隆的該段序列未包含增強(qiáng)子相關(guān)基序,或者含有的增強(qiáng)子基序不能夠被秀麗線蟲識別導(dǎo)致GFP表達(dá)較弱難以觀察。
本研究探討了H11各亞型基因的序列結(jié)構(gòu)及啟動子活性,為后續(xù)進(jìn)一步探索其生物學(xué)功能及研制高效重組疫苗提供了新材料。