陳朗,彭喬烽,劉云紅,鄭天宇,朱喬峰,劉麗霞
(西北民族大學生命科學與工程學院,蘭州 730030)
主要組織相容性復合體(Major histocompability complex, MHC)是由一組緊密連鎖、高度多態的基因座組成的基因群,由Ⅰ類、Ⅱ類和Ⅲ類基因組成。Ⅱ類基因含 DQ、DO、DR 等亞區,其產物參與抗原遞呈和T細胞激活。牛MHC簡稱BOLA[1],根據遺傳分型比較,BOLA II類基因被分成單獨的區域Ⅱ類a區和Ⅱ類b區,相隔約三分之一染色體長度,這是牛和其他反芻動物MHC基因最顯著的特征[2]。Ⅱ類a區包括功能性MHC Ⅱ類基因DR和DQ。牛有1個DRA基因座、3個DRB基因座、5個DQA基因座和5個DQB基因座,它們是由于基因復制而產生的,每個單倍型表達1個DR基因對(DRA和DRB)和1或2個DQ基因對[3,4]。在這些基因中,DRB3和DQA基因表現出高度多態性[5,6]。
近年來,有學者對牛DQA2基因多態性與生產和疾病的相關性做了大量研究。孫菲菲[7]研究認為DQA2外顯子2中的等位基因A對渤海黑牛的生產性狀起關鍵作用。Gelasakis[8]發現Chios奶牛的DQA2等位基因1101的單拷貝和基因型0301/0301與足癬的易感性相關。張通明[9]通過對各組表達譜差異分析,檢出BOLA-DQA2與牛結核病感染的信號通路相關。Kosciuczuk等[10]對感染凝固酶陽性葡萄球菌的奶牛進行研究,結果發現BOLA-DQA2基因多態性與乳腺炎抗性相關聯。這些研究說明DQA2基因可作為牛疾病抗性和易感性研究的候選標記基因。
為此,本研究通過測定荷斯坦牛DQA2基因序列再拼接得到CDS區(Coding sequence)序列,利用生物信息學方法,對荷斯坦牛DQA2基因CDS區序列編碼的蛋白質的理化性質、疏水性/親水性、N-糖基化位點、信號肽預測和蛋白質跨膜結構、二級結構和三級結構等進行分析,旨在為荷斯坦牛DQA2基因結構與功能研究提供參考。
從寧夏農墾賀蘭山奶業有限公司牛群中采集中國荷斯坦牛尾靜脈血,每頭采集10mL,低溫保存,帶回實驗室后-20℃冷凍保存。采用傳統的酚-氯仿抽提法提取血液基因組DNA,提取的DNA用0.8%瓊脂糖凝膠電泳檢測。
根據GenBank數據庫中牛的DQA2基因序列(登錄號:XM_024983852.1),利用NCBI在線軟件Primer-BLAST設計BoLA-DQA基因4對引物(表1),引物由蘇州金唯智生物科技有限公司合成。

表1 BoLA-DQA2基因引物信息表
隨機選取300個荷斯坦牛DNA樣品,每50個樣品構建一個DNA混合池,以混合池DNA為模板進行擴增。擴增體系為:PCR反應總體積20μL,其中混合DNA1μL,2×Power Taq PCR MasterMix (百泰克)11μL,上下游引物(10μmol/L)各0.4μL,滅菌超純水補至20μL。擴增條件為:94℃預變性5min;94℃變性30s,退火(退火溫度見表1)30s,72℃延伸30s,進行30個循環;最后72℃延伸10min;4℃保存。擴增產物利用1%瓊脂糖凝膠電泳進行檢測。

表2 BOLA-DQA2基因生物信息學分析方法
選取擴增效果良好的DQA2基因4個外顯子PCR擴增產物進行雙向測序,用MEGA6.0和Editseq軟件比對和拼接獲得DQA基因CDS區序列。對BOLA-DQA基因CDS區進行分析用到的方法及工具見表2。
由圖1可以看出,PCR擴增產物電泳條帶特異性良好,條帶清晰,DQA基因4個外顯子片段大小均與預期擴增片段相符。

圖1 荷斯坦牛DQA2基因PCR擴增產物檢測結果
蛋白質的基本性質包括相對分子質量、氨基酸組成和等電點等,利用Expasy服務器上的protparam程序預測結果見表3。荷斯坦牛DQA2基因編碼254個氨基酸,20種氨基酸所占比例見圖2。可以看出,亮氨酸( Leu)最多,占整個氨基酸組成的10.2%,半胱氨酸( Cys)最少,占1.2%。基因編碼產物不穩定指數大于40,表明該基因編碼產物不穩定[11]。

表3 荷斯坦牛 DQA2基因編碼蛋白質理化特性

圖2 荷斯坦牛DQA2基因編碼蛋白質氨基酸組成
運用Expasy服務器上的Protscale程序預測荷斯坦牛DQA基因編碼蛋白質的疏水性,結果(圖3)顯示,該蛋白質第235位蘇氨酸(Thr)疏水性最強(+3.122),第51位的谷氨酸(Glu)和第52位的苯丙氨酸(Phe)親水性最強(-1.900)。整個編碼產物中,親水氨基酸占55.28%,疏水氨基酸占45.72%,平均分值為-0.021,表現為親水性,由此可推斷荷斯坦牛DQA2基因編碼的蛋白質是一種可溶性蛋白質。

圖3 荷斯坦牛DQA2基因編碼蛋白質的疏水/親水性預測
蛋白質糖基化是指在蛋白質合成的同時或合成后,在酶的催化下寡糖鏈被連接在特定的糖基化位點,形成糖蛋白。利用CBS在線分析軟件Net NGlyc 1.0預測得到,荷斯坦牛DQA2基因編碼蛋白質具有4個潛在的N-糖基化位點,分別為 Asn31、Asn96、Asn260、Asn369(圖4)。

圖4 荷斯坦牛 DQA2基因編碼蛋白質 N-糖基化位點預測
信號肽位于蛋白質N端,一般由16~26個氨基酸殘基組成[12]。信號肽分析結果(圖5) 顯示,DQA2基因編碼蛋白質的分值曲線較為典型,其中C值和Y值趨向于+1,S值在剪切位點之前較高而在剪切位點之后變低。荷斯坦牛DQA基因在第1~23位氨基酸之間存在信號肽,其切割點位于23~24位的氨基酸之間(信號肽剪切點主要根據Y最大值大于0.5來判斷)。

圖5 荷斯坦牛DQA2基因編碼蛋白質信號肽分析
利用TMHMM程序分析其跨膜結構域,從結果(圖6)可以看出,DQA2編碼的蛋白質共存在1個典型的跨膜螺旋區,氨基酸序號為217-239。由此可推測,荷斯坦牛DQA2基因CDS區所編碼的蛋白質為跨膜蛋白。

圖6 荷斯坦牛DQA2基因編碼蛋白質的跨膜區域預測結果
蛋白質的二級結構是指多肽鏈主鏈折疊產生的由主鏈內和主鏈間周期性氫鍵維系的有規則構象,這些構象借助各種次級鍵共同構成其三級結構。荷斯坦牛DQA基因編碼蛋白質二級結構預測結果(圖7) 顯示,二級結構組分中α-螺旋(Hh)占9.84%,β-折疊(Ee)占33.07%,無規則卷曲( Cc)占57.09%。其中Hh<45%,Ee>20%,因此判斷荷斯坦牛DQA基因編碼蛋白質二級結構為混合型[13]。其三級結構見圖8,顯示該蛋白質存在較多的無規則卷曲,結構較為復雜,同時也表明DQA2編碼的蛋白質由α-螺旋、β-折疊和無規則卷曲組成,與二級結構預測結果一致。

圖7 荷斯坦牛 DQA 基因編碼蛋白質二級結構預測

圖8 荷斯坦牛DQA2基因編碼蛋白質三級結構預測
生物的性狀由基因控制,卻通過蛋白質直接表現。研究發現,DQA2基因參與外源性抗原的呈遞,與免疫功能相關[14],故DQA2成為與動物免疫機能密切相關的功能候選基因。侯欽雷[15]指出BOLA-DQA2-SV1在對奶牛乳腺炎抗性方面有重要作用。邢鳳等[16]發現魯波山羊GOLA-DQA2基因外顯子2與血液免疫指標之間有一定的相關性。李靈[17]發現林麝Mobe-DQA2*03與化膿性疾病的抗性顯著相關,Mobe-DQA2*05和Mobe-DQA2*06與化膿性疾病的易感性呈顯著相關。Chang等[18]發現HLA-DQA2位點與臺灣男性漢族人群的持續性HBV感染有關。
對DQA2基因CDS區編碼蛋白質的理化性質和高級結構的預測和分析對了解蛋白結構與功能之間的相關性有重要意義。本研究采用DNA混合池擴增后直接測序的方法在荷斯坦牛DQA2基因CDS區檢測到6個核苷酸突變位點。荷斯坦牛DQA2蛋白理論等電點為4.78,由此可判斷荷斯坦牛DQA2蛋白是酸性蛋白質。研究表明蛋白質不穩定指數大于40為不穩定蛋白,反之則為穩定蛋白[19],荷斯坦牛DQA2蛋白不穩定指數為42.50,屬于不穩定蛋白。依據平均親疏水性分值(-0.021)可判定荷斯坦牛DQA2蛋白是可溶性蛋白。蛋白質的穩定性取決于蛋白質半衰期的長短,荷斯坦牛DQA2基因編碼的蛋白質半衰期為30h,但DQA2蛋白仍屬于不穩定蛋白,這可能是不同基因調控所導致的結果。蛋白質糖基化是真核生物蛋白質翻譯后加工的重要修飾之一,蛋白質糖基化修飾對蛋白質折疊、分選及其定位有重要影響,糖鏈結構不同還將影響蛋白質的半衰期和降解[20]。而糖基化位點發生變化可能與疾病的發生有關[21]。荷斯坦牛DQA2基因潛在的糖基化位點有可能與其乳房炎的發生密切相關。荷斯坦牛DQA2基因編碼蛋白質具有4個潛在的N-糖基化位點,分別為 Asn31、Asn96、Asn260、Asn369。DQA2可能是有胞內區(240aa-254aa)、跨膜區(217aa-239aa)、胞外區(1aa-216aa)三部分組成的跨膜蛋白,它可能作為膜受體起作用,也可能是定位在膜上的錨定蛋白質或離子通道蛋白質。
本研究通過生物信息學和基因組學得出荷斯坦牛DQA2基因的功能和結構,可以為今后更好地研究荷斯坦牛的抗病育種提供重要的理論依據。