賈 燕,曹金山,魏戰勇
(1.內蒙古農業大學獸醫學院,內蒙古 呼和浩特 010018;2.河南農業大學動物醫學院,河南 鄭州 450046)
氨基肽酶N(aminopeptidase N,APN)是一種大小為150 kDa 且高度糖基化的膜結合Ⅱ型鋅金屬跨膜蛋白酶,主要分布在腸道上皮絨毛細胞中。APN 生理功能為消化肽鏈, 使多肽在小腸中消化, 并與細胞運動及多種冠狀病毒的黏附作用有關[1-2]。 豬氨基肽酶N(porcine aminopeptidase N,pAPN)由963 個氨基酸編碼,在多種上皮細胞和組織中分布, 尤其在小腸刷狀緣高效表達[3-4]。pAPN 在胰蛋白酶的作用下可分解為2 個亞基,分別是95 kDa 的N 端和50 kDa 的C 端[2]。 有研究表明pAPN 可能是多種豬腸道冠狀病毒在感染宿主時的侵入受體。 豬傳染性胃腸炎病毒(transmissible gastroenteritis virus,TGEV) 是最先被鑒定出以pAPN 作為關鍵性受體的豬腸道冠狀病毒,并以Ser-506 至Ile-728 位氨基酸與pAPN 的第717~813 位氨基酸在感染過程中進行特異性結合[5-6]。 豬流行性腹瀉病毒(porcine epidemic diarrhea virus,PEDV) 與TGEV 同屬α-冠狀病毒屬,有學者證明pAPN 與PEDV S1 的C 末端可以相互作用, 也有較多研究顯示pAPN 與PEDV 沒有直接關系[7-9]。 豬德爾塔冠狀病毒 (porcine delta coronavirus,PDCoV) 是引起豬腸道疾病的丁型冠狀病毒,其S1 亞基結構域B 與pAPN 存在相互作用[10]。 豬腸道甲型冠狀病毒(swine enteric alphacoronavirus,SeACoV)是近年發現的豬腸道冠狀病毒, 已有研究報道豬腸道甲型冠狀病毒不以常見的其他豬腸道冠狀病毒的受體為功能性受體,但也沒有明確指出使用哪種受體侵入宿主細胞[4]。APN 在不同物種間保守性較高, 不同冠狀病毒利用APN 作為主要感染性受體或者輔助功能性受體,可能更便于跨種屬傳播。還有一些冠狀病毒可能使用APN 作為受體,也可能以多種方式感染宿主,感染機制尚不清楚。該研究利用多種生物信息學軟件對pAPN 的生物學功能及結構特征進行預測分析。 為深入研究pAPN 生物學過程及特異性功能域提供背景知識, 尋找pAPN 與相關病毒進行互作的結合位點。
通過NCBI 數據庫獲取pAPN 核苷酸數據(ID:HQ824547);從Uniprot 數據庫獲得pAPN 蛋白氨基酸序列及protein accession:ADX53333.1。
利用pAPN 蛋白序列進行以下生物學分析,利 用ProtParam(https://web.expasy.org/protparam/)分析pAPN 蛋白質理化性質; 利用ExPASy-ProtScale (https://web.expasy.org/protscale/) 分 析pAPN 蛋白質親疏水性; 利用SingalP 4.0(http://www.cbs.dtu.dk/services/SignalP-4.0/) 預 測pAPN蛋白質信號肽序列; 利用TMHMM Server v.2.0(http://www.cbs.dtu.dk/services/TMHMM/) 分 析pAPN 蛋白質跨膜區結構;通過NetNGlyc 4.0 Serve(http://www.cbs.dtu.dk/services/NetNGlyc/) 預 測pAPN 蛋白質N 型糖基化位點; 使用Predicting Antigenic Peptides (http://imed.med.ucm.es/Tools/antigenic.pl) 預測pAPN 蛋白質抗原表位; 利用SMART (http://smart.embl-heidelberg.de/) 預 測pAPN 蛋白質結構域; 利用Python molecule(Py-MOL)觀察pAPN 蛋白質空間三維結構。
將pAPN 氨基酸序列(ADX53333.1) 上傳到ProtParam 在線軟件分析框, 點擊計算參數(compute parameters)。 pAPN 蛋白可編碼963 個氨基酸, 分子量和等電點分別為108 885.20 Da 和5.09。 該蛋白質包含106 個帶負電荷的殘基和73個帶正電荷的殘基;pAPN 蛋白的不穩定系數為37.14, 脂肪族氨基酸指數為87.51, 平均疏水性為-0.236。 pAPN 蛋白理化性質分析結果見表1。

表1 pAPN 蛋白理化性質分析
通過ExPASy-ProtScale 軟件對pAPN 氨基酸序列進行親疏水性分析,分析結果依據正值代表疏水性,負值表示親水性的規律呈現。 ProtScale 查詢結果可用數值格式(numerical format)或者圖表格式(image in GIF-format)分別展現每個氨基酸的親疏水性具體數值。 如圖1 所示, 利用image in GIF-for mat 說明pAPN 的第963 位氨基酸整體親疏水性分布情況。 第17 位亮氨酸(Leu)數值最大為2.844,證明該位氨基酸疏水性最強,第39 位賴氨酸(Lys)數值最小為-2.967, 證明該位氨基酸親水性最強。由此得知,pAPN 屬于不穩定的可溶性蛋白質。
信號肽是由長度為5~30 個疏水性氨基酸組成,可引導新合成的蛋白質向分泌通路轉移,通常位于氨基酸序列的N 端。 信號肽的作用是促進蛋白分泌到胞外,主要存在于分泌蛋白、跨膜蛋白和真核生物細胞器內。在進行重組蛋白表達前,需要對氨基酸序列進行信號肽預測。 運用SingalP 4.0在線軟件預測pAPN 蛋白顯示不含有信號肽序列,在后續載體構建過程中可以加上一段信號肽,以增加分泌蛋白的表達量,見圖2。
TMHMM 是基于馬爾可夫模型并結合跨膜區疏水性、螺旋長度、電荷偏倚和膜蛋白拓撲學限制等性質預測跨膜螺旋的程序, 可對跨膜區及膜內外區進行整體預測。 TMHMM Server v.2.0 對pAPN氨基酸序列(ADX53333.1)預測結果如圖3 所示,紫色線條表示第35~963 位氨基酸在胞外的概率,紅色區域表示第12~34 位氨基酸之間可形成典型的跨膜螺旋區, 表明pAPN 蛋白主要分布于細胞膜,且可能作為病毒侵入細胞的膜受體。

圖1 pAPN 蛋白親疏水性分析

圖2 pAPN 蛋白信號肽預測結果

圖3 pAPN 蛋白跨膜區結構分析
糖基化修飾可對蛋白質功能進行調節,包括酰胺鏈連接的糖鏈(N-糖基化) 和羥基連接的糖鏈(O-糖基化)。 利用NetNGlyc 4.0 Serve/NetOGlyc 4.0 Serve 在線軟件對pAPN 進行N 型和O 型糖基化修飾位點預測。 預測結果顯示,pAPN 含有11 個O-糖基化修飾位點,分別位于第49、50、52、54、55、56、60、64、447、451、452 位氨基酸。 同時pAPN 含有12 個N-糖基化修飾位點, 分別位于第229、237、258、286、314、328、506、556、569、622、646、736位氨基酸。 打分平均值在0.5 以上(見圖4、圖5)。在線數據庫查詢和在線軟件預測結果基本一致。
蛋白質的特異性取決于抗原決定簇, 即由抗原決定簇的種類、性質、數目和空間構型決定與什么抗體或者受體進行特異性結合, 從而完成病毒的生命活動。 利用predicting antigenic peptides 在線軟件對pAPN 進行抗原決定簇預測。 結果顯示,pAPN 擁有42 個抗原決定簇(見圖6、圖7),圖7中紅色部分即為抗原表位可能出現的區域。

圖4 pAPN 蛋白糖基化位點分析

圖5 pAPN 蛋白單體糖基化位點
通過簡單模塊構架搜索工具分析,發現pAPN含有2 個典型的功能結構域, 分別是第291~539位氨基酸高度保守的功能域peptidase_M1 和第616~943 位是高度保守的結構功能域內質網氨基肽酶 (endoplasmic reticulum aminopeptidase1,ERAP1)_C(見圖8)。

圖6 pAPN 蛋白抗原表位分析

圖7 pAPN 蛋白單體抗原表位

圖8 pAPN 蛋白結構域分析

圖9 pAPN 蛋白二聚體空間結構
pAPN 胞外區以二聚體形式發揮生物學功能,每個單體都可被分為4 個功能結構域, 分別命名為Ⅰ~Ⅳ。 并通過蛋白質數據庫(protein data bank,PDB)下 載pAPN(PDB ID code 5LDS)[10-12],運 用PyMOL 顯示pAPN 二聚體的空間結構 (見圖9),并對pAPN (protein accession:ADX53333.1) 使用SWISS-MODEL 進行單體空間結構域預測, 預測結果顯示與5LDS 相似度高達99.14%。 已有研究報道了pAPN 單體空間三維結構,結構域Ⅰ為35~281 位氨基酸,由15 鏈β 桶狀折疊組成,用豆青色表示。 第282~543 位氨基酸為結構域Ⅱ,包含2 個亞結構域:N 末端亞結構域(殘基282~369)由5 鏈β折疊連接1 個α 螺旋組成;C 末端亞結構域(殘基370~543)包含7 個α 螺旋超螺旋,用粉紫色表示。結構域Ⅲ為第544~632 位氨基酸, 采用7 鏈β 夾心折疊構成,用青紫色表示。 結構域Ⅳ為第633~963 位氨基酸包含16 個α 螺旋超螺旋,用綠色表示[4,12]。 pAPN 在總體結構域排列和結構域折疊方面與其他M1 家族金屬酶非常匹配。
目前, 冠狀病毒對全球畜牧業的危害日益嚴重, 對于引起豬腸道疾病的豬腸道冠狀病毒是如何利用侵入受體的研究是目前急需解決的基礎科學問題。 研究結果中對不同豬腸道冠狀病毒的感染性受體的差異, 使得學者們對pAPN 這個經常被用來作為冠狀病毒進入宿主易感細胞的主要受體產生較多關注[13-14]。pAPN 又名CD13,是金屬蛋白酶家族中一種分子量約為150 kDa 的Ⅱ型跨膜蛋白。 Ⅰ、Ⅱ和Ⅲ型跨膜蛋白均屬于單程分子,而Ⅳ型為多程分子。 Ⅰ型通過終止轉移錨序列錨定在脂質膜上。Ⅱ型和Ⅲ型以信號錨序列錨定,Ⅱ型以其C 端結構域靶向ER 管腔, 而Ⅲ型的N 端結構域以ER 管腔為靶。 Ⅳ型又分為Ⅳ-A、Ⅳ-B 兩型, 分別以其N 端結構域靶向細胞溶質和靶向內腔。pAPN 分布于多種細胞表面尤其在腸道上皮細胞表達水平相對較高。由此推斷,該蛋白生物學功能較廣泛, 可借助其N 端的螺旋產生跨膜方式進入細胞膜。 在其膜結合形式中參與了細胞內的復雜功能,如肽裂解、免疫細胞趨化。 同時也與多種冠狀病毒的黏附與侵襲有關[1-4]。
對冠狀病毒功能性受體的研究一直是病毒學領域的熱點。 作為冠狀病毒常見受體的pAPN 經常被用來做細胞試驗,研究病毒感染機制。研究最早的冠狀病毒是TGEV, 利用抗細胞受體法證明了pAPN 是TGEV 的感染性受體[5]。與TGEV 同屬甲型冠狀病毒的PEDV 與宿主受體互作的具體位置以及關鍵受體的研究有很多, 如Li 等[15]用PEDV 感染pAPN 穩定轉染于敲除掉pAPN 的豬睪丸細胞和犬腎上皮連續細胞系(madin-daby canine kidney cells)MDCK 后, 發現pAPN 的有無對PEDV 感染這些細胞系沒有影響。 Shirato 等[16]和Cui 等[17]證明了可溶性pAPN 不能中和PEDV 對Vero 細胞的感染,其他手段得出同樣的結論。利用PDCoV 棘突蛋白S1 與內源性表達pAPN、過表達pAPN 及敲除pAPN 的細胞進行結合后再感染試驗,證明pPAN 可以介導PDCoV 感染宿主細胞[18]。同年Zhu 等[19]、Li 等[15]報道PDCoV S1 可以與pAPN 發生特異性結合的結論。 可見,繼續深入研究豬腹瀉相關病毒的致病機理為早日攻克豬腸道疾病有重要意義。 作為目前受關注度較高的冠狀病毒功能性受體pAPN,對其蛋白結構的精確解析也可為研究其功能提供幫助。
通過生物信息學軟件分析得知pAPN 屬于不穩定的親水性蛋白酶且無信號肽,但有文獻報道該蛋白含有信號肽[20]。 在第35~963 位氨基酸形成胞外蛋白,第12~34 位氨基酸形成典型的跨膜螺旋區, 表明該蛋白為細胞膜蛋白。 pAPN 擁有23 個糖基化修飾位點、42 個抗原表位。 功能結構域預測顯示pAPN 含有peptidase_M1 和ERAP1_C 兩個典型的功能結構域,以上生物學分析與 劉 穎 等[21]對pAPN 預 測 結 果 基 本 一 致。 運 用PyMOL 可視化軟件顯示pAPN 胞外域的空間三維結構其中結構域Ⅰ為35~281 位氨基酸, 由15鏈β 桶狀折疊組成,結構域Ⅱ為282~543 位氨基酸,包含N 末端和C 末端2 個亞結構域,分別以5 鏈β 折疊連接1 個α 螺旋和7 個α 螺旋超螺旋構成,第544~632 位氨基酸采用7 鏈β 夾心折疊構成結構域Ⅲ, 結構域Ⅳ為633~963 位氨基酸,包含16 個α 螺旋超螺旋[10-11]。 pAPN 在總體結構域排列和結構域折疊方面與M1 家族其他金屬酶非常相似,空間三維結構精確解析可為下一步尋找該蛋白與豬腸道冠狀病毒棘突蛋白結合的關鍵位點提供結構方面素材, 為下一步研究pAPN 功能結構域與豬腸道冠狀病毒膜蛋白相互作用提供理論依據。