李奇潤 , 魏孝輝 , 夏 春
(中國農業大學動物醫學院 , 北京 海淀 100193)
豬經典主要組織相容性復合體(Major histocompatibility complex,MHC) I 類分子略寫為SLA-I,包含SLA-1,SLA-2和SLA-3三個基因座[1]。迄今為止,主要組織相容性復合體數據庫(IPD ; https://www.ebi.ac.uk/ipd/mhc/)共登錄了SLAI/II等位基因450條[2]。豬 SLA-I分子主要與β2m和抗原多肽形成三分子復合物(pSLA-I)遞呈抗原,誘發特異性細胞毒性T細胞(Cytotoxic T lymphocyte, CTL)免疫應答[3]。由于SLA-I α1和α2區的高變性導致了其復等位基因的多態性,使不同的等位基因能夠產生針對特定抗原肽不同錨定殘基的抗原肽結合槽[4]。
抗原遞呈細胞(Antigen presenting cell, APC)遞呈CTL表位是引發CTL免疫應答最關鍵的環節[5]。目前對豬CTL表位的研究大多集中在預測、體外能否形成pSLA-I復合體以及四聚體技術鑒定這3個層面[6-8]。常用的與豬SLA-I結合的網站有Net-MHC4.0、NetMHCpan、NetMHCstabpan等[9]。然而,由于豬等位基因的多態性,使用軟件預測的結果具有明顯的瑕疵[10-11]。質譜測定pMHC-I結合多肽的方法相對而言數據真實,降低了偏差[12],再聯合質譜從頭測序技術(MS de novo sequencing)用于MHC-I分子的體外結合抗原肽譜及基序的鑒定,由于其結果準確已被認可為測定pMHC-I CTL候補表位的方法之一[12-13]。
豬繁殖與呼吸綜合征(Porcine reproductive and respiratory syndrome, PRRS),又稱豬藍耳病,由豬繁殖與呼吸綜合征病毒(Porcine reproductive and respiratory syndrome virus,PRRSV)引起 ; PRRSV抑制細胞免疫,造成細胞免疫反應延遲并減弱[14]。目前主要通過接種疫苗誘導體液免疫應答的方式控制PRRS[15],有關PRRSV CTL候補表位與細胞性免疫應答的研究極少[16]。本文對法系大白豬和長白豬SLA-I基因進行了測序及多肽性分析; 對其代表性的pSLA-I結合隨機9肽譜進行鑒定與分析; 從中篩選出部分與PRRSV相關的CTL候補表位。
1.1 試驗材料 本試驗所使用的實驗豬為法系大白豬和長白豬。SLA-I克隆引物對的合成與測序由上海英駿生物技術有限公司完成。RNA提取試劑TRIzol、SuperScript III First-Strand Synthesis System for RT-PCR試劑盒,均購自Inventrogen公司。紅細胞裂解液、限制性內切酶、T4 DNA連接酶等,均購自寶生物工程(大連)有限公司。E.coliTrans5α、E.coliTransetta (DE3)感受態細胞,均購自北京全式金生物技術有限公司。隨機9肽(半胱氨酸除外)由北京中科亞光生物科技有限公司合成。
1.2 試驗方法
1.2.1 大白豬和長白豬SLA-I等位基因克隆 選10頭原種大白豬、長白豬前腔靜脈采血,按照TRIzol法提取外周血淋巴細胞總RNA。使用Nanodrop測定濃度及OD值,結合瓊脂糖凝膠電泳及OD260 nm/OD280 nm判斷RNA的質量。對上述RNA進行RT-PCR反應,合成cDNA鏈。
參照GenBank數據庫中豬SLA-I基因(EU170457,EU170458,EU170459)序列,采用Oligo 6.0軟件,分別設計擴增豬SLA-1、SLA-2、SLA-3等位基因座的3對特異性引物[16]。引物序列見表1。PCR擴增,產物經過凝膠電泳回收后連接至pMD-19T 載體,轉化至氨芐抗性的培養皿中,挑取單個菌落送蘇州金唯智生物科技有限公司進行測序。

表1 克隆SLA-I引物序列Table 1 Cloning of SLA-I primer sequence
1.2.2 大白豬和長白豬多態性分析 通過對克隆的等位基因進行序列分析比較,將獲得的序列上傳至NCBI的GenBank并獲得相應的序列編號。分別區分出信號肽(http://www.cbs.dtu.dk/services/SignalP/)、跨膜區以及胞內區 (http://www.cbs.dtu.dk/services/TMHMM/)。并通過在線軟件CLUSTALW (https://www.genome.jp/tools-bin/clustalw)分析SLA-I氨基酸序列的同源性,通過PVS (http://imed.med.ucm.es/PVS/) 分析構成抗原肽結合槽(PBG)的氨基酸保守與高變異位點。
1.2.3 SLA-1*1204蛋白表達 設計特定等位基因SLA-1*1204胞外區的特異性引物,如表2 所示,PCR擴增,收集目的片段連接至pET-28a 載體,連接產物轉化感受態細胞Trans5α,PCR擴增鑒定,提取陽性質粒轉入Transetta (DE3),IPTG誘導表達,提取并純化包涵體[16]。

表2 SLA-1*1204胞外區特異性引物Table 2 SLA-1*1204 extracellular region specific primers
1.2.4 隨機肽結合質譜從頭測序鑒定SLA-1*1204結合基序 隨機9肽通過固相合成法按照每位19種氨基酸等摩爾比進行合成,純化除鹽后,通過質譜從頭測序進行質檢[12]。
按照SLA-1*1204∶β2m∶隨機9肽為1∶1∶5比例進行體外共復性[400 mmol/L L-Arg HCl,2 mmol/L EDTA,5 mmol/L GSH,0.5 mmol/L GSSH和100 mmol/L Tris-HCl (pH 8)],通過分子篩層析[20 mmol/L Tris (pH 8)和50 mmol/L NaCl]以及離子交換層析[Buffer A:20 mmol/L Tris 396 (pH 8)和5 mmol/L NaCl;Buffer B:20 mmol/L Tris (pH 8) 和500 mmol/L NaCl]進行純化。濃縮換液后,通過弱酸進行洗脫,除鹽后經液相色譜-串聯質譜(LC-MS/MS)檢測,De novo sequencing解析可信的多肽序列。通過聚類分析獲得SLA-1*1204抗原肽結合槽每個口袋對氨基酸的偏好性,分析主要錨定位點和結合基序,以此為基礎對基序及氨基酸進行打分,并用來預測PRRSV來源的潛在表位肽[12]。
1.2.5 基序SLA-1*1204結合基序的PRRSV表位預測 將篩選過濾得到的9肽中限制性錨定殘基進行計算[12,17],獲得每個位置每個氨基酸的可能性,基于錨定殘基加權概率(位置概率矩陣)計算限制性基序(限制性錨定殘基的數量Nres)上的特定氨基酸和成分[18-19]。
2.1 新SLA-I多態性分析 首先將克隆、測序的等位基因進行序列分析、比較,去掉100%同源序列,最終獲得了22條新SLA-I基因(中插彩版圖1)。隨后,將克隆的SLA-I進行命名,再上傳至NCBI的GenBank,獲得了相應的基因序號,其中,SLA-1基因共7條:SLA-1*08:19(MN381837),SLA-1*08:20(MN813669),SLA-1*12:04(MT230602),SLA-1*20:01(MN813662),SLA-1*20:02(MN813660),SLA-1*20:03(MT230601),SLA-1*20:04(MT230598);SLA-2基因共13條:SLA-2*01:04(MN381838),SLA-2*01:06(MN813663),SLA-2*09:07(MN813654),SLA-2*10:10(MN381835),SLA-2*10:11(MN381835),SLA-2*10:12(MT230599),SLA-2*10:17(MN813655),SLA-2*10:18(MN813667),SLA-2*10:20(MN813668),SLA-2*10:21(MT230600),SLA-2*16:04(MN813666),SLA-2*16:05(MN813665),SLA-2*16:06(MN813664);SLA-3基因共2條:SLA-3*05:09(MN381839),SLA-3*05:10(MN381840)。
參照本實驗室已發表的SLA-I序列[21]分析發現,所克隆的22條SLA-I分子α重鏈N端具有20~30個 不等長度的氨基酸構成了信號肽,C端具有60個左右的氨基酸組成了跨膜區和胞內區;胞外區約270個氨基酸,包括α1,α2和α3 三個結構域。即22條新SLA-I序列存在明顯的長度變化(中插彩版圖1)。
基于SLA-I的結構與序列比對發現(中插彩版圖1),α1/α2/α3分別由90個氨基酸左右組成,其中,差異氨基酸主要位于α1/α2結構域中。其中,α1~α5螺旋組成抗原結合槽側壁,而β1~β2折疊組成抗原結合槽底部并起支撐側壁的功能。SLA-I能夠結合并遞呈相應的抗原,歸功于組成抗原結合槽兩端口袋的保守氨基酸(L5,Y7,Y59,Y84,Y123,K146,Y159,L160和Y171)與多肽末端形成的作用力網[21]。α3結構域相對較保守,與β2m作用維持SLA-I分子三維結構的穩定性,并與CD8αα形成穩定的作用力,從而保證T細胞的激活。α1/α2結構域中的Y7,F8,A11,V25,Y27,F33,F36,H93,L110,G112和Q115,D122,E128分別協助α3結構域與豬β2m/CD8αα相互作用(中插彩版圖1)。保守性N87,Q88,E89位可發生糖基化,C110/C164/C203/C259形成2對二硫鍵從而維持SLA-I三維構象。
通過在線軟件PVS (http://imed.med.ucm.es/PVS/)對抗原結合槽進行變異位點分析、Wu-Kabat法輸出結果如中插彩版圖2A所示。同時,槽內相對變異位點映射至三維結構(PDB:3QQ3)[20]中,如中插彩版圖2B,抗原結合槽根據錨定位點可分為A~F 口袋,每個口袋均有多個氨基酸組成,這些氨基酸的變異改變相應口袋的性質,如大小、電荷及親疏水性。第62、163、167、170位氨基酸位于A口袋上側,第9、24、66、67、99位氨基酸位于B口袋內側和上側,第73、74、77、95、97、114、116、143、147位氨基酸分布于F口袋周圍,這些氨基酸殘基的改變能夠直接影響多肽末端錨定殘基的偏好性。相對而言,D口袋雖然重要性弱于A/B/F口袋,但其變異位點99、155、156位能夠通過直接影響多肽P3位殘基的性質而影響多肽結合。而組成C口袋的第70、73、74位氨基酸和組成E口袋的第114、152位氨基酸能夠輔助影響多肽P4~P8位氨基酸的構象,從而影響TCR的識別。
2.2 SLA-1*1204的基序鑒定 隨機肽法體外復性SLA-1*1204,通過分子篩層析法(中插彩版圖3A)及離子交換層析法(中插彩版圖3B)對pSLA-1*1204復合體進行純化,SDS-PAGE進行純度鑒定(中插彩版圖3C)。酸洗法對高親和力多肽進行洗脫并通過質譜從頭測序法得到1 506條可信多肽(偽發現率FDR=1%),Weblogo(https://weblogo.berkeley.edu/logo.cgi) 結果進行展示,如中插彩版圖3D所示。SLA-1*1204的基序為T/K/L-V/A/L-X-X-X-X-X-P/L-L/Y/F,其對多肽N端和C端具有明顯的限制性,尤其是P1和P9,其次是P2和P8,相對于之前所報道的SLA-1,SLA-1*1204的P3相對缺乏限制性,而P4~P7為TCR識別的關鍵位點,其非限制性決定了遞呈表位的多樣性,從而更有效的激活更多的CD8+T淋巴細胞。正如經典MHC I,C端(P9位)為長側鏈及芳香烴氨基酸,垂直插入F口袋,具有直接影響多肽親和力的作用。P1和P2發揮N端固定多肽的作用,P8為多肽轉折點,脯氨酸的存在有助于P9位轉向插入F口袋。
2.3 基于SLA-1*1204結合基序的PRRSV表位預測 通過質譜獲得的1 506條可信9肽,在EXCEL表中依次列為9列,統計每個錨定位點中18種氨基酸(半胱氨酸、異亮氨酸除外)出現的次數及頻率。結合SLA-1*1204多肽結合基序 P1、P2、P9位各氨基酸出現頻率及病毒序列(GenBank:EF641008.1)[23],通過Python對PRRSV JXwn06毒株病毒序列9肽打分 (1.2.5所述),從中篩選出10條評分最高的潛在9肽表位,如表3所示,10條高親和力潛在表位分布于PRRSV的不同蛋白,如結構蛋白GP4、GP5,非結構蛋白NSP、RNA依賴性RNA聚合酶。

表3 基于SLA-1*1204基序的PRRSV(JXwn06)表位預測Table 3 Epitope prediction of PRRSV (JXwn06) based on SLA-1*1204 motif
3.1 與已報道SLA-I序列比對 本文從大白豬和長白豬中克隆獲得了22條新SLA-I等位基因,與已克隆獲得的21條藏香豬、28條黑山豬[21]和44條長白豬[16]序列比對發現,不同的品種間其SLA-I序列存在長度與個別氨基酸上的差異,主要表現在組成PBG的α1和α2結構域,尤其是組成A~F口袋的氨基酸;而在α3區、β2m結合區等處相對保守,整體序列同源性大于80%,來自不同品種的豬SLA-I可能處于進化樹的同一基因簇上。再次驗證了新SLA-I等位基因的出現可能是由于基因突變、插入和缺失、片段重組等現象[24],表明SLA-I的進化可能與豬的品種及地域環境等沒有必然的聯系。但是,目前主要組織相容性復合體數據庫(IPD;https://www.ebi.ac.uk/ipd/mhc/)共登錄了SLA-I等位基因229條[2],與人類MHC I分子已報道16 200個(http://hla.alleles.org/nomenclature/)相比,數據還較少,仍需要克隆更多的SLA-I等位基因進行大數據比對分析。
3.2 多肽預測方法 近幾年,大多采用計算機方法對多肽進行預測,最多的NetMHC使用人工神經網絡法對MHC 等位基因預測,通過NetMHCpan,SLA-1*0401[20]、SLA-3*hs0202[27]成功預測了流感病毒(IAV)結合多肽,SLA-1*1502[16]、SLA-1*0501[27]預測了PRRSV結合多肽,該方法更多考慮分子肽內部不同位置氨基酸之間的相互關系,預測結果數量不穩定,多的可達上百條,少的可能為0。本文通過隨機肽庫結合質譜從頭測序方法預測SLA-1*1204結合PRRSV多肽,與NetMHC方法相比,可快速鑒定出該等位基因的結合基序,結合病毒蛋白序列計算出高結合率的PRRSV 9肽,但也存在需要合成隨機9肽、質譜分析等過程較多、成本較高的缺點。當然,多肽預測只是SLA-I遞呈的一個環節,能否與SLA-1結合并遞呈給CTL需要進一步的驗證。
3.3 錨定殘基 抗原肽主要通過多肽N端和C端2~3個氨基酸錨定于PBG相應的口袋中[25]。其中,B和F(有的為B、C、F或B、D、F)在結合抗原肽上起著決定性的作用[26]。我們曾通過3D結構獲得了SLA-1*1502、SLA-1*0401、SLA-3*hs0202 PBGs的錨定殘基為P2、P3、P9位[20-22],本文SLA-1*1204結合的抗原肽譜顯示,其PBG的錨定殘基為P1、P2、P9,P9位是長側鏈氨基酸能夠錨定的C端,N端的P1/P2位也同時發揮了錨定氨基酸的作用。