陳旭東,程開,呂開績,張麗芳,朱冠保
(1.溫州醫科大學附屬第一醫院 胃腸外科,浙江 溫州 325015;2.溫州醫科大學 微生物學與免疫學教研室 分子病毒與免疫研究所 熱帶醫學研究所,浙江 溫州 325035)
程序性死亡受體(programmed cell death protein 1,PD-1)作為一種免疫檢查點,表達于T細胞表面,而T細胞在腫瘤免疫中起到重要的作用。而程序性死亡受體配體-1(programmed cell death ligand 1,PD-L1)作為其配體可與其結合,并抑制T細胞的活性[1-3]。PD-L1是一種I型跨膜蛋白,全長為290個氨基酸,相對分子質量為33 kDa,廣泛表達于多種腫瘤細胞表面[4-6]。腫瘤細胞產生的PDL1可以使之免受免疫細胞的細胞殺傷作用,而拮抗PD-L1與其受體PD-1結合,能夠讓T細胞正常活化,并發揮腫瘤殺傷作用[7]。現在已有針對人PD-1或PD-L1的多種單克隆抗體和小分子親和體上市或處于臨床試驗階段,包括Nivolumab[8-9]、Pembrolizumab[10-11],Atezolizumab[12-13]、Avelumab[14],并在多種腫瘤的治療中展現出令人矚目的效果。B細胞表位是抗原上能和抗體的互補決定區互補結合的區域。B細胞表位可用于疫苗的制備,單克隆抗體的研制和小分子親和體的高通量篩選,具有針對性強、作用穩定等特點,因此B細胞表位的研究是免疫學研究的重要部分。PD-L1 B細胞的表位的研究已有報道[15],但其為構象表位,位于β折疊中,難以用人工合成多肽的方式模擬。故本研究利用生物信息學方法,以PD-L1的全長氨基酸序列為基礎,對人和小鼠PD-L1 B細胞表位進行預測和分析,期望找到可以用人工合成多肽模擬的B細胞表位,可為單克隆抗體的研制和高通量小分子親合體篩選等提供理論依據。
1.1 人與小鼠PD-L1全長氨基酸序列的獲取 人與小鼠PD-L1全長氨基酸序列檢索于uniProt蛋白質數據庫(http://www.uniprot.org/),提供氨基酸序列編號。
1.2 人與小鼠PD-L1全長蛋白的二級結構預測 結合EXPASY服務器提供的GOR4、SOPMA、Scratch Protein Predictor(SPP)程序對人與小鼠PD-L1胞外段氨基酸序列進行二級結構的分析。
1.3 人與小鼠PD-L1胞外段蛋白親水性、極性、抗原性、柔韌性和表面可及性的預測 人與小鼠PD-L1胞外段氨基酸位置來自uniProt蛋白質數據庫已有的生物信息學預測結果。利用EXPASY服務器提供的親水性參數(Hopp&Woods)、極性參數(Zimmerman)和DNAstar軟件的Protein進行的表面可及性參數(Emini)、抗原性參數(Jameso-Wolf)和柔韌性參數(Flexible regions)分析來對人與小鼠PD-L1胞外段蛋白B細胞線性表位進行預測。其中高于閾值的肽段即為預測的抗原表位。
1.4 人與小鼠PD-L1胞外段蛋白空間結構的獲取和預測 人PD-L1胞外段蛋白(PDB ID:3BIS)空間結構的預測采用RCSB Protein Data Base(PDB)蛋白質數據庫檢索,獲取人PD-L1的空間結構。小鼠的PD-L1的胞外段空間結構預測:以人PD-L1胞外段蛋白(PDB ID:5ius.1,同源性73.64%)作為模板,在swiss model(https://www.swissmodel.expasy.org/)上進行預測。將各表位和PD-L1與其配體PD-1結合的部位用PYMOL軟件標記到三維模型上,并進行觀察分析。
1.5 綜合分析 結合上述方法的預測結果,并運用吳玉章等[16]建立的抗原性指數綜合評判PD-L1 B細胞表位的優勢區域,并與Avelumab與PD-L1的結合位點進行比較(PDB ID:5GRJ)。
1.6 同源性分析 將人和小鼠PD-L1的B細胞優勢表位進行比較,并與多個物種進行同源性分析。

圖1 人和小鼠PD-L1二級結構預測

表1 GOR4、SPP、SOPMA 3種方法預測人和小鼠PD-L1的二級結構的構成比[ n=290,n(%)]
2.1 PD-L1蛋白的二級結構 人與小鼠PD-L1全長氨基酸序列如圖1所示。PD-L1蛋白的二級結構采用EXPASY服務器的GOR4、SOPMA、SPP 3種方案預測二級結構,提示人PD-L1蛋白的二級結構中以無規則卷曲為主,α-螺旋、β-轉角相對較少。同時在這3種方案的預測結果中,取至少2種方案預測結果一致的重疊區,且與柔韌性參數的預測相結合,可見無規則卷曲主要位于N端的23~26、32~35、40~45、60~63、69~73、107~110、118~124、131~139、146~151、158~163、170~172、176~178、182~186、200~205、212~220、227~238。小鼠PD-L1蛋白的二級結構中以無規則卷曲為主,α-螺旋、β-轉角相對較少。同樣的方法結果顯示,無規則卷曲和抗原性顯示:應用不同參數預測的B細胞抗原表位肽段略有差異,但人PD-L1的氨基酸片段40~45、60~63、69~73、118~124、131~139、146~151、158~163、212~220、227~238在多種預測方法中一致,小鼠PD-L1的氨基酸片段40~48、58~63、72~88、118~126、131~139、144~148、157~162、168~177、183~187、212~220、226~237在多種預測方法中一致(抗原指數≥0,親水性指數≥0,表面可及性指數≥1,極性指數≥12)。見圖2。主要位于N端的19~26、33~35、40~48、58~61、72~88、94~96、107~110、118~123、131~139、144~148、157~162、168~177、183~187、199~204、212~220、226~237。見圖1,表1-2。
2.2 多參數預測PD-L1蛋白表位 uniProt蛋白質數據庫顯示,人PD-L1的胞外段位于N端的19~238,小鼠PD-L1的胞外段位于N端的19~239。因此選擇上述氨基酸作為預測表位的候選區段。綜合分析PD-L1的親水性、極性、柔韌性、表面可及性

表2 人和小鼠B細胞表位的平均抗原性指數
2.3 3D模型和功能定位 人和小鼠的PD-L1的三維結構模擬如圖3所示。LIN等[17]成功晶體化了小鼠PD-1和人PD-L1的結合體,用X線衍射的方法,證明了人PD-L1通過19、20、26、54、56、66、115、117、121、122、123、124、125這幾個氨基酸與小鼠PD-1相結合的,這幾個氨基酸位于其V區(IgV like domain)的AGFCC’C’上,且在小鼠和人PD-L1上是高度保守的,僅有兩個位置不同(54、115),而人-54(異亮氨酸)和小鼠-54(頡氨酸)同為非極性氨基酸(疏水性氨基酸),而人-115(甲硫氨酸)和小鼠-115(異亮氨酸)也同為非極性氨基酸。而PD-1上與結合相關的氨基酸也具有較高的一致性(15/18)。所以可以認為人和小鼠的PD-L1與PD-1的結合位置是十分類似的(見圖4)。通過對人和小鼠PD-L1的三維立體結構的分析,若表位位于其V區的AGFCC’C’上或周圍,而不在BED上,可以認為表位接近PD-L1與其配體PD-1結合的部位,可以發現人的40~45、60~63、69~73、118~124和小鼠的40~48、58~63、72~88、118~126距離上述位置較為接近,并有部分重疊(見圖5)。

圖2 人和小鼠PD-L1不同參數的預測結果

圖3 人和小鼠的PD-L1的三維結構模擬

圖4 人和小鼠的PD-L1與其配體PD-1結合的部位
2.4 PD-L1蛋白表位的綜合分析 人PD-L1的41~46、60~63、71~75和小鼠PD-L1的41~50、58~62、72~80平均抗原指數較高(見表2),提示其可能為B細胞表位的優勢區域(見圖6)。Avelumab與PD-L1的結合位點與本研究所預測的人PD-L1 B細胞表位如圖7所示。
2.5 同源性分析 人和小鼠PD-L1的B細胞優勢表位進行比較,兩者的位置十分接近,最多相差5個氨基酸,將人和鼠的表位所在的位置取并集,把人PD-L1的上述位置的氨基酸與多種實驗動物的PD-L1上相應的氨基酸序列進行對比,計算相同的氨基酸占所有氨基酸的百分比,結果見表3。

圖5 人和小鼠的PD-L1的結合面與優勢B細胞表位

圖6 人和小鼠的PD-L1的結合面與優勢B細胞表位

圖7 Avelumab與PD-L1的結合位置和本研究預測的B細胞表位
由于PD-L1作為一種抗腫瘤的靶標,單克隆與其結合后,阻礙PD-L1與PD-1相結合,具有顯著的抑瘤效果和相對較低的不良反應,因而是目前研究的前沿和熱點[18-20]。Avelumab是一種以PD-L1為靶點的單克隆抗體,已在多種腫瘤的治療中表現出良好的反應率,對于該單克隆抗體的研究發現,它是通過與PD-L1相結合,從而阻礙PD-L1與其受體PD-1相結合,從而拮抗PD-L1的抑制腫瘤免疫的作用[14],其結合面就位于PD-L1與PD-1的結合面附近[21],并有部分重疊,并且其結合的位置與本研究所預測的B細胞線性表位在多個位置(73、75、63、61、60、62)有重疊(見圖7),說明本研究所預測的B細胞表位具有較好的抗原性和免疫原性,并在拮抗PD-L1與其受體PD-1相結合的方面可能有重要作用。但由于PD-L1與PD-1的結合面位于β折疊的區域,受限于現有的B細胞表位的預測和多肽合成技術的限制,仍無法直接預測和人工合成模擬位于β折疊的區域B細胞表位。

表3 人和不同動物PD-L1的41~50、58~62、71~80氨基酸序列及同源性(%)
針對PD-L1的單克隆抗體需要通過免疫系統來發揮其腫瘤抑制作用,因而對其研究具有一定的困難,早期研究無法在人體內進行體內實驗,現在也尚無法建立與人類有相同免疫系統的模型用作科學研究,此類實驗往往通過動物實驗來代替[22]。因此本研究對預測的人和小鼠的B細胞表位進行對比,發現兩者的位置十分接近,并且序列也有較好的同源性,再將人和多種常見的實驗動物的這幾個區域的氨基酸序列進行同源性分析,發現都有較好的同源性。但這些序列的交叉免疫原性如何,尚有待于之后的研究證實。
使用生物信息學預測B細胞表位已被廣泛使用,并取得了不錯的結果和很大的進展[23-24]。目前有多種B細胞表位的預測方法,但由于各種方法的差異性及局限性,使各研究團隊預測準確率差異較大,故研究人員正不斷地改進方法、開發更好的預測評價體系,使B細胞表位的預測、評價標準化。目前得到公認的具有較好預測結果的方法有二級結構、親水性、抗原性、表面可及性等參數的預測,本研究將以上參數與吳玉章等[16]建立的抗原指數相結合,從而初步地做出科學、合理的預測分析。本研究首先通過上述方法分析預測了人和小鼠的PDL1氨基酸序列中優勢B細胞表位,再結合模擬3D結構找出在PD-L1與PD-1的結合面附近的B細胞表位,進一步將兩者的結果進行比對,并與多種實驗動物進行同源性分析,結果發現人PD-L1的41~46、60~63、71~75是較好的B細胞表位,并在PD-L1與PD-1的結合面附近,與多種實驗動物有較高的同源性。本研究為更高效地篩選針對PD-L1的單克隆抗體或小分子親合體提供了理論基礎。