徐本錦,李卓禧,范 蕾,李 璟,嚴(yán)榮榮,杜 淼,宣 焱,門(mén) 杰,陳曉聰,湯文婷,侯艷香,宋彬妤,楊婭男,劉曉梁,余駿驍,劉 玲
(山西醫(yī)科大學(xué)汾陽(yáng)學(xué)院 1.醫(yī)學(xué)檢驗(yàn)系、2.基礎(chǔ)醫(yī)學(xué)部、3.山西省汾陽(yáng)醫(yī)院檢驗(yàn)科、4.科技中心,山西 汾陽(yáng) 032200)
2019年,新冠病毒(SARS-CoV-2)的出現(xiàn)及其在世界范圍內(nèi)的迅速傳播造成了嚴(yán)重的全球公共衛(wèi)生安全事件[1]。截至2021年6月17日7時(shí)01分,全球累計(jì)確診病例超過(guò)17 778萬(wàn)例,累計(jì)死亡病例384.8萬(wàn)例。SARS-CoV-2是單股正鏈RNA病毒,顆粒呈球形或多形性,直徑80~120 nm,其核酸與核衣殼蛋白緊密包裝在病毒顆粒中,病毒膜表面有刺突[2]。人類感染該病毒后常表現(xiàn)為上呼吸道感染、干咳、中低度發(fā)熱、呼吸困難、肺炎、多臟器衰竭,嚴(yán)重者可致死。新冠肺炎疫情(COVID-19)在全球范圍的大肆傳播,迫切需要深入研究病毒傳播和感染的分子機(jī)制。
跨膜絲氨酸蛋白酶2(transmembrane serine proteinase 2,TMPRSS2)屬于II型絲氨酸蛋白酶(type II transmembrane serine protease,TTSPs)家族成員[3]。人類TMPRSS2基因定位于染色體21q22.3,N端有跨膜區(qū),C端有“催化三聯(lián)體”(絲氨酸-組氨酸-天冬氨酸)結(jié)構(gòu)域,此外,還包括低密度脂蛋白受體結(jié)構(gòu)域 (low-density lipoprotein receptor domain,LDLR)和清道夫受體結(jié)構(gòu)域(scavenger receptor domain,SR)[4]。人類TMPRSS2蛋白在呼吸道細(xì)胞表面大量表達(dá),可切割A(yù)CE2蛋白(angiotensin-converting enzyme 2)和刺突蛋白(spike glycoprotein),對(duì)于冠狀病毒侵染宿主細(xì)胞起著至關(guān)重要的作用[5],是開(kāi)發(fā)新冠病毒抑制劑和治療藥物的關(guān)鍵靶點(diǎn)。SARS-CoV-2的感染依賴于TMPRSS2的活性,高表達(dá)TMPRSS2的細(xì)胞在病毒侵染時(shí)會(huì)產(chǎn)生更高的病毒損傷[6]。TMPRSS2通過(guò)切割A(yù)CE2和S蛋白,激活了S蛋白,使SASR-CoV-2更容易進(jìn)入細(xì)胞。研究發(fā)現(xiàn),TMPRSS2的關(guān)鍵殘基(H296、S441和S460)與SARS-CoV-2 S蛋白裂解位點(diǎn)的側(cè)翼殘基相互作用[1, 7],因此,TMPRSS2在SARA-CoV-2進(jìn)入宿主細(xì)胞過(guò)程中發(fā)揮重要作用。TMPRSS2在肺和腸道中的高表達(dá)使得這兩個(gè)器官更容易受到SARS-CoV-2的侵襲[8]。
為進(jìn)一步揭示TMPRSS2在病毒入侵過(guò)程中的作用機(jī)制及其結(jié)構(gòu)與功能特性,本文利用生物信息分析手段對(duì)TMPRSS2蛋白的生物學(xué)特性進(jìn)行了系統(tǒng)分析,同時(shí)對(duì)該蛋白進(jìn)行了同源性分析和進(jìn)化分析,此外,還構(gòu)建了TMPRSS2蛋白的原核表達(dá)載體。本研究有助于闡明TMPRSS2在SARS-CoV-2侵染人體細(xì)胞中的作用機(jī)制,對(duì)于研發(fā)靶向該蛋白的抑制劑和抗病毒藥物具有重要意義。
1.1 材料質(zhì)粒pET-22b為本室保存,DNA分子量標(biāo)準(zhǔn)、感受態(tài)細(xì)胞及質(zhì)粒DNA提取試劑購(gòu)自全式金;限制性內(nèi)切酶購(gòu)自NEB;氨芐西林和IPTG等常規(guī)生化試劑購(gòu)自國(guó)藥。
1.2 運(yùn)用相關(guān)網(wǎng)站分析TMPRSS2蛋白的理化性質(zhì)、翻譯后修飾位點(diǎn)、信號(hào)序列、分子構(gòu)型及B/T細(xì)胞表位等功能特點(diǎn)。
1.3 多序列比對(duì)與進(jìn)化分析從UniProt網(wǎng)站下載12條TMPRSS2蛋白序列,用Clustal×2及MEGA7.0進(jìn)行序列比對(duì)及系統(tǒng)進(jìn)化樹(shù)分析。
1.4 載體構(gòu)建及蛋白表達(dá)對(duì)質(zhì)粒pET-22b和TMPRSS2基因用XhoI與NdeI同步雙酶切,回收酶切產(chǎn)物,將目的基因與載體進(jìn)行連接,將連接產(chǎn)物轉(zhuǎn)化Top10和BL21感受態(tài)細(xì)胞后進(jìn)行PCR驗(yàn)證。
2.1TMPRSS2蛋白的理化性質(zhì)TMPRSS2由492個(gè)氨基酸組成,其中酸性氨基酸(Asp+Glu)有35個(gè),堿性的氨基酸(Arg+Lys)有39個(gè),Ser含量最高(0.089),其次是Gly(0.087)(Tab 1),分子量53.86 ku,理論等電點(diǎn)8.12,是一個(gè)堿性蛋白。該蛋白分子式為 C2387H3654N650O709S33,原子總數(shù)為7 433,分子消光系數(shù)為118 145 L·mol-1·cm-1,不穩(wěn)定系數(shù)為41.94;在哺乳動(dòng)物網(wǎng)織紅細(xì)胞中的半衰期約為30 h,在酵母中>20 h,在大腸桿菌內(nèi)>10 h,脂肪族氨基酸指數(shù)72.70,總平均親水系數(shù)-0.248。

Tab 1 Amino acid composition of TMPRSS2 protein
2.2TMPRSS2蛋白跨膜結(jié)構(gòu)預(yù)測(cè)結(jié)果顯示,該蛋白第M1-K83肽段位于細(xì)胞膜內(nèi),A84-W106肽段處于跨膜區(qū),K107-G492肽段位于細(xì)胞膜外。跨膜螺旋殘基數(shù)的期望值約21.818,N-term位于膜細(xì)胞質(zhì)側(cè)的總概率為0.948。因此TMPRSS2蛋白存在1個(gè)跨膜螺旋區(qū),屬于跨膜蛋白(Fig 1)。
2.3TMPRSS2蛋白卷曲螺旋預(yù)測(cè)結(jié)果顯示,基于3種不同的窗口寬度(14、21、28)沒(méi)有檢測(cè)到卷曲螺旋結(jié)構(gòu)(Fig 2)。
2.4TMPRSS2蛋白親/疏水性分析預(yù)測(cè)結(jié)果顯示,TMPRSS2蛋白的平均親水系數(shù)為-0.248,殘基E178,K340和T341的親水性最強(qiáng),Score值為-2.733;殘基A98的疏水性最強(qiáng),Score值為2.378,且親水遠(yuǎn)多于疏水氨基酸。因此可以推測(cè)其蛋白為親水性蛋白(Fig 3)。
2.5TMPRSS2蛋白磷酸化位點(diǎn)預(yù)測(cè)預(yù)測(cè)顯示,TMPRSS2含有49個(gè)可能的磷酸化位點(diǎn),其中Ser、Thr及Tyr磷酸化位點(diǎn)分別有25個(gè)、14個(gè)和10個(gè)(Fig 4),這些位點(diǎn)及其相應(yīng)激酶如Tab 2。

Tab 2 Phosphorylation sites of TMPRSS2 protein and corresponding kinases

Fig 1 Transmembrane structure prediction of TMPRSS2 protein

Fig 2 Coiled coil analysis of TMPRSS2 protein

Fig 3 Hydrophilic/hydrophobic analysis of TMPRSS2 protein

Fig 4 Phosphorylation site of TMPRSS2 protein
2.6TMPRSS2蛋白糖基化位點(diǎn)預(yù)測(cè)結(jié)果顯示,TMPRSS2蛋白存在3個(gè)的N-糖基化,分別是N128,N213和N249(Fig 5A);有12個(gè)O-糖基化,分別是S5、S61、S71、S79、S163、S204、S232、S233、S250、T31、T67和T447(Fig 5B)。

Fig 5 Glycosylation sites prediction of TMPRSS2 protein
unsp indicates an undetermined kinase
2.7TMPRSS2蛋白的功能位點(diǎn)分析TMPRSS2蛋白有3個(gè)活性位點(diǎn),分別是H296、D345和S441,它們構(gòu)成了一個(gè)電荷中繼系統(tǒng)。通過(guò)查閱文獻(xiàn)發(fā)現(xiàn),目前已報(bào)道多個(gè)人源TMPRSS2蛋白的突變位點(diǎn)(Tab 3)。

Tab 3 Mutation sites of TMPRSS2 protein
2.8TMPRSS2蛋白的亞細(xì)胞定位和信號(hào)序列預(yù)測(cè)亞細(xì)胞定位分析顯示,人源TMPRSS2蛋白主要表達(dá)在細(xì)胞的內(nèi)質(zhì)網(wǎng)膜(0.444)、線粒體(0.333)、細(xì)胞質(zhì)(0.111)和細(xì)胞核(0.111)。信號(hào)序列預(yù)測(cè)顯示,該蛋白不含信號(hào)序列,說(shuō)明它不屬于分泌蛋白。
2.9TMPRSS2蛋白多序列對(duì)比在線檢索與人源TMPRSS2蛋白序列同源性較高的其它11種動(dòng)物:大猩猩,黑猩猩,南方豚尾獼猴,東非狒狒,家貓,山羊,鴨嘴獸,袋熊,樹(shù)鼩,西班牙猞猁以及中華鱉。結(jié)果顯示,TMPRSS2蛋白在哺乳動(dòng)物間的保守性很高,12條序列中完全相同的殘基(*標(biāo)示)占0.329,性質(zhì)相似的(:標(biāo)示)占0.128,性質(zhì)微弱相近的(.標(biāo)示)占0.073。與人源TMPRSS2序列一致性最高的是黑猩猩,高達(dá)0.980,其次是大猩猩,為0.974;人與東非狒狒和南方豚尾獼猴的序列一致性分別為0.886和0.878,與中華鱉的序列一致性最低,為0.616(Fig 6)。
2.10 系統(tǒng)進(jìn)化分析對(duì)上述“2.9”構(gòu)建進(jìn)化樹(shù),結(jié)果顯示,黑猩猩和大猩猩與人三者聚為一支,置信度為100;東非狒狒與南方豚尾獼猴聚為一支,置信度為100;家貓與西班牙猞猁聚為一支,置信度為100。山羊單獨(dú)聚為一支,與人的親緣關(guān)系最遠(yuǎn)(Fig 7)。
2.11TMPRSS2蛋白的二級(jí)結(jié)構(gòu)預(yù)測(cè)TMPRSS2蛋白含有α-螺旋(Hh)80個(gè),占0.162 6;延長(zhǎng)鏈(Ee)124個(gè),占0.252 0;β-轉(zhuǎn)角(Tt)65個(gè),占0.132 1;無(wú)規(guī)卷曲(Cc)223個(gè),占0.453 3(Fig 8)。
2.12TMPRSS2蛋白三級(jí)結(jié)構(gòu)建模利用相關(guān)構(gòu)建TMPRSS2蛋白的三級(jí)結(jié)構(gòu)模型,結(jié)果只顯示D144-D491位、G103-A490位,以及S167-R489位的三級(jí)結(jié)構(gòu)(Fig 9)。
2.13 B/T細(xì)胞抗原表位預(yù)測(cè)
2.13.1B細(xì)胞表位分析 B細(xì)胞表位分析有助于減少和合成多肽片段的范圍與數(shù)量,提高試驗(yàn)效率。利用IEDB對(duì)該蛋白進(jìn)行B細(xì)胞抗原表位預(yù)測(cè),篩選閾值設(shè)定為0.50。結(jié)果顯示,可能含有13個(gè)B細(xì)胞抗原表位,分別為S5-K80、L105-S122、T125-P154、Y161-I256、A262-L263、E299-P305、Q317-A324、H334-N343、M372-L373、E388-S394,T407-L419,Q431-S441,G462-Y469(Fig 10)。
2.13.2T細(xì)胞表位分析 本文運(yùn)用以下兩種方法對(duì)TMPRSS2蛋白的T細(xì)胞表位進(jìn)行分析:其中HLA-A*02:01限制性CTL表位,閾值為25,檢測(cè)出1個(gè)限制性CTL表位;HLA-DRB1*0401輔助性T細(xì)胞表位,閾值設(shè)為26,檢測(cè)出6個(gè)HLA-DRB1*0401輔助性T細(xì)胞表位。
2.14TMPRSS2的蛋白-蛋白互體分析TMPRSS2與其他10個(gè)蛋白存在互作,分別是跨膜絲氨酸蛋白酶4(TMPRSS4)、血管緊張素轉(zhuǎn)化酶2(ACE2)、轉(zhuǎn)錄調(diào)節(jié)因子ERG(ERG)、ETS易位變異體4(ETV4)、ETS易位變異體1(ETV1)、雄激素受體(AR)、溶質(zhì)載體家族45成員3(SLC45A3)、同源框蛋白Nkx-3.1(NKX3-1)、DNA依賴性蛋白激酶催化亞基(PRKDC)和多聚腺苷二磷酸核糖聚合酶-1(PARP1)(Fig 11)。

Fig 6 Multi sequence comparison of TMPRSS2 protein

Fig 7 Phylogenetic tree based on TMPRSS2 protein sequence

Fig 8 Prediction of secondary structure of TMPRSS2 protein

Fig 9 Schematic diagram of tertiary structure and similarity waveform of homologous proteins

Fig 10 Prediction of B cell antigen epitopes of TMPRSS2 protein

Fig 11 Analysis of interaction network of TMPRSS2 protein
2.15 pET-22b-TMPRSS2原核表達(dá)載體的構(gòu)建
2.15.1質(zhì)粒pET-22b與TMPRSS2基因片段的酶切及菌落PCR驗(yàn)證 對(duì)質(zhì)粒pET-22b單酶切(NddeⅠ)及同步雙酶切,反應(yīng)體系為100 μL,電泳結(jié)果與預(yù)期相符(Fig 12A)。雙切酶TMPRSS2基因片段進(jìn)行NdeⅠ和XhoⅠ雙酶切(Fig 12B),通過(guò)菌落PCR鑒定陽(yáng)性克隆(Fig 12C)。
2.15.2pET-22b-TMPRSS2質(zhì)粒的驗(yàn)證及轉(zhuǎn)化 用NdeI和XhoI對(duì)重組質(zhì)粒進(jìn)行雙酶切,電泳檢測(cè)后結(jié)果符合預(yù)期(Fig 13A)。將重組質(zhì)粒轉(zhuǎn)化感受態(tài)細(xì)胞Top10,涂布LB平板(Amp+)后37 ℃培養(yǎng)12 h(Fig 13B左)。將驗(yàn)證后的重組質(zhì)粒轉(zhuǎn)化感受態(tài)細(xì)胞BL21(Fig 13B右),用于表達(dá)目標(biāo)蛋白。

Fig 12 Double enzyme digestion of pET-22b and TMPRSS2 gene fragment and colony PCR verification of positive clones

Fig 13 Double enzyme digestion verification and transformation of recombinant plasmid
SARS-CoV-2入胞的第一步是刺突蛋白S與受體ACE2識(shí)別,在宿主蛋白TMPRSS2的催化下完成病毒粒子與宿主細(xì)胞的膜融合。研究表明,SARS-CoV-2之所以不同于SARS-CoV,就在于它能更快地利用TMPRSS2。當(dāng)SARS-CoV-2入侵時(shí),TMPRSS2對(duì)S蛋白的S2亞基上進(jìn)行酶切[1],這個(gè)切割點(diǎn)后露出一段疏水殘基,并迅速嵌入宿主細(xì)胞膜。隨后,伸展的S蛋白會(huì)折疊起來(lái),像拉鏈一樣迫使病毒的外膜與細(xì)胞膜融合。
本文生信分析顯示,TMPRSS2為親水性跨膜蛋白,說(shuō)明其可能作為膜受體或膜離子通道起作用。TMPRSS2由492個(gè)氨基酸組成,分子量53.86 ku,等電點(diǎn)8.12,是一個(gè)堿性蛋白,這與其含有較多正電荷殘基相契合。TMPRSS2蛋白的不穩(wěn)定性與親水性,為離子交換分離純化、體外探究該蛋白的功能奠定了理論基礎(chǔ)[11-12]。TMPRSS2蛋白在哺乳動(dòng)物間保守性很高,與人源TMPRSS2序列一致性最高的是黑猩猩(0.980 0),次是大猩猩(0.974 0),暗示該蛋白在功能上的重要性。進(jìn)化分析顯示,黑猩猩、大猩猩與人親緣關(guān)系最近,三者聚為一支,置信度為100;山羊單獨(dú)聚為一支,與人的親緣關(guān)系最遠(yuǎn)。
糖基化和磷酸化是兩種重要的蛋白質(zhì)翻譯后修飾方式。TMPRSS2是抗病毒藥物設(shè)計(jì)的重要靶點(diǎn)蛋白,有3個(gè)潛在的N-糖基化位點(diǎn)和12個(gè)O-糖基化位點(diǎn)。高度親水的糖基,對(duì)于蛋白質(zhì)的理化性質(zhì)和生理功能具有重要影響。TMPRSS2蛋白糖基化位點(diǎn)的改造可進(jìn)一步影響該蛋白的半衰期、靶向性、以及穩(wěn)定性,有助于研制針對(duì)TMPRSS2蛋白的抗病毒藥物。蛋白磷酸化修飾主要參與細(xì)胞內(nèi)信號(hào)轉(zhuǎn)導(dǎo)等生物學(xué)過(guò)程,而糖基化修飾可使不同蛋白質(zhì)擁有不同的標(biāo)記,從而改變多肽的構(gòu)象,因此通過(guò)干預(yù)磷酸化和糖基化修飾位點(diǎn)將有望抑制病毒對(duì)宿主的侵染[13]。
TMPRSS2具有3個(gè)功能結(jié)構(gòu)域:N端LDL受體A類結(jié)構(gòu)域(C113-C148),其次是SRCR(G153-V246),最后是跨越I256-Q487的C端肽酶[7]。當(dāng)TMPRSS2與ACE2共表達(dá)時(shí),TMPRSS2能夠切割A(yù)CE2并激活S蛋白,促進(jìn)S蛋白與ACE2相互識(shí)別從而介導(dǎo)病毒入侵[14],因此,TMPRSS2在病毒入侵過(guò)程中發(fā)揮了“助攻”作用,TMPRSS2與ACE2的高表達(dá)可提高SARS-CoV-2的入侵能力[15]。研究發(fā)現(xiàn)[1, 16],TMPRSS2抑制劑可明顯抑制SARS-CoV-2 S蛋白進(jìn)入表達(dá)TMPRSS2的細(xì)胞系,而促進(jìn)TMPRSS2的表達(dá)則可取消這種抑制作用,這就說(shuō)明SARS-CoV-2 的S蛋白依賴于TMPRSS2啟動(dòng),TMPRSS2的表達(dá)能夠促進(jìn)SARS-CoV-2的攝取[17]。
二級(jí)結(jié)構(gòu)預(yù)測(cè)發(fā)現(xiàn),TMPRSS2二級(jí)結(jié)構(gòu)中占比最高的是無(wú)規(guī)則卷曲,該結(jié)構(gòu)對(duì)TMPRSS2的整體構(gòu)象和活性有著極其重要的作用,是構(gòu)成酶活性部位和特異功能部位的重要結(jié)構(gòu)[18]。本研究還建立了TMPRSS2蛋白在D144-D491、G103-A490、S167-R489位點(diǎn)的三級(jí)結(jié)構(gòu)模型,為進(jìn)一步設(shè)計(jì)和篩選TMPRSS2蛋白的潛在抑制劑和靶向藥物奠定了結(jié)構(gòu)基礎(chǔ)[3]。表位預(yù)測(cè)顯示,TMPRSS2蛋白具有13個(gè)B細(xì)胞抗原表位,這一結(jié)果對(duì)于找到有著相似免疫保護(hù)功能及抗原特異性卻無(wú)完整蛋白毒性的抗原片段,具有很大幫助。此外,TMPRSS2的T細(xì)胞表位,這有助于細(xì)胞免疫機(jī)制研究及基因疫苗或亞單位多肽的開(kāi)發(fā)。
功能位點(diǎn)分析顯示,TMPRSS2蛋白有多個(gè)重要位點(diǎn),例如R255、I256和S441,三者均處于預(yù)測(cè)的胰蛋白酶位點(diǎn)之內(nèi),同時(shí)I256和S441還位于Tryp-SPc位點(diǎn)之中。R255Q的突變會(huì)導(dǎo)致TMPRSS2徹底失去酶切活性[9]。此外,本研究結(jié)果顯示S441還是一個(gè)潛在的磷酸化位點(diǎn),同時(shí)也是B細(xì)胞抗原表位的關(guān)鍵殘基。有報(bào)道稱,S441作為T(mén)MPRSS2的關(guān)鍵殘基與SARS-CoV-2 S蛋白裂解位點(diǎn)的側(cè)翼殘基具有相互作用[1, 7],S441R的突變會(huì)導(dǎo)致TMPRSS2活性喪失[9]。以上結(jié)果進(jìn)一步印證了TMPRSS2蛋白協(xié)助病毒入侵的重要功能,同時(shí)為研發(fā)靶向TMPRSS2的抑制劑奠定了基礎(chǔ)。
綜上所述,本研究對(duì)TMPRSS2蛋白進(jìn)行了全面的生物信息學(xué)分析和過(guò)表達(dá)載體構(gòu)建,研究結(jié)果為了解TMPRSS2的生物學(xué)功能、明確SARS-CoV-2入侵人體細(xì)胞的分子機(jī)制奠定了基礎(chǔ),同時(shí)有助于揭示和完善TMPRSS2蛋白的結(jié)構(gòu)和作用機(jī)理,對(duì)發(fā)掘其潛在抑制劑和研制靶向藥物具有重要意義。