鐘璐璐 周峰 彭佳欣 譚洋 裴剛
(1.湖南中醫藥大學藥學院,長沙 410208;2.湖南省普通高等學校中藥現代化研究重點實驗室,長沙 410208)
溶質載體15A3(solute carrier 15A3,SLC15A3,又稱PhT2)是質子偶聯寡肽轉運體(proton-coupled oligopeptide transporters,POTs)家族成員,負責某些二肽及組氨酸跨生物膜轉運[1]。研究顯示SLC15A3基因參與調控固有免疫應答和炎癥反應,其表達上調可能是炎癥進展的原因[2]。
炎癥是固有免疫系統對病原體或損傷的一種反應,通過模式識別受體識別相關病原分子啟動下游信號通路,這些受體包括Toll樣受體(Toll-like receptors,TLRs)和核苷酸結合寡聚結構域(nucleotidebinding oligomerization domain,NOD)樣受體(NLRs)[3]。巨噬細胞是炎癥反應的主要效應細胞,SLC15A3被發現在脂多糖(lipopolysaccharide,LPS)誘導的巨噬細胞中高表達[4-5]。LPS與細胞膜上的TLR4受體特異性結合,激活NF-κB,上調SLC15A3表達,此作用可被NF-κB抑制劑逆轉,表明SLC15A3表達受NF-κB信號調控[2]。此外,TLR2、TLR7及TLR9激活也能上調SLC15A3基因表達[2]。SLC15A3基因通過將NOD的2個配體胞壁酰二肽(muramyl dipeptide,MDP)和胞壁酰三肽(L-Ala-γ-D-Glu-meso-diaminopimelic acid,tri-DAP)轉運至胞質受體,觸發NOD依賴性免疫應答[6]。MDP刺激SLC15A3沉默的樹突狀細胞后,IL-6和IL-1β的產生與野生型細胞相比顯著減少[7];相反,過表達SLC15A3細胞受MDP刺激時,炎癥因子產生增多,細胞免疫應答增強[8]。研究SLC15A3表達調控機制對進一步研究其在炎癥疾病發生、發展中的作用具有重要意義。為了系統分析SLC15A3基因及編碼蛋白的性質和功能,本研究利用生物信息學方法進行預測,期望有助于人SLC15A3基因表達調控機制研究的開展。
1.1 資料 人SLC15A3基因Gene ID:51296,mRNA登錄號:NM_016582.3。人、大鼠、小鼠、貓和牛SLC15A3蛋白UniProtKB分別為:Q8IY34、Q924V4、Q8BPX9、M3WJ98和F1MYU7。
1.2 方法 在NCBI網站中以“SLC15A3”為關鍵詞,獲得人SLC15A3基因上游-2 000 bp~-1 bp序列,作為SLC15A3基因可能的啟動子序列。使用TSSW和Neural Network Promoter Prediction啟動子軟件對人SLC15A3基因啟動子序列進行分析。將人SLC15A3基因啟動子序列輸入JASPAR、PROMO和AliBaba 2.1網站對啟動子區域轉錄因子結合位點進行預測。利用EMBOSS、MethPrimer和CpG finder網站預測人SLC15A3基因2 000 bp啟動子區域甲基化CpG島。使用SNP Function Prediction對人SLC15A3基因啟動子單核苷酸多態性(single nucleotide polymorphism,SNP)位點進行預測。從Uniprot數據庫中獲取SLC15A3蛋白基本信息,分別使用ProtParam和ProtScale在線工具分析人SLC15A3蛋白理化性質和親疏水性。采用DNAMAN對不同物種來源SLC15A3蛋白進行同源性分析,并使用MEGA-x構建系統進化樹。使用SOPMA和SWISS-MODEL在線工具預測蛋白二級結構和三級結構。利用STRING數據庫對蛋白相互作用關系進行分析。所用數據庫及網址見表1。

表1 本研究所用數據庫及網址Tab.1 Databases and websites used in this study
2.1 人基因SLC15A3基本信息 SLC15A3基因在Genebank中的登錄號為NC_000011.10,位于人11號染色體長臂1區2帶2亞帶(11q12.2),基因全長15 093 bp(60 937 084~60 952 176 bp),由9個外顯子和8個內含子組成。常表達于肺、脾、骨髓及腸等組織。
2.2 人基因SLC15A3啟動子預測 TSSW預測到該基因有1個啟動子,位于551 bp;Neural Network Promoter Prediction數據庫未發現該基因啟動子。
2.3 人SLC15A3基因轉錄因子及其結合位點分析 利用JASPSR軟件對人SLC15A3基因啟動子區轉錄因子結合位點進行預測,Relative profile score threshold分別選擇80%、85%、90%、95%及100%時,獲得正負鏈轉錄因子結合位點數依次為1 702個、352個、165個、53個和2個,Relative profile score threshold為95%時轉錄因子結合位點部分預測結果見表2。

表2 JASPAR軟件預測人SLC15A3基因啟動子區轉錄因子結合位點部分結果Tab.2 Analysis part results of transcription factor binding sites in promoter region of human SLC15A3 gene predicted by JASPAR
使用PROMO數據庫對人SLC15A3基因啟動子區轉錄因子結合位點進行預測,共獲得62個轉錄因子結合位點(圖1),涉及YY1、XBP-1、GR-alpha、TFⅡ-Ⅰ、C/EBPbeta、AP-2alphaA和NF-1等。AliBaba 2.1聯結TRANSFAC 4.0數據庫,獲得人SLC15A3基因255個轉錄因子結合位點(圖2),主要包括Oct-1、Sp1、ETF、NF-1和RAR-alpha等,兩種軟件預測得到結合位點位置相同的轉錄因子共16個,包括YY1、C/EBPbeta、NF-1、RXR-alpha、c-Jun、ETF、Sp1、NFκB、PU.1、C/EBPalpha、GR、AP-1、c-Fos、RAR-beta、GATA-1和WT1。

圖1 PROMO 預測人SLC15A3基因啟動子區域轉錄因子結合位點結果Fig.1 Results of transcription factor binding sites in promoter region of human SLC15A3 gene predicted by PROMO

圖2 AliBaba2.1預測人SLC15A3基因轉錄因子結合位點部分結果Fig.2 Part results of transcription factor binding sites in promoter region of human SLC15A3 gene predicted by AliBaba2.1
2.4 人SLC15A3基因啟動子區CpG 島及SNP預測分析 利用EMBOSS、CpG Finder和MethePrimer分析人SLC15A3基因上游2 000 bp,結果顯示無CpG島。運用SNP Function Prediction進行功能預測和種族特異性等位基因頻率查詢,結果顯示rs11230691、rs11230693、rs11423328、rs11600411、rs11606608、rs17156016、rs17704641、rs34883413、rs35043745、rs35958610、rs7930736和rs896830保守性極低,其中rs17156016、rs17704641和rs896830等位基因具有人種差異,北歐西歐血統美國猶他州人(CEU)、中國北京漢族人(CHB)、日本東京人(JPT)和尼日利亞約魯巴人(YRI) 4個種族中等位基因頻率存在差異,CHB和JPT兩個種族等位基因頻率基本一致(表3)。進一步分析人SLC15A3基因啟動子區等位基因和非同義SNP等信息,結果見表4。

表3 人SLC15A3基因啟動子區SNP功能信息和種族特異等位基因頻率預測Tab.3 Prediction of functional information and race specific allele frequency of SNP in promoter region of human SLC15A3 gene

表4 人SLC15A3基因啟動子區 SNP 預測Tab.4 SNP prediction of promoter region of human SLC15A3 gene
2.5 人SLC15A3蛋白的理化性質 SLC15A3蛋白總分子式為C2929H4543N769O767S27,含581個氨基酸殘基,相對分子量為63 559.50,原子總數為9 026個,理論等電點為9.27。581個氨基酸殘基中堿性氨基酸殘基(Arg+Lys)總數為43,酸性氨基酸殘基(Asp+Glu)總數為30。不穩定系數為47.70,屬于不穩定蛋白。體內半衰期30 h,脂肪系數為106.99,親水值為0.409,表明該蛋白為疏水性蛋白。進一步應用ProtScale在線親/疏水性軟件獲得 SLC15A3蛋白親/疏水性序列分析圖譜(圖3)。第282位丙氨基酸(A)分值為-2.911;疏水性最強位點是位于第384位的亮氨基酸(L),分值為3.500。581個氨基酸(5~581)中有365個(63.37%)分布于score>0區,表明SLC15A3蛋白存在大量疏水域,屬于疏水性蛋白。預測結果與理化性質中的疏水性結果一致。

圖3 人SLC15A3蛋白質的親(疏)水性分析Fig.3 Hydrophilicity/hydrophobicity analysis of human SLC15A3 protein
2.6 SLC15A3蛋白序列比對和同源性分析 蛋白序列比對結果(圖4)顯示,人、大鼠、小鼠、貓和牛的SLC15A3蛋白氨基酸序列同源性高達87.91%,說明哺乳動物中SLC15A3具有高度同源性,蛋白序列保守性較高,推測其在其他物種中的生理功能可能與在人體中的生理功能相同。基于最低Bayesian Information Criterion分數值、模型更合適的原則,選擇JTT模型,選擇Neighbor Joining 建樹方法構建系統進化樹(圖5)。結果顯示人、大鼠和小鼠進化距離極小,說明SLC15A3蛋白在人、大鼠和小鼠中具有高度保守性。

圖5 人SLC15A3蛋白系統進化樹Fig.5 Phylogenetic tree of human SLC15A3 protein
2.7 SLC15A3蛋白二級、三級結構預測 SLC15A3蛋白二級結構預測如圖6所示。α-螺旋(Hh)270個(46.47%),無規卷曲(Cc)227個(39.07%),延伸鏈(Ee)67個(11.53%)及β-轉角(Tt)17個(2.93%)。說明該蛋白結構主要元件為α-螺旋和無規卷曲,延伸鏈和β-轉角僅在局部出現。將人SLC15A3氨基酸序列上傳SWISS-MODEL采用同源建模法得到4個三級結構預測信息(圖7)。圖片展示了4種模型蛋白三級結構和同源蛋白質相似性波形圖。4個模型中A模型GMQE值為0.53,同源性為26.71%,序列相似性為0.34,相似性波形圖預測值較高且穩定,覆蓋率為0.86,說明模型A更可信。使用The Structure Analysis and Verification Server進行拉曼圖分析,進一步分析結構可信度,拉曼圖中區域由白到紅,顏色越深表明該區域二面角越合理。拉曼圖(圖8)中,392個氨基酸處于拉曼圖的核心容許區(紅色),占84.5%,57個氨基酸處于額外容許區(黃色),占12.3%。容許區氨基酸數比例超過90%,表明該模型A預測結構形成的二面角穩定可靠。

圖6 人SLC15A3蛋白二級結構預測Fig.6 Secondary structure prediction of human SLC15A3 protein

圖7 人SLC15A3蛋白三級結構預測Fig.7 Tertiary structure prediction of human SLC15A3 protein

圖8 人SLC15A3蛋白三級結構拉曼圖分析Fig.8 Ramachandran plot of tertiary structure of hunan SLC15A3 protein
2.8 人SLC15A3蛋白相互作用網絡 蛋白互作網絡如圖9所示,CD6、TYROBP、CD5、NOD2、SLC37A2、IFI30、CSF1R、PTCHD3、LILRB2、CD14與SLC15A3相互作用,其中CD6得分最高,說明其與SLC15A3蛋白相互作用最緊密(表5)。

圖9 人SLC15A3蛋白互作網絡Fig.9 Network of proteins interacted with human SLC15A3

表5 與人SLC15A3蛋白相互作用可能性較大的10種蛋白Tab.5 Ten proteins with high possibility of interaction with human SLC15A3
POTs家族由SLC15A1~SLC15A5組成,SLC15A3的功能主要是將組氨酸和二肽從溶酶體內運輸到胞質[9]。研究表明SLC15A3表達對LPS誘導的細胞炎癥反應具有調節作用,將其基因沉默會減少TLR4依賴的IL-6和TNF-α等促炎因子產生;另一方面,將其基因過表達會增加TLR4依賴的炎癥因子產生[2]。此外,葡聚糖硫酸鈉誘導的潰瘍性結腸炎小鼠結腸組織和結腸固有單核免疫細胞中可見SLC15A3表達上調,而SLC15A3上調導致更多促炎因子產生,引起更強烈的免疫應答,導致潰瘍性結腸炎發展[8]。因此抑制SLC15A3表達或許能成為治療炎癥性疾病的新思路。
人SLC15A3蛋白是以α-螺旋為主的疏水性不穩定蛋白。氨基酸同源性和進化樹結果顯示人SLC15A3蛋白在哺乳動物中具有較高進化保守性。蛋白互作結果顯示共10個蛋白與SLC15A3存在互作關系,其中NOD2與SLC15A3的關系已得到實驗證實,SLC15A3基因通過將NOD2配體MDP轉運至胞質受體,觸發NOD依賴性免疫應答,加重炎癥反應[6]。
現有文獻表明SLC15A3表達受NF-κB轉錄因子調控[6]。SLC15A3基因表達依賴于一個復雜的調控系統,其中轉錄因子與目的基因啟動子上的結合位點相互作用是調控基因表達的重要一環[10]。本研究經多種預測軟件分析發現NF-κB、c-Jun、AP-1及c-Fos等多個轉錄因子在SLC15A3基因啟動子序列存在結合位點。NF-κB是兩種Rel家族蛋白構成的異二聚體,可以調控數百個免疫基因表達而被稱為炎癥反應主要調節器[11]。NF-κB接受上游信號傳遞后,能夠磷酸化從細胞質轉入細胞核,并通過結合靶基因增強子或啟動子區域κB位點調控基因轉錄[12]。NF-κB在巨噬細胞表型轉換中起轉錄調節作用,研究表明巨噬細胞中SLC15A3表達受NF-κB調控[4]。絲裂原活化蛋白激酶(mitogen-activated protein kinase,MAPK)信號通路同樣參與SLC15A3表達上調[8]。激活蛋白1(activator protein-1,AP-1)是MAPK信號通路下游轉錄因子[13]。AP-1與NF-κB類似,AP-1接收上游信號活化后,同樣通過轉錄參與炎癥因子合成,進而導致炎癥發生[14-15]。AP-1由c-Jun和c-Fos兩個亞基組成[16]。c-Jun/c-Fos復合物參與激活多種促炎信號基因表達[17]。此外,c-Jun能夠識別并結合增強子七聚體基序5'-TGA[CG]TCA-3',并參與c-Jun氨基末端激(c-Jun N-terminal kinase,JNK)信號通路,其被磷酸化激活有助于促炎基因表達[18]。本研究中已有轉錄因子結合位點參與調控SLC15A3基因表達,但還有許多是預測的潛在轉錄因子結合位點,需要進一步實驗驗證。
目前研究主要關于SLC15A3在炎癥反應過程中的表達變化,本研究系統分析了SLC15A3基因特點及其編碼蛋白的理化性質、結構和進化保守性等,將對深入研究SLC15A3基因和蛋白在潰瘍性結腸炎等炎癥性疾病發生發展中的表達調控具有重要意義。