仝建波,吳魯陽, 馮 怡, 王天浩
(1.陜西科技大學(xué)化學(xué)與化工學(xué)院, 西安 710021; 2.陜西省輕化工助劑重點(diǎn)實(shí)驗(yàn)室, 西安 710021)
IL-2(Interleukin-2)是一種白介素,是免疫系統(tǒng)中的一類細(xì)胞生長因子,主要由T細(xì)胞或T細(xì)胞系產(chǎn)生.IL-2誘導(dǎo)的T細(xì)胞激酶(Itk)屬于非受體性酪氨酸(Tec)激酶[1].它在T細(xì)胞受體(TCR)及趨化因子受體信號(hào)轉(zhuǎn)導(dǎo)通路中起著重要作用[2, 3].IL-2誘導(dǎo)的T細(xì)胞激酶(Itk)參與調(diào)節(jié)T細(xì)胞的光重組、鈣動(dòng)員和NFAT活化.同時(shí)還可介導(dǎo)Th2細(xì)胞因子的分泌,并在過敏性哮喘或寄生蟲感染時(shí)產(chǎn)生有效的Th2反應(yīng)[4].因此,Itk抑制劑被認(rèn)為是治療Th2介導(dǎo)的炎癥性疾病(如哮喘、鼻炎、過敏和過敏性皮炎)的一個(gè)有希望的藥物靶點(diǎn)[5].最近,Itk抑制劑也被證明可以通過影響艾滋病毒復(fù)制的多個(gè)步驟來阻止艾滋病毒感染[6].
三維定量構(gòu)效關(guān)系(3D-QSAR)[7]是以配體和靶點(diǎn)的三維結(jié)構(gòu)特征為基礎(chǔ),探索生物活性分子的三維構(gòu)象性質(zhì)[8],通過圖形精確地反映生物活性分子與受體相互作用的能量變化,更深刻地揭示藥物與受體相互作用的機(jī)理.其中傳統(tǒng)的兩種方法分別為比較分子相似因子分析法(CoMSIA)[9]和比較分子力場(chǎng)分析法(CoMFA)[10],而新一代的易位體比較分子場(chǎng)分析法(Topomer CoMFA)[11]是Topomer和CoMFA技術(shù)的結(jié)合,它的優(yōu)點(diǎn)是快速、高效和易操作.在原文獻(xiàn)[12]對(duì)37個(gè)吡唑啉嘧啶類IL-2誘導(dǎo)T細(xì)胞激酶抑制劑CoMFA和CoMSIA的3D-QSAR研究基礎(chǔ)上,本文則采用Topomer CoMFA方法進(jìn)行3D-QSAR研究,得到了較原文獻(xiàn)更好的結(jié)果,并在此基礎(chǔ)上進(jìn)行了分子設(shè)計(jì)和分子對(duì)接,為藥物的設(shè)計(jì)研制提供了新的理論指導(dǎo).
本文的37個(gè)吡唑啉嘧啶類IL-2誘導(dǎo)T細(xì)胞激酶抑制劑來源于文獻(xiàn)[12].所有化合物的分子結(jié)構(gòu)見圖1,37個(gè)抑制劑的結(jié)構(gòu)和生物活性值見表1,數(shù)據(jù)集隨機(jī)地劃分為訓(xùn)練集與測(cè)試集兩部分,其中訓(xùn)練集為30個(gè)化合物,用于建立3D-QSAR模型,測(cè)試集為7個(gè)化合物,用于驗(yàn)證模型的預(yù)測(cè)能力.所有化合物的生物活性用pIC50(-logIC50)表示,IC50為抑制劑的半抑制濃度.

圖1 Itk抑制劑化合物骨架Fig.1 Itk inhibitor compound skeleton
利用分子動(dòng)力學(xué)程序Minimize對(duì)化合物進(jìn)行能量優(yōu)化,優(yōu)化過程采用Tripos力場(chǎng)、powell能量梯度和Gasteiger-Huckel電荷[11],將迭代系數(shù)設(shè)置為1000次,能量收斂梯度值設(shè)為0.005 kcal/mol,并將RMS設(shè)為0.005,其余參數(shù)采用SYBYL-X 2.0默認(rèn)值[13].
以活性值最高的22號(hào)化合物作為模板分子,切割方式如圖2所示,保留Itk抑制劑化合物的核心骨架.對(duì)訓(xùn)練集中30個(gè)化合物進(jìn)行切割,生成Ra和Rb基團(tuán),通過對(duì)其周圍立體場(chǎng)和靜電場(chǎng)的結(jié)構(gòu)表征,采用偏最小二乘法(PLS)[14]實(shí)現(xiàn)模型擬合,研究化合物三維結(jié)構(gòu)與其生物活性之間的關(guān)系,生成3D-QSAR模型.采用留一法交互驗(yàn)證[15]評(píng)價(jià)模型的內(nèi)部預(yù)測(cè)能力,外部測(cè)試集驗(yàn)證模型的外部預(yù)測(cè)能力[16].
表1 Itk抑制劑的結(jié)構(gòu)與生物活性值
Table 1 Structures and pIC50values of derivatives used for modeling

No.R1Exp.pIC50Pred.pIC50Residual1對(duì)甲苯甲醚5.355.36-0.0124-甲基三氟甲苯4.284.32-0.0433-甲基三氟甲苯4.754.79-0.0443-三氟甲氧基甲苯5.185.32-0.1453,4-二甲氧基甲苯4.674.640.0364-甲基芐醇5.986.01-0.0372-甲氧基-5-甲基吡啶4.644.620.0282-(甲基氨基)-5-甲基吡啶4.994.940.0593-甲基喹啉5.014.960.05106-甲基喹啉5.135.020.11114-甲基喹啉4.694.78-0.1112甲基對(duì)甲苯亞楓4.664.620.04133-甲基三氟甲苯6.726.710.0114對(duì)甲苯甲醚6.746.740.0015間甲苯甲醚6.706.660.0416對(duì)氟苯甲醚6.146.130.01173,4-二氟甲苯5.855.87-0.02182,4-二氟甲苯6.286.260.02192,5-二甲基吡啶6.146.15-0.01206-甲基-3-氟吡啶5.996.02-0.03214-異丙基甲苯8.007.950.05221-異丙基-2,4-二甲基苯8.708.760.06234-乙基三氟化苯6.706.440.26244-乙基苯甲腈5.395.60-0.21255-乙基-2-(三氟甲基)吡啶5.825.96-0.14261-乙基-4-氟苯5.615.560.05274-氟丙苯5.765.760.0028甲基環(huán)己烷4.964.900.06291,1,1-三氟丙烷4.444.390.05303-叔丁基甲苯7.157.170.0231*間甲苯甲醚5.605.290.3132*對(duì)三氟甲氧基甲苯4.674.85-0.1833*3,4-(亞甲二氧基)甲苯5.084.740.3434*5-甲基嘧啶5.004.790.2135*3,5-二氟甲苯6.686.000.1836*對(duì)叔丁基甲苯8.007.170.8337*4-乙基苯甲醚5.195.34-0.15
注:*代表測(cè)試集化合物

圖2 模板分子的切割方式Fig.2 Cutting mode for template molecules
分子對(duì)接是通過受體的特征以及受體和藥物分子之間的相互作用方式來進(jìn)行藥物設(shè)計(jì)的方法.本文采用Surflex-dock分子對(duì)接技術(shù)對(duì)新設(shè)計(jì)的分子與Itk三維晶體[17]的作用模式和機(jī)制進(jìn)行研究.首先對(duì)原型分子進(jìn)行可行性驗(yàn)證,并作為參考,之后將活性值最高的分子以及新設(shè)計(jì)的分子與蛋白晶體進(jìn)行對(duì)接,比較其打分函數(shù),篩選出較好的分子.打分函數(shù)用Total-Score、Crash和Polar表示[18].通常情況下,Total-Score為總的打分函數(shù),表示受體與配體的親和能力,分值越高越好;Crash絕對(duì)值越接近零,表示配體與受體對(duì)接時(shí)的不適當(dāng)程度越小;Polar為極性函數(shù)得分,當(dāng)結(jié)合位點(diǎn)位于分子表面時(shí),分值越高越好;當(dāng)結(jié)合位點(diǎn)位于分子內(nèi)部時(shí),分值越低越好[19].
Topomer CoMFA模型的統(tǒng)計(jì)結(jié)果見表2,其中擬合相關(guān)系數(shù)r2、交互驗(yàn)證相關(guān)系數(shù)q2分別為0.994和0.728,標(biāo)準(zhǔn)估計(jì)誤差SEE為0.097.在統(tǒng)計(jì)學(xué)中,一般情況下當(dāng)r2>0.6,q2>0.5時(shí),說明所建立的模型具有統(tǒng)計(jì)學(xué)意義[19].因此本文中所建立的Topomer CoMFA模型有較好的穩(wěn)定性和預(yù)測(cè)能力,對(duì)應(yīng)37個(gè)化合物的預(yù)測(cè)活性值見表1.圖3為37個(gè)化合物實(shí)驗(yàn)活性值與預(yù)測(cè)活性值的線性回歸圖,圖中所有點(diǎn)均勻分布在45°線附近,表明所建立的模型有較強(qiáng)的預(yù)測(cè)和擬合能力.

表2 Topomer CoMFA建模結(jié)果

圖3 Topomer CoMFA 模型實(shí)驗(yàn)值與預(yù)測(cè)值的線性回歸圖Fig.3 Linear regression of experimental and predicted activities based on the Topomer CoMFA model
以活性值最高的22號(hào)化合物為模板,進(jìn)行三維等勢(shì)圖分析.圖4中(a)、(b)分別為Rb基團(tuán)的立體場(chǎng)和靜電場(chǎng)三維等勢(shì)圖.一般情況下,在立體場(chǎng)中黃色區(qū)域部分取代基基團(tuán)體積減小或者綠色區(qū)域部分取代基基團(tuán)體積增大分子活性均會(huì)增加.在靜電場(chǎng)中紅色區(qū)域加入帶負(fù)電的基團(tuán)或者藍(lán)色區(qū)域加入帶正電的基團(tuán)分子活性均會(huì)增加.
從圖4(a)中可以看出,Rb基團(tuán)中苯環(huán)上的1、2位有大片的綠色區(qū)域,表明此處引入大體積的取代基有利于增加活性,例如:22號(hào)化合物(pIC50=8.70)苯環(huán)2位上的甲基比21號(hào)化合物 (pIC50=8.00)苯環(huán)2位上的氫基體積大,活性顯著增加.除此之外,可以看到Rb基團(tuán)中苯環(huán)的5、6位被黃色區(qū)域所包圍,表明此處引入體積較小的基團(tuán)可以增加分子活性,例如:16號(hào)化合物(pIC50=6.14)苯環(huán)6位上的氫基相比17號(hào)化合物(pIC50=5.85)6位上的氟基體積小,因此活性有所增加.
從圖4(b)中可以看出,Rb基團(tuán)中苯環(huán)上2、5位有大片的藍(lán)色區(qū)域,表明此處引入帶正電的取代基有利于增加活性,例如:16號(hào)化合物(pIC50=6.14)苯環(huán)2位的H取代了17號(hào)化合物(pIC50=5.85)苯環(huán)2位的F,活性有所增加.除此之外,可以看到Rb基團(tuán)中苯環(huán)4號(hào)位上的-NH-附近被紅色區(qū)域包圍,表明此處引入帶負(fù)電的基團(tuán)可增加活性,例如:27號(hào)化合物(pIC50=5.76)與26號(hào)化合物(pIC50=5.61)相比在苯環(huán)4號(hào)位附近多了一個(gè)帶負(fù)電的-CH2-,因此活性有所增加.

圖4 Topomer CoMFA三維等勢(shì)圖(a)Rb立體等勢(shì)圖;(b)Rb靜電等勢(shì)圖.Fig.4 3D contours of Topomer CoMFA model(a) steric contour map of Rb;(b) electrostatic contour map of Rb.
利用Topomer Search對(duì)Rb基團(tuán)進(jìn)行虛擬篩選,挑選出貢獻(xiàn)值高且最大間距接近185的Rb基團(tuán)10個(gè).形成10個(gè)新分子,并對(duì)這10個(gè)新分子進(jìn)行活性預(yù)測(cè),最終保留活性高于22號(hào)模板分子的4個(gè)新分子和接近的2個(gè)新分子,分子結(jié)構(gòu)及預(yù)測(cè)活性值見表3.
利用Surflex-Dock技術(shù)進(jìn)行分子對(duì)接,對(duì)接所使用的蛋白酶晶體結(jié)構(gòu)來源于PDB數(shù)據(jù)庫,其PDB ID為:4CHU,對(duì)接模式為SFXC.對(duì)蛋白酶進(jìn)行分子對(duì)接前,把蛋白大分子中的晶體結(jié)構(gòu)從共晶配體中取出來,然后再用分子對(duì)接技術(shù)把晶體結(jié)構(gòu)重新接入共晶配體中,并且以原來的配體作為參考,如圖6所示,可以看到晶體結(jié)構(gòu)的構(gòu)象與配體對(duì)接后的構(gòu)象幾乎重疊.表明4CHU可以用來對(duì)新設(shè)計(jì)的分子進(jìn)行分子對(duì)接.
表3 新設(shè)計(jì)分子的結(jié)構(gòu)和pIC50值預(yù)測(cè)
Table 3 Structures and predicted pIC50values of new designed molecules

No.StructurePred.pIC50019.32029.14038.89048.79058.64
晶體結(jié)構(gòu)進(jìn)行預(yù)處理:加氫、加電荷、抽取原有配體、除去水分子和其他殘基及末端殘基.處理后的原型小分子與蛋白大分子的作用模式如圖5所示.

圖6 晶體結(jié)構(gòu)中共晶配體構(gòu)象與對(duì)接構(gòu)象疊合圖(綠色棒狀表示共晶配體對(duì)接構(gòu)象,紅色棒狀表示共晶配體構(gòu)象)Fig.6 Convergence of co-crystal ligand conformation and butt conformation in crystal structure (green bar indicates co-crystal ligand docking conformation, red bar indicates co-crystal ligand conformation)
將新設(shè)計(jì)的6個(gè)分子分別與蛋白大分子對(duì)接,其中01、02、03、04號(hào)分子總打分函數(shù)Total-score值大于6.通過01、02、03、04號(hào)分子分析Itk抑制劑與蛋白大分子的作用.圖7為分子對(duì)接的結(jié)果,圖中黃虛線代表氫鍵,綠色的代表氨基酸殘基,剩余部分則代表配體.表4為對(duì)接模型具體數(shù)值結(jié)果.
圖7(a)表示01號(hào)分子配體與氨基酸殘基形成了3個(gè)氫鍵,其中A/LYS391與配體中N的氫鍵距離為2.791 ?,A/MET438與配體中O的氫鍵距離為1.819 ?,與配體中H的氫鍵距離為2.608 ?.

表4 分子對(duì)接結(jié)果
圖7(b)表示02號(hào)分子配體與氨基酸殘基形成了5個(gè)氫鍵,A/LYS391與配體中的O形成了2個(gè)氫鍵,距離分別為2.550 ?和2.322 ?,A/MET438與配體中N的氫鍵距離為2.228 ?,A/SER371與配體中H的氫鍵距離為1.958 ?,A/ARG486與配體中H的氫鍵距離為1.977 ?.
圖7(c)表示03號(hào)分子配體與氨基酸殘基形成了6個(gè)氫鍵,A/ASP500與配體中的O形成了4個(gè)氫鍵,距離分別為2.153 ?、2.393 ?、2.519 ?和2.108 ?,A/MET438與配體中的N的氫鍵距離為2.134 ?,A/GLU436與配體中H的氫鍵距離為2.398 ?.
圖7(d)表示04號(hào)分子配體與氨基酸殘基形成了5個(gè)氫鍵,A/GLU436與配體中H的氫鍵距離為1.982 ?,A/MET438與配體中N的氫鍵距離為2.259 ?,A/CYS442與配體中O的氫鍵距離為1.838 ?,A/LYS391與配體中N形成了兩個(gè)氫鍵,氫鍵離分別為2.883 ?和2.544 ?.通過對(duì)分子對(duì)接圖分析,配體一般會(huì)與A/LYS391、A/MET438這兩個(gè)氨基酸殘基之間形成氫鍵.
為比較新設(shè)計(jì)分子與原分子對(duì)蛋白大分子的適配程度,此處選用原數(shù)據(jù)集中活性最高的22號(hào)分子進(jìn)行分子對(duì)接,結(jié)果如圖8所示.從圖中可以看到配體與氨基酸殘基形成了2個(gè)氫鍵,A/LYS391與配體中N的氫鍵距離為2.251 ?,A/GLN373與配體中O的氫鍵距離為2.092 ?.所以新設(shè)計(jì)的分子與原數(shù)據(jù)集中的分子相比與大蛋白的適配程度更高,結(jié)合更穩(wěn)定,藥物藥物抑制病毒的作用也就更好.

圖7 a) 01號(hào)分子與4HCU氫鍵作用;b) 02號(hào)分子與4HCU氫鍵作用;c)03號(hào)分子與4HCU氫鍵作用;d) 04號(hào)分子與4HCU氫鍵作用(綠色棒狀表示氨基酸殘基,紫色虛線表示氫鍵)Fig.7 a) Hydrogen bonding between molecule No.01 and 4HCU; b) hydrogen bonding between molecule No.02 and 4HCU; c) hydrogen bonding with molecule No.3 and 4HCU; d) hydrogen bonding with molecule No.04 and 4HCU (green bar indicates amino acid Residue, purple dotted line indicates hydrogen bond)

圖8 原訓(xùn)練集22號(hào)分子與4HCU氫鍵作用Fig.8 Hydrogen bonding of the 22nd molecule and 4HCU in the original training set
本文采用Topomer CoMFA對(duì)37個(gè)吡唑啉嘧啶類IL-2誘導(dǎo)T細(xì)胞激酶抑制劑進(jìn)行構(gòu)效關(guān)系建模,建立了3D-QSAR模型,其q2為0.728,r2為0.994,SEE為0.097.證明該模型對(duì)化合物活性具有可靠預(yù)測(cè)能力.之后通過對(duì)研究模型立體場(chǎng)和靜電場(chǎng)的三維等勢(shì)圖分析,確定了細(xì)胞激酶抑制劑的改造位點(diǎn);進(jìn)而設(shè)計(jì)出具有較高活性的4個(gè)細(xì)胞激酶抑制劑化合物,并通過分子對(duì)接探究配體和受體蛋白之間的作用關(guān)系,探明新設(shè)計(jì)的4個(gè)具有較高活性細(xì)胞激酶抑制劑與Itk蛋白的A/LYS391、A/MET438位點(diǎn)作用顯著,為設(shè)計(jì)吡唑啉嘧啶類抗感染性藥物提供了思路.