張博,何依然,劉迎春,王琦
(浙江大學化學系,浙江杭州310027)
四鏈體是核酸的一種非經典二級結構,由序列富含鳥嘌呤堿基(G 堿基)的DNA 分子構成。四鏈體通常由四段單鏈DNA 組成,每一段單鏈DNA 序列含有2~4個連續的G堿基,稱為G片段。在每個G片段內,相鄰的G堿基相互堆疊,形成層狀結構。而在四個單鏈DNA 分別形成的G 片段之間,在空間結構上能夠共面的G 堿基則以4 個為一組,通過氫鍵結合,形成正方形平面結構,稱為G 平面,如圖1 所示[1]。通過實驗所得G-四鏈體構象發現,一個G-四鏈體結構通常含有2~4個相互堆積的G 平面。在兩個G 平面之間的中心區域,通常存在一個一價陽離子,可以與G平面堿基富集的π電子相互作用,穩定G平面結構。

圖1 G平面中的Hoogsteen配對Fig.1 Hoogsteen pairing in G-quartet
G-四鏈體能夠引起廣泛關注是由于其結構特性與癌癥的發生、發展密切相關。通過研究表明,基因的核心區或啟動子區存在多種能形成G-四鏈體結構的DNA 序列,這些序列在調控細胞微環境過程中起到多種關鍵的作用,如促進組織浸潤和轉移、促使細胞無限增殖、逃避凋亡等[2]。其中,Pu22 DNA G-四鏈體是人源原癌基因c-myc 啟動子區域G-四鏈體的常用研究模型之一[3],其原型DNA 序列Pu27是人DNA上與癌癥有關的一個重要片段,它在生物學中是細胞骨髓細胞癌基因(cellularmyelocytomatosis oncogene,簡稱c-myc)的重要組成部分。該種基因編碼的核蛋白稱為myc 蛋白,可用于進行轉錄,對細胞增殖起到重要的作用。分子生物學研究表明,myc 蛋白會與MAX(myc-associated factor X)蛋白發生二聚,進而結合到多種與細胞增殖相關的基因的E-box(enhancer box)區域上,對目標基因的轉錄過程起調控作用[4]。c-myc 基因在正常組織中的表達受到上游信號的嚴格調控。正常細胞在一個細胞周期中,myc 蛋白水平在細胞由靜止期轉向有絲分裂開始(G0/G1)時急劇上升,然后回落到基線水平[5]。而在血液腫瘤[6]以及胃癌[7]、肝癌[8]、宮頸癌[9]等多種人類實體腫瘤組織的癌變細胞中,c-myc 基因呈現異常的高表達狀態,說明c-myc基因與腫瘤的發生和發展關系密切。
由于myc蛋白在腫瘤細胞生長增殖過程中有著特殊影響,對此進行了許多以其為核心的抗癌策略研究。例如:抑制myc 基因的表達,阻止myc 蛋白與MAX 蛋白之間的二聚,阻止myc-MAX 二聚物與DNA 結合,保護與二聚物可能發生作用的主要幾種目標基因等。其中,通過設計藥物配體結合myc 基因啟動子區域的G-四鏈體序列,以干擾其正常生理功能,是目前受到較多關注的一種策略。腫瘤細胞的myc 基因的功能受到干擾以后,可以使癌細胞難以攝取養分,影響生物物質合成,細胞周期停滯,還可能誘導細胞凋亡的發生。因此,G-四鏈體與小分子配體的結合可以阻止癌細胞增殖。
在G-四鏈體的配體中,雜環生物堿作為一類具有藥用價值的特異性結合配體,引起了許多研究者的關注。這些可以作為G-四鏈體配體的雜環生物堿主要包括喹啉衍生物、吖啶與吖啶酮衍生物、異喹啉及其衍生物等雜環化合物[10]。異喹啉類生物堿是眾多含有異喹啉結構單位的生物堿及其衍生物的統稱,包括:原小檗堿類、苯駢菲啶類、阿樸啡類、雙芐基異喹啉生物堿等。異喹啉生物堿來源于自然界中的某些藥用植物,是生物堿中分布最廣、種類最豐富的一種,有著非常多樣的生理活性。因此異喹啉生物堿作為藥物有獲取成本低的優勢。目前亦發展了較多有關異喹啉生物堿的合成與修飾手段。所以,異喹啉類生物堿對于藥物篩選是一個很有價值的化合物庫。
有關Pu22 DNA G-四鏈體與異喹啉類生物堿結合過程的機制的研究中,成效較為卓著的有小檗堿及衍生物對c-myc 基因表達效應的一系列研究[11]。在基于兩者結合特質的工具性應用中,文獻也報道了利用小檗堿、血根堿、白屈菜紅堿等異喹啉配體與Pu22 DNA G-四鏈體的競爭結合,構成核酶適配體,建立生物熒光檢測方法[12]?;谀壳暗膶嶒炁c模擬研究,已知異喹啉類生物堿與G-四鏈體的作用類型主要包括π-π 堆積、靜電作用、小溝作用、疏水作用等,方式主要可分為外部堆積與插入式兩大類別[13]。分子模擬中發現配體主要可以通過非共價鍵作用,結合在G-四鏈體的堿基、尾端G 平面或兩者之間,分別可稱為堿基堆積、尾端堆積、夾心式堆積。
目前已經有一些研究通過結合分子動力學模擬的方法,對G-四鏈體及配體的結合機制進行考察。如Verma 等[14]用分子對接和其他分析表征手段研究了c-myc G-四鏈體和硫磺素T的結合機制。Li等[15]提出過自身結構不是平面的配體在G-四鏈體上的結合方式。另有Li 等[16]、Huang 等[17]拓展了G-四鏈體配體種類的界限,結合分子動力學模擬方法研究了甾體類小分子和G-四鏈體的結合機制。因此,結合計算機模擬的手段,對原癌基因啟動子區域的G-四鏈體與配體結合進行分子動力學研究,可以提供更多有關結合動力學過程、配體-受體各部分相互作用與構效關系的信息,對靶向抗癌藥物的設計提供指導性建議。
實驗選取了表1所示的四種具有相關性的異喹啉類生物堿作為研究對象,其中,血根堿是一種研究較多的典型G-四鏈體配體。在作為G-四鏈體配體的研究中,已經被證實為有效配體的還有二氫血根堿。其余兩種未見作為G-四鏈體配體的研究或報道。四種配體在生理活性上均有細胞毒性,在細胞實驗中顯示促進癌細胞凋亡或抑制癌細胞代謝的功能。
為了考察配體結構對配體與G-四鏈體結合作用的影響,在選取四種異喹啉類生物堿時考慮了分子結構的相關性和差異性(圖2)。其中,二氫血根堿為血根堿的二氫還原產物,白屈菜堿的母核為血根堿母核的四氫還原產物,南天寧堿的母核中環的排布則與其他三種不同,分別用來考察電性、平面結構及母核對作用的影響。

表1 本工作選取的四種異喹啉類生物堿Table 1 Four isoquinoline alkaloids selected in this work
本實驗選取的G-四鏈體結構為Pu22 G-四鏈體DNA 的結構,且結構數據來自于數據庫Protein Data Bank 上的結構文件(PDB ID:1XAV)[22]。配體的分子結構根據文獻由GaussView 繪制,初始構型經過Gaussian09 軟件的優化,并獲得凈電荷等參數[23]。
模擬中對DNA 分子采用的是parmbsc1 力場[24]。這種力場是AMBER 力場的一種優化版本,其對G-四鏈體等一些核酸的特殊結構具有一定的適用性。對配體采用的力場為GAFF(general AMBER force field)[25],是一種廣泛用于藥物分子研究的力場,包含了更多用于描述有機物基團的參數。
在構建體系時,DNA 分子被放置于邊長為6 nm的立方盒中心,隨機插入5 個同種配體,然后使用TIP3P 模型的溶劑水分子進行溶劑化填充,最后向體系加入鉀離子、氯離子以使體系成為電中性,體系濃度為生理濃度0.1 mol/L。

圖2 四種異喹啉類生物堿的分子結構Fig.2 Molecular structure of four isoquinoline alkaloids
模擬體系構建完成后,采用Gromacs 4.5 對體系進行分子動力學模擬[26]。每個G-四鏈體-配體體系首先分別采用能量最小化處理,然后先后在NVT、NPT 系綜條件下分別進行時長為0.2、0.5 ns 的預平衡。最后運行時間長度為80 ns 的分子動力學模擬。其中,模擬時間步長為2 fs,并采用了周期性邊界條件。體系溫度設置為310 K,并用Nose-Hoover 恒溫方法進行控制[27-28],氣壓為1 bar (1 bar = 100 kPa),并采用Parrinello-Rahman 恒溫方法進行控制[29],其中等壓恒溫系數為4.5×10-5bar-1。相互作用能的計算包含Lennard-Jones 勢能和庫侖勢能,兩者的截斷半徑均設為1.0 nm,通過Lorentz-Berthelot 法計算非鍵作用,可以獲得Lennard-Jones 勢能[30]。而長程庫侖作用則采用PME(particle mesh Ewald)進行計算[31]。最終構象及軌跡的可視化部分使用VMD 軟件完成。
實驗選取的四種異喹啉生物堿中,血根堿與白屈菜堿已有實驗證據或計算模擬證明具有和G-四鏈體結合的能力[32]。為檢測在分子模擬環境下四種異喹啉類生物堿是否都能與G-四鏈體進行很好的結合,實驗首先考察了模擬時間內,體系中所有異喹啉生物堿和G-四鏈體DNA 的總相互作用能變化。計算相互作用能的結果(圖3)顯示,四種體系在80 ns 的平衡模擬中,總相互作用能的趨勢進入一個相對平穩階段,說明四種異喹啉和G-四鏈體都可以形成較為穩定結合。相互作用能的總值在-400~-600 kJ/mol 之間,說明四種異喹啉配體和G-四鏈體之間可以形成比較強的相互作用。
通過分析結合過程中的運動軌跡和結合過程中的瞬時構象,如圖4所示,可以觀察到異喹啉類配體和G-四鏈體的結合主要存在如下四種獨立的結合區域:頭部(5'端)G 平面,側面的7 號T 堿基(T7)、11 號T 堿基(T11),尾部(3'端)的21 號A 堿基(A21)。主要分為兩種類型:G 平面與G 平面外的獨立堿基。且在結合過程中,每個結合的藥物分子都能夠分別與特定的單個結合區域進行結合。計算配體平面到堿基平面的距離以及四個結合區域上配體-堿基的相互作用,可以發現配體均處于堿基發生π-π 作用的范圍內與堿基相互作用,且Lennard-Jones 勢是相互作用的主要貢獻者。

圖3 四種異喹啉配體和G-四鏈體的相互作用能Fig.3 Interaction energy of four isoquinoline ligands and G-quadruplex

圖4 異喹啉配體在G-四鏈體上的四個結合區域Fig.4 Four binding regions of isoquinoline ligand on Gquadruplex
T7、T11 和T21 三個堿基均分布于G-四鏈體的外圍。模擬的軌跡顯示,與G-四鏈體上其他非G 平面上的堿基比較,這三個堿基的活動較少受到G 平面的限制,持續發生振動和翻轉。這一特點使這三個結合區域的堿基與異喹啉配體有較多的作用機會。
對四種結合區域上結合發生的概率(圖5)、配體-結合區域的平均相互作用能(圖6)進行統計和計算。統計分析對每種體系進行三次平行實驗模擬的結果顯示,各藥物分子與G-四鏈體結合時相互獨立,G-四鏈體存在與多個藥物在不同位點同時結合的情況,且每個作用區域最多只能結合一個藥物分子,不存在多個藥物分子作用同一位點的情況。位于G-四鏈體5'端的G 平面,是上述四種位點中,結合發生的概率最高、平均相互作用能最強的位點。因此,上述四種結合區域相互獨立,且最具優勢的結合區域是G平面。配體與G平面的結合機理將進行進一步探討。
為進一步探究配體在G 平面區域內的作用細節,對配體與G 平面作用構象以及能量進行了進一步探究。首先通過模擬得到的軌跡,分析比較了G平面在與異喹啉類結合后自身構象的變化。如圖7所示,G平面在與白屈菜堿配體發生結合時,構象由平面變化為向中心塌陷。這一形變可能是在白屈菜堿配體非平面的分子結構的影響下發生的。而G平面在與實驗中其余三種分子結構為平面型的配體結合時,自身平面的構象基本不變。

圖5 配體結合在四種位點上的概率Fig.5 Probability of ligand binding at four sites

圖6 四個結合位點和相應配體的相互作用能Fig.6 Interaction energies of four binding sites and corresponding ligands
同時,觀察結合構象可得,由于異喹啉配體的分子尺寸僅有G平面的大約一半大小,在G平面上,配體通常只與G平面上的兩個堿基結合。在結合狀態下,配體在G 平面上方的區域可能會有小幅度的左右運動或旋轉,調整自身的取向,但觀察到最多的狀態是異喹啉配體與G平面上的8號G堿基(G8)、13號G堿基(G13)結合。
為進一步研究配體在G 平面上的主要作用位點,實驗將G 平面上的四個G 堿基及其所帶的脫氧核糖和磷酸部分,分別作獨立的原子組,計算每個部分對配體的作用能大小。
計算血根堿、二氫血根堿以及南天寧堿與G 平面各堿基的相互作用能的結果(圖8)顯示,在配體與G 平面區域形成較為穩定的結合以后,配體與G平面的相互作用能在表觀上基本保持不變。而G平面的各個部分對配體的作用,由于配體在G 平面上發生一定范圍內的平行運動,產生交替,基本符合此增彼減的趨勢。

圖7 四種異喹啉配體和G平面的結合構象Fig.7 Binding conformation of four isoquinoline ligands and G-quartet
配體與G平面各部分相互作用能的分析結果顯示,在構成G平面的四個G堿基中,與配體的作用能較強的是8 號、13 號G 堿基。這個發現支持異喹啉生物堿傾向于8 號G 堿基、13 號G 堿基結合位置這一現象。產生這種結果可能是因為5'端G平面附近存在5'末端的堿基對配體與4 號、17 號G 堿基的結合構成了空間位阻效應。以上結論表明,G 平面附近5'末端的堿基對配體在G平面上的結合存在一定的引導作用。
另外對于前述的特例白屈菜堿,為了進一步探究配體分子結構對結合構象的影響,通過控制橋頭碳原子手性、設置位阻兩種方式,設計得到了具有類似白屈菜堿的不共面結構的兩種配體Z01、Z02,如圖9 所示。其中Z01 在與G-四鏈體的結合構象中,顯示了與白屈菜堿比較類似的結果。Z01 由于具有和白屈菜堿類似的非平面結構,和G 平面結合后,使G 平面發生了變形。由于Z01 和其中個別G堿基的作用能較大,Z01 還破壞了G 平面的完整性,如圖10 所示。而Z02 由于位阻較小,不能使配體核心保持剛性的立體結構,因而在與G-四鏈體進行結合的過程中,傾向于平面結合。
在Z01 與G 平面結合的模擬過程中,G 平面由原先的平面正方形結構不斷變化,形成了鍵角在68°~108°,二面角平均近30°,鍵長也相應增加的立體構型(圖11)。其中,在30 ns 時,G 平面形變程度最大。G 平面4 個殘基間能量的變化(圖12)也說明了Z01 分子能夠減少G 平面4 個堿基間的相互作用,對G平面的穩定性產生一定影響。

圖8 異喹啉配體和G平面上各個堿基的相互作用能Fig.8 Interaction energy between isoquinoline ligands and each base on G-quartet

圖9 白屈菜堿及設計配體構象Fig.9 Conformation of CHL and designed ligands

圖10 Z01與G平面的結合構象Fig.10 Conformation of Z01 bound to G-quartet
為綜合考察G-四鏈體的5'末端堿基對異喹啉配體-DNA 結合的影響,比較了同一種配體在G 平面這一結合區域中,形成的兩種穩定結合構型。
如圖13 所示,在結合構型A 中,G-四鏈體的5'末端堿基和血根堿分子的距離較遠,沒有堿基在ππ 作用的距離范圍內。構型B 中,G-四鏈體的5'末端和血根堿配體的距離較近,存在位于π-π 作用的距離范圍內的堿基,可能與之發生π-π 作用。處于構型B 的G-四鏈體與血根堿的結合區域,實際上并非僅僅G平面,而是一個形似口袋的結構,由G平面構成“口袋”的下半部分,由5'末端構成“口袋”的上半部分。而在構型A中,這種“口袋”并未完全形成,但也可以使異喹啉配體和G-四鏈體達到穩定結合的狀態。隨著5'末端的自由運動,當其與G 平面上的藥物分子進行相互作用,就可由構型A 轉換成構型B。

圖11 模擬過程中G平面結構變化示意圖Fig.11 Schematic diagram of G-quartet structure changes during simulation
分別計算兩種構型與G-四鏈體相互作用能,并與血根堿配體和G 平面、5'末端、G-四鏈體整體的相互作用能大小進行比較(圖14),得出兩種結合構型下,G 平面與血根堿的結合作用能基本相等,而5'末端和血根堿的相互作用能在構型B中明顯比構型A 大,導致了以構型B 與G-四鏈體結合的配體與DNA 分子的總相互作用能,比以構型A 結合的配體的結合作用能強。因此,5'末端與配體的相互作用,具有增加配體和G-四鏈體的結合強度的作用。

圖12 與Z01結合過程中G-平面四個堿基相互作用能變化示意圖Fig.12 Schematic diagram of interaction energy change of four bases in G-quartet during binding with Z01

圖13 血根堿在G平面上結合的兩種結合構型Fig.13 Two configuration of SAU binding with G-quartet

圖14 兩種結合構型中G-四鏈體不同部分的作用能比較Fig.14 Comparison of action energies of different parts of Gquadruplex in two binding configurations
為進一步研究5'末端各個堿基在作用中的貢獻大小,分別計算了結合構型B 狀態下5'末端每個堿基和血根堿的Lennard-Jones 勢的大小。如圖15結果顯示,5'末端的1號T堿基和血根堿的范德華作用能最強,可達到-40 kJ/mol。

圖15 構型B中5'端各個堿基對血根堿的作用Fig.15 Interaction of 5'terminal bases on SAU in configuration B
以上結果說明,5'末端不僅對異喹啉在G 平面上主要結合的堿基有引導性的影響,其中某些堿基也可以直接與配體發生π-π 作用,增加配體與G-四鏈體總相互作用強度。這種作用有助于配體和G-四鏈體的結合。
本論文通過分子動力學模擬G-四鏈體與異喹啉類藥物分子結合的過程,分析了兩者結合的能量、作用類型以及結合位點,闡述了異喹啉類藥物與G-四鏈體的結合機理,為設計能夠與G-四鏈體結合的抗癌藥物提供了有用的信息。結論具體如下。
(1)通過模擬軌跡與能量分析發現,G-四鏈體能夠與多種異喹啉類生物堿進行穩定結合,且結合的主要作用為π-π 作用,主要位點為G 平面的G8、G13兩個堿基。
(2)在G-四鏈體與異喹啉類生物堿配體結合過程中,異喹啉類生物堿的空間構型能夠影響結合的G平面穩定性。
(3)G-四鏈體的5'末端能夠增強配體與G-四鏈體的穩定結合。
(4)異喹啉類生物堿自身的空間結構會對G-四鏈體穩定性產生影響,對于靶向破壞含G-四鏈體的DNA 結構方向有潛在的價值,然而其他種類及特征的藥物與G-四鏈體的結合情況以及藥物結合與藥物分子的結構關系還有待進一步探究。