魏思昂,丁志文,馮 焱
(1.山西農業大學生命科學學院,太谷 030801;2.復旦大學中山醫院上海市心血管病研究所,上海 200032)
細胞代謝和能量供求異常被認為是心血管疾病發生的一個特征[1-3]。葡萄糖、谷氨酰胺、脂肪酸和氨基酸是細胞生長和維持功能的主要驅動力,同時也是己糖胺生物合成途徑(hexosamine biosynthesis pathway, HBP)的底物。在有氧條件下,代謝需求低的細胞利用氧化磷酸化合成三磷酸腺苷,但是高代謝需求的細胞,如腫瘤細胞和重塑的心肌細胞,通過改變葡萄糖、谷氨酰胺、脂肪酸和氨基酸等HBP底物的利用效率產生必要的ATP 維持細胞的能量代謝和需求[4-5]。HBP是葡萄糖代謝的一個分支,它為糖基化修飾提供了一種底物,從而對細胞功能有廣泛的影響[6]。此外,HBP引起蛋白質的翻譯后修飾,有助于合成復雜分子,如糖脂、蛋白多糖等。而HBP的途徑關鍵基因的上調或下調則會心血管組織、器官生理條件下的異常,調控O-GlcNAC 糖基化修飾下游蛋白,引起癌細胞轉化和侵襲能力增強、炎癥因子水平升高、糖代謝紊亂等[7-9]。GFPT2作為HBP信號通路的核心樞紐因子,在癌癥和心肌病細胞的代謝和功能的正常發揮著重要作用。通過調控GFPT2的表達水平抑制病理條件下HBP信號通路異常,能夠有效緩解和改善疾病的惡化狀況。
2017年,《健康時報》指出,中國大約有1 500萬心肌衰竭患者,慢性心肌衰竭患病率達1.61%,住院病死率占心血管疾病總死亡率的40%,并且50%的心力衰竭患者在診斷后的5年內死亡。截至2018年底,《中國心血管病報告》表明,中國心血管病(cardiovascular disease, CVD)患者高達2.9億,且仍在增加,心血管病患病率及死亡率遠高于其他疾病,心血管病已然成為中國居民疾病死亡的首要原因[10]。心肌肥厚作為心血管事件的獨立危險因素,是許多心臟疾病共同發展的一個重要階段。長期的心肌肥厚會引發心力衰竭或心源性猝,嚴重危害人類的健康[11]。通過降低心肌肥厚的發生可以有效提高中國心血管疾病患者的生存率。
資料表明,進入氨基己糖通路的葡萄糖流量增加,參與胰島素抵抗、胰島素分泌改變甚至糖尿病心肌病的發病機理[12-13]。GFPT2表達水平的上升使得氨基己糖途徑的終末產物UDP-GlcNAc的增加,靶標蛋白絲氨酸和蘇氨酸殘基O-GlcNAC 糖基化水平升高,最終導致心肌病等心血管相關疾病的發生。HBP作為代謝過程的重要環節,與營養攝入密切相關。游離脂肪酸量過高誘發糖酵解異常,更多葡萄糖分流進入HBP途徑,這樣,GFPT表達含量的改變導致代謝缺陷型糖尿病型心肌肥大[14]。
最近研究發現,HBP通路在心臟代謝、肥大、心肌細胞的再生及糖尿病代謝等多種生理和病理過程發揮重要作用。現以GFPT2分子為探討重點,運用生物學軟件對其結構功能及可能參與的信號通路進行預測,為研究其在疾病發生與發展及心肌肥厚相關性提供理論依據。
從NCBI下載相關同源序列,主要包括BosTaurus(牛)、Susscrofa(豬)、Equuscaballus(馬)、Homosapiens(人)、Trachypithecusfrancoisi(猴)、Rattusnorvegicus(大鼠)、Musmusculus(小鼠)、Gallusgallus(雞)、Thamnophiselegans(蛇)、Zootocavivipara(蜥蜴)、Xenopustropicalis(蛙)、Daniorerio(斑馬魚)、Zeugodacuscucurbitae(果蠅)等13個物種的GFPT2蛋白序列進行系統發育樹的構建,采用鄰接法構建系統發育樹并進行校正,校驗參數 Bootstrap 重復1 000次,得到最終的系統發育樹。此外基于SMART軟件對蛋白結構域分析結果進行可視化分析。
從NCBI下載氨基酸對應的核酸編碼序列,比對處理過的序列需經CluctalW(Codons)才可用于正選擇位點預測。選擇datamonkey軟件進行正選擇位點分析,預處理選擇合理的模型預測方法。輸入數據處理為密碼子文件,模型選用聯合分析方法[混合效應-演化模型(mixed effects model of evolution, MEME)和固定效應(fixed effects likelihood, REL)],模式為F81。
從uniprot數據庫中查找GFPT2氨基酸序列,物種為智人,Entry ID為094808。使用SignalP-5.0 Server工具對蛋白序列進行信號肽預測,將獲得的GFPT2氨基酸序列、物種選為真核生物。將除去的信號肽氨基酸序列代入SWISS-MODEL進行構建模型,然后用PYMOL軟件進行模型修飾。
利用GCBI數據庫對人屬GFPT2進行基因本體論(gene ontology,GO)功能富集分析,以了解其分子功能(molecular function, MF)、參與的生物學過程和途徑(biological process, BP)及在細胞中組分和定位(cellular component, CC),并進行KEGG信號通路分析。
GFPT2輸入STRING 數據庫以確定蛋白質-蛋白質相互作用信息(protein-protein interaction information, PPI),應用Cytoscape 3.7.2軟件進一步構建PPI網絡并可視化。基于PPI蛋白網絡涉及基因利用DAVID網站分析模塊基因中關于GFPT2基因參與的信號通路。
使用GENE MANIA將GFPT2相關基因網絡圖可視化,主要包括:物理相互作用、共表達、預測、共定位、途徑、遺傳相互作用、共享蛋白結構域網絡。
利用 GCBI數據庫對GFPT2相關miRNA相互作用關系進行分析。
為了檢測GFPT2蛋白進化過程,利用包含全部結構域的13條氨基酸序列通過鄰近樹的方法構建系統進化樹。對13條氨基酸序列進行組分分析。研究主要分析了人、小鼠、大鼠GFPT2氨基酸組分[圖1(a)~圖1(c)],氨基酸組分差異較小,體現了GFPT2在三者間物種間氨基酸保守性。此外還分析了13個物種間平均氨基酸組成,結果如圖1(d)所示,亮氨酸占比最高為9.86%,含量最低的氨基酸為色氨酸(0.15%),氨基酸組分分析結果也顯示了GFPT2在物種間氨基酸組分均具有保守性。氨基酸長度在447~691,平均長度為664.8個氨基酸。進化樹結果(圖2)顯示,人與其他12 個物種的 GFPT2成員主要可分為2 個聚類,較大的聚類包括:牛、豬、馬、人、猴、大鼠和小鼠。其中人和猴子的親緣性最近,其次是牛、豬、馬和大小鼠,這也符合脊椎動物的分類標準。較小的類包括:雞、蛇和蜥蜴。蜥蜴和蛇的親緣性最近,這與爬行動物分類一致。而蛙、斑馬魚和果蠅距離兩類動物親緣性較遠,這與三者的分類差異有關。根據結構域特征來看,牛、豬、馬、人、猴、大鼠、小鼠雞、蛇、蜥蜴、蛙、斑馬魚和果蠅均包含兩個SIS結構域,說明SIS是GFPT2發揮功能的保守結構域。果蠅作為昆蟲,與其他動物相比多1個low complexity 結構域,這說明隨著高等動物的進化,low complexity 結構域可能被舍棄了。

圖1 GFPT2氨基酸組分分析

圖2 GFPT2不同物種系統進化樹示意圖
研究采用MEME 和REL兩種方法結合的方法對GFPT2正選擇位點預測,共找到8個正選擇位點。分別在比對序列密碼子10、11、23、110、244、259、297和653位置。結果如表1所示。

表1 正選擇位點分析結果
2.3.1 GFPT2高級結構預測模型
種屬為人,蛋白名稱為glutamine-fructose-6-phosphate aminotransferase[isomerizing]2,基因為GFPT2,全長為682。使用SignalP-5.0 Server工具對蛋白序列進行信號肽預測(圖3),將除去的信號肽氨基酸序列帶入SWISS-MODEL進行構建模型,然后用PYMOL軟件進行模型修飾,GFPT2為單鏈氨基酸,高級結構主要包括α螺旋和β折疊,藍色為C端結構域,紅色為N端結構域(圖4)。

圖3 GFPT2信號肽預測結果

圖4 GFPT2 高級結構預測模型
2.3.2 GO富集和KEGG途徑分析
為了確定篩選出來的GFPT2的功能和機制,利用GCBI數據庫對GFPT2進行GO富集和KEGG途徑分析,GFPT2主要集中在GFPT酶活性、蛋白結合、碳水化合物衍生物結合方面發揮作用;細胞中組分和定位于胞漿;參與的生物學過程主要涉及果糖6-磷酸代謝、UDP-N-乙酰氨基葡萄糖代謝、UDP-N-乙酰氨基葡萄糖生物合成工藝、能量儲備代謝、蛋白質N-糖基化、谷氨酰胺代謝、白血病抑制因子的細胞反應(表2)。KEGG 通路分析表明,GFPT2主要參與氨基糖和核苷酸糖代謝,丙氨酸、天冬氨酸和谷氨酸代謝,胰島素抵抗3條信號通路(表3)。

表2 GO 富集分析結果

表3 GFPT2富集參與的信號通路
2.3.3 PPI網絡構建與信號通路解析
為了進一步研究GFPT2與其他蛋白分子的相互作用,從STRING數據庫得到與GFPT2相關的基因使用Cytoscape軟件構建PPI網絡,該網絡結合了11個節點和74個邊緣(圖5),這個網絡模塊基因主要包括:GFPT1、GFPT2、GLUL、GNPDA1、GNPNAT1、GPI、HK1、MPI、PPAT、AMDHD2、CAD。這些基因包含GFPT2參與的信號通路有:氨基糖和核苷酸糖代謝(GPI、AMDHD2、MPI、GNPDA1、GNPNAT1、GFPT1、GFPT2、HK1),丙氨酸、天冬氨酸和谷氨酸代謝(GLUL、GFPT1、GFPT2、CAD、PPAT),抗生素的生物合成(GPI、AMDHD2、GFPT1、GFPT2、HK1、PPAT),代謝途徑(GPI、GLUL、MPI、GNPDA1、GFPT1、GFPT2、HK1、CAD、PPAT)(圖6)。

圖5 GFPT2蛋白質互作網絡圖

圖6 GFPT2富集參與的信號通路
2.3.4 GFPT2相關網絡分析
將GFPT2相關基因網絡圖可視化,物理相互作用基因包括:GFPT2、IPO4、LARS、GFPT1、XPO1、ASNS、EIF2B3、EIF2B5GMPPB、HSPD1、TARSL2、PRKACA、ATP5B、KIAA0368、EEF2、COPB2;共表達網絡基因包括:GFPT2、IPO4、LARS、GFPT1、XPO1、ASNS、EIF2B3、EIF2B5、GMPPB、HSPD1、TARSL2、PRKACA、ATP5B、KIAA0368、EEF2、COPB2、ABCF3、ESF1、IDH3A、PDPN;預測網絡:GFPT2、IPO4、LARS、XPO1、EIF2B3、EIF2B5 GMPPB、HSPD1、TARSL2、PRKACA、ATP5B、KIAA0368、EEF2、COPB2、ABCF3、ESF1、IDH3A;共定位: GFPT2、PDPN;通路途徑:EIF2B3、EIF2B5;共有蛋白質結構域:GFPT2、IPO4、GFPT1、XPO1、ASNS、EIF2B3、EIF2B5、GMPPB、GCKR(圖7)。

圖7 GFPT2與其他蛋白相互作用網絡圖
2.3.5 GFPT2與相關miRNA分析
GCBI數據庫顯示與GFPT2相關的miRNA有24個,miRNA為人源miRNA(HomosapiensmiRNA, hsa-miR),驗證的實驗類型包括:測定序列(sequencing)、微陣列技術(microarray)、光活化核糖核苷增強交聯和免疫沉淀(photoactivatable ribonucleoside-enhanced crosslinking and immunoprecipitation, PAR-CLIP)、雜交的交聯、連接和測序(crosslinking, ligation and sequencing of hybrids, CLASH)。支撐類型:miRNA靶相互作用(MiRNA target interaction, MTI)(表4)。

表4 GFPT2作用相關miRNA
GFPT2是作為HBP信號通路的核心轉錄因子,GFPT2蛋白磷酸化促使下游蛋白質O-GlcNAC糖基化修飾,介導細胞的各種生理、病理活動[15-16]。最近研究證實GFPT2蛋白在心肌肥厚等心血管疾病的發生發展過程起了非常重要的作用。但是它們的起源和進化過程依然不清楚,研究基于對HBP途徑關鍵核心因子GFPT2生物信息學分析,構建GFPT2系統進化樹,分析GFPT2基因的正選擇位點。
最后通過GCBI數據庫分析人源GFPT2 基因GO和KEGG途徑,GFPT2在氨基糖和核苷酸糖代謝,丙氨酸、天冬氨酸和谷氨酸代謝,胰島素抵抗3條信號通路。構建PPI網絡篩選出11個基因。然后系統地探索了這些基因涉及GFPT2潛在的信號通路,主要在氨基糖和核苷酸糖代謝、丙氨酸、天冬氨酸和谷氨酸代謝、抗生素生物合成、代謝途徑4條信號通路方面富集。并構建了與GFPT2相關基因的PPI網絡篩選出10個基因:GFPT1、GLUL、GNPDA1、GNPNAT1、GPI、HK1、MPI、PPAT、AMDHD2、CAD,以期為肥厚性心肌病的研究和治療提供新的方向。
從拓撲結構進化樹可以發現,人GFPT2與靈長類動物葉猴關系最近,序列同源性也較高,其次與小鼠和大鼠的親緣性次之,與果蠅親緣關系最遠。此外,GFPT2參與功能的結構域主要包括GATase2、GATase4、GATase6、GATase7、low complexity和SIS。GATase結構域催化氨在多種代謝途徑中的結合,這種雙結構域對酶的催化活性是必需的[17]。low complexity通常與疾病的發生發張有關,如肌萎縮側索硬化癥[18]、阿爾茨海默病[19]。GFPT2作為己糖胺代謝的關鍵轉錄因子,為了使功能更加專一和協調代謝過程,可能在進化的過程中將low complexity結構域摒棄了。從蛋白結構域可以明顯發現脊椎動物GFPT2蛋白與果蠅GFPT2蛋白的區別,GATase和SIS 結構域是脊椎動物比果蠅優勢的結構域。因此,針對結構域的不同為合理藥物設計奠定了堅實的基礎。
正選擇對于了解基因結構和功能有著非常重要的作用[20]。研究采用結合方法(MEME和REL)來檢測選擇壓力[21-22],結果表明,在13個物種中只檢測到了8個正選擇位點。推測可能的原因基因序列進化歷史久遠,且其較短的序列只能提供較少的可檢測位點,這樣也難以檢測出適應性進化信號。此外,還通過IEFE方法并沒有發現正選擇位點,這說明GFPT2基因進行了強烈的凈化選擇,很可能是由于該基因功能十分重要,需要保持相對的穩定性[23]。負選擇位點在整個序列中均有分布,因此,這對研究GFPT2蛋白功能也有重要的提示作用。在進行定點突變過程中要避免這些位點的突變。
功能富集分析表明:GFPT2主要集中在GFPT酶活性、蛋白結合、碳水化合物衍生物結合方面發揮作用。谷氨酰胺果糖-6-磷酸氨基轉移酶(GFAT)是氨基己糖途徑(HP)中的關鍵酶,它產生尿苷5’-二膦-N-乙酰-D-氨基葡萄糖(UDP-GlcNAc),將能量代謝與翻譯后蛋白糖基化聯系起來[24]。表明GFPT2可通過HBP信號途徑調控心臟的代謝調控。蛋白質結合對GFPT2活性的影響是多方面的,GFPT2蛋白結合誘導下游分子O-GlcNAc轉移酶(OGT)連接到絲氨酸或蘇氨酸殘基上的蛋白質,最終誘發左室肥厚和內質網應激等病理狀況發生[12]。碳水化合物-綁定蛋白質在包括心血管在內的許多疾病中起著重要作用,Roselle G等證實降低GFPT2介導的O-GlcNAc能夠抑制心肌肥大[25]。
生信分析顯示GFPT2主要在代謝方面發揮作用,這與相關研究結果一致,如葡萄糖代謝紊亂誘發的HBP途徑導致GFPT表達含量升高最終導致代謝缺陷型糖尿病型心肌肥大的發生[14]。GFPT2活性的提高重新調節腸道對營養物質的適應,促進了腸道干細胞分裂速率所需的Warburg效應代謝重新編程[26]。腺癌和鱗狀細胞癌細胞生長過程葡萄糖攝取較高,GFPT 2在驅動糖酵解、戊糖磷酸途徑和TCA循環過程起著重要作用[27]。癌細胞出現糖代謝改變和糖基化異常,提示HBP的改變。研究發現HBP通量的增加,同時也增加了O-GlcN酰化,導致黑色素瘤細胞運動能力下降和遷移。此外,抑制N-和O-糖基化可減少細胞遷移[8]。總之,當前研究表明GFPT2主要通過O-GlcN酰化誘導機體代謝的正常運行,結果導致一系列疾病的發生和發展。
綜上所述,通過一系列生物信息學分析,分析了GFPT2的系統發育拓撲結構和正選擇位點。最后探討GFPT2的結構、功能、參與的信號通路及與心肌肥厚的相關性,篩選和鑒定到與GFPT2相互作用的10個基因:GFPT1、GLUL、GNPDA1、GNPNAT1、GPI、HK1、MPI、PPAT、AMDHD2、CAD。這些基因可能與GFPT2參與疾病的發生、進展。研究結果將有助于進一步研究GFPT2分子的功能機制,并為心血管疾病的治療和預防提供一定的方向。