黃曉妍,黎嘉琳,冀慎英,2,張湘豫,2,郭 勇,鄒先瓊,3*
(1.桂林醫學院 生物技術學院, 桂林541100; 2.桂林醫學院 基礎醫學院, 桂林541100; 3.桂林醫學院 附屬口腔醫院, 桂林 541004)
人類糖脂轉運蛋白(Glycolipid transfer protein, GLTP)是一種能調節細胞內膜系統間鞘糖脂膜間運輸的可溶性蛋白[1-2]。與其它脂類轉運蛋白不同,人類GLTP蛋白的空間結構是由α-螺旋構成的獨特的兩層“三明治”狀,這種“三明治”狀結構被認為是真核生物GLTP蛋白家族的結構基礎及原型蛋白[3]。GLTP蛋白家族的重要成員包括人類四磷酸適配器蛋白2 (FAPP2)、人類1-磷酸神經酰胺轉運蛋白(Ceramide-1-phosphate transfer protein, CPTP, 即GLTPD1)、擬南芥促細胞死亡蛋白11(ACD11)等[1,3]。
GLTP蛋白過表達能上調細胞周期蛋白依賴性激酶抑制因子1A(p21)及1B(p27),下調細胞周期蛋白依賴性激酶2(CDK2)及4(CDK4)、細胞周期蛋白E及D1,從而阻滯細胞周期于G1/S檢查點,誘導細胞程序性壞死從而抑制人類結直腸癌HT-29細胞的生長[2]。盡管GLTP蛋白家族其它成員的結構、功能的研究已有很多報道[1-2,4-7],但是,近年內發現的GLTP蛋白家族的一個新成員人類GLTPD2,其功能尚不清楚。
本研究的目的在于通過在線生物信息學分析工具,對人類GLTPD2蛋白進行鑒定,并對其理化性質、結構域、表達特征、結構比較及潛在功能進行分析,為進一步深入研究人類GLTPD2蛋白的生物學功能及其在疾病發生發展中的作用奠定理論基礎和實驗依據。
利用美國國家生物技術信息中心NCBI (https://www.ncbi.nlm.nih.gov/)檢索人類GLTPD2,獲得其核酸序列號為NM_001014985.3,蛋白序列號為NP_001014985.3,并作進一步的分析。
通過UCSC Genome Browser (http://www.genome.ucsc.edu/)分析人類GLTPD2的結構及其組蛋白修飾水平在不同細胞中的差異,并獲取其基因組序列[8],再將人類GLTPD2的基因組序列輸入在線分析網站EMBOSS (https://www.ebi.ac.uk/Tools/emboss/)的Cpgplot工具中[9],預測人類GLTPD2的CpG島所分布的位置,通過UniProt在線服務器(https://www.uniprot.org/)預測人類GLTPD2蛋白的結構域[10]以及利用ExPASy在線服務器(https://web.expasy.org)中的在線工具ProtParam (https://web.expasy.org/protparam/)分析人類GLTPD2蛋白的理化性質[11],通過SignalP-5.0 (http://www.cbs.dtu.dk/services/SignalP/)預測人類GLTPD2蛋白的信號肽[12]以及利用TMHMM Server v. 2.0在線分析工具(http://www.cbs.dtu.dk/services/TMHMM-2.0/)預測人類GLTPD2蛋白的跨膜區[13]。
通過NetPhos 3.1 Server (http://www.cbs.dtu.dk/services/NetPhos/)分析人類GLTPD2蛋白氨基酸序列上的磷酸化修飾位點[14],并通過NetOGlyc 4.0 Server (http://www.cbs.dtu.dk/services/NetOGlyc/)及NetNGlyc 1.0 Server 在線工具(http://www.cbs.dtu.dk/services/NetNGlyc/)分別分析人類GLTPD2蛋白的氨基酸序列上O-連接與N-連接糖基化修飾位點[15-16]。此外,通過JASSA v4 (http://www.jassa.fr/)與GPS-SUMO-2.0 Online Service(http://sumosp.biocuckoo.org/)在線服務器分別對人類GLTPD2蛋白進行蘇木化修飾位點的預測[17-18]。
利用Vector NTI Suite 7.1應用軟件包中子程序Align X將人類GLTPD2蛋白(序列號為NP_001014985.3)與人類CPTP蛋白(序列號NP_001025056.1)進行序列比對分析[19]。并將人類GLTPD2蛋白的氨基酸序列輸入在線分析工具SWISS-MODEL (https://swissmodel.expasy.org/)中檢索得到與人類GLTPD2蛋白同源性最高的三維結構文件(人類CPTP蛋白, 檢索號: 4k85.1.A),以此為模板建立人類GLTPD2蛋白GLTP結構域的三維結構[20],并利用PyMol 0.97對模板及人類GLTPD2蛋白的GLTP結構域的空間結構進行比較分析,進一步通過Ras top 2.0軟件對人類CPTP及GLTPD2蛋白中的脂轉運相關的關鍵殘基進行比較分析。
通過在Human Protein Atlas (http://www.proteinatlas.org/)分析人類GLTPD2蛋白在不同細胞、組織中的表達情況以及亞細胞定位[21]。
利用STRING (https://string-db.org/)在線分析工具分析人類GLTPD2蛋白的潛在相互作用蛋白質[22]。并通過結合STRING及GeneCards (https://www.genecards.org/)數據庫對獲得的潛在相互作用蛋白的主要功能進行分析[23]。此外,通過Coexpedia(http://www.coexpedia.org/)查詢與人類GLTPD2蛋白存在共表達關系的蛋白[24],并利用GeneCards對其功能進行分析。
通過UCSC Genome Browser及EMBOSS的子程序Cpgplot對人類GLTPD2進行分析,結果表明人類GLTPD2包括四個外顯子,編碼291個氨基酸。CpG島分析結果表明人類GLTPD2(含上下游500 bp)含有2個CpG島,值得注意的是該基因5’端上游無明顯CpG島,但在中下游區間出現了兩個明顯的CpG島(見圖1a)。組蛋白修飾分析結果表明人類GLTPD2在K562細胞中H3K27Ac的水平顯著高于H1-hESC細胞(見圖1b)。以上結果提示,人類GLTPD2的中下游區間也可能參與了基因的轉錄調控。此外,利用UniProt在線服務器和ExPASy中的分析工具SignalP-5.0、TMHMM Server v. 2.0及ProtParam對人類GLTPD2蛋白的理化性質及結構特征進行分析,結果表明人類GLTPD2蛋白的GLTP結構域位于102-252氨基酸殘基,1-36氨基酸殘基為N端信號肽,13-32氨基酸殘基為跨膜區(見圖2),分子量大小為31.6 kDa,理論等電點為10.19。

圖1 人類GLTPD2結構的特殊性Fig.1 Particularity of human GLTPD2 structure注: (a) 黑色框線表示2個CpG島位置; (b)H3K27Ac為組蛋白3第27位賴氨酸乙酰化, H1-hESC為人類胚胎干細胞H1細胞系, K562為人類紅白血病細胞系.
通過在線服務器NetPhos 3.1 Server、NetOGlyc 4.0 Server及NetNGlyc 1.0 Server分別對人類GLTPD2蛋白的磷酸化修飾位點、O-連接和N-連接糖基化修飾位點進行預測,結果表明在人類GLTPD2蛋白的氨基酸序列中有多個絲氨酸、蘇氨酸、酪氨酸殘基磷酸化修飾位點(見圖2),O-連接糖基化修飾位點分別為T53、S62、T64、S92、T126、T134殘基,第276位氨基酸殘基為N-連接糖基化修飾位點(見圖2)。此外,利用JASSA v4及GPS-SUMO-2.0 Online Service在線服務器對人類GLTPD2蛋白進行蘇木化修飾位點的預測,結果表明人類GLTPD2蛋白發生蘇木化修飾的潛在位點為K94殘基(見圖2)。
通過Vector NTI Suite 7.1軟件中的Align X子程序比對人類CPTP和GLTPD2蛋白的氨基酸序列(見圖3a),結果表明人類CPTP蛋白和GLTPD2蛋白序列間相似性較高,其中人類CPTP蛋白的關鍵殘基包括L43、K60、R97、R106、R110、R113、L118、L146、Y149,在人類GLTPD2蛋白相對應的殘基分別為L115、K132、R172、R181、L185、R188、S193、L222、H225。
通過SWISS-MODEL服務器構建了人類GLTPD2蛋白的GLTP結構域的空間結構(見圖3b),并與人類CPTP蛋白的結構進行比較,分析結果表明人類CPTP蛋白的結構與GLTPD2蛋白的GLTP結構域具有相似的空間結構,均具有脂類結合的疏水口袋。
通過Ras top 2.0軟件分析了人類CPTP及GLTPD2蛋白關鍵殘基的空間結構(見圖3c),以人類CPTP蛋白的R106殘基與GLTPD2蛋白的R181殘基空間位置作為對照,人類CPTP蛋白的R110殘基對應于GLTPD2蛋白的L185殘基,人類CPTP蛋白的L118殘基對應于GLTPD2蛋白的S193殘基。這些關鍵殘基盡管不同,但表現出相似的結構。同時,人類CPTP蛋白的R110與L118殘基之間的距離和GLTPD2蛋白的L185與S193殘基間的距離也非常接近(見圖3c)。

圖3 人類CPTP及GLTPD2蛋白的序列及結構比較Fig.3 Comparison of sequence and structure of human CPTP and GLTPD2 protein注: (a)黃色框表示相同的殘基, 綠色框表示弱相似的殘基, 紅字母表示非相似/非保守殘基, #表示突變后活性下降的殘基, *表示突變后失去活性的關鍵殘基;藍色球表示氮原子, (c)綠色球表示氫原子, 紅色球表示氧原子.
通過Human Protein Atlas(https://www.proteinatlas.org)檢索人類GLTPD2,綜合HPA (Human Protein Atlas)、GTEx(Genotype-Tissue Expression)以及FANTOM 5(Functional Annotation Of the Mammalian Genome 5)三個數據庫分析所獲得的結果表明人類GLTPD2在組織中廣譜表達,其中在肝、腸、腎等組織中的表達相對較高(見圖4a~c)。此外,人類GLTPD2在不同的腫瘤細胞中均有表達,其中在Caco-2 (腸癌細胞)、HepG2 (肝癌細胞)等細胞系中的表達較高(見圖4d)。這些結果提示人類GLTPD2與肝、腸、腎等組織的功能及疾病的發生密切相關。此外,亞細胞定位分析結果表明,人類GLTPD2蛋白主要分布于細胞內的囊泡中,這提示人類GLTPD2蛋白可能是一個分泌蛋白。

圖4 人類GLTPD2的表達分析Fig.4 Expression analysis of human GLTPD2注: (a~c)將HPA數據庫、GETx數據庫及FANTOM 5數據庫中分析得到的數據分別輸入GraphPad Prism 5中繪制人類GLTPD2組織表達圖譜(a~c) 將HPA數據庫中的數據輸入GraphPad Prism 5中繪制人類GLTPD2細胞表達圖譜(d) 誤差線為標準差.
通過STRING數據庫對人類GLTPD2蛋白進行蛋白質相互作用網絡分析,獲得與其有潛在相互作用的蛋白質(見圖5),并通過STRING及GeneCards數據庫聯合分析這些潛在相互作用蛋白的主要功能。結果表明人類GLTPD2蛋白與APOF、ACOXL、RPP21、EIF1AD等蛋白之間有潛在相互作用。其中載脂蛋白F (Apolipoprotein F, APOF)為膽固醇轉運過程中的重要調控因子,能抑制膽固醇酯轉運蛋白活性。糖脂轉移蛋白(Glycolipid transfer protein, GLTP)可加速各種糖脂和糖鞘脂在膜間轉移,但不加速磷脂的轉移。酰基輔酶A氧化酶類(Acyl-CoA oxidase like, ACOXL)為脂肪酸結合蛋白,具有酰基輔酶A氧化酶和氧化還原酶的活性。核糖核酸酶P蛋白亞基p21 (Ribonuclease P protein subunit p21, RPP21)為核糖核酸酶P的組成部分,是一個通過切割其5’末端產生成熟tRNA分子并與鋅等金屬離子結合的蛋白復合物。真核生物翻譯結構域1A起始因子(Eukaryotic translation initiation factor 1A domain containing, EIF1AD)可抑制細胞增殖,并參與細胞對氧化應激的反應。RNA聚合酶III亞基A ( RNA polymerase III subunit A, POLR3A)是RNA聚合酶III最大的催化核心成分,可合成小RNA,如5S RNA和tRNA,與第二大亞基一起構成聚合酶活性中心。核糖體蛋白L39 (Ribosomal rotein L39, RPL39)為RNA結合蛋白,是核糖體結構組成部分。泛素結構域1結合蛋白(Ubiquitin-associated like domain containing 1, UBALD1)有增加痘苗病毒(Vaccinia virus, VACV)感染幾率,減少IL-8分泌等功能。

圖5 人類GLTPD2蛋白的潛在相互作用蛋白網絡Fig.5 Potential protein interaction network of human GLTPD2 protein注: 該圖通過STRING在線分析工具獲得, 圖中不同顏色的圓圈代表不同蛋白質, 直線代表蛋白質之間相互作用.
通過Coexpedia數據庫檢索人類GLTPD2蛋白及其共表達蛋白,獲得共表達蛋白1個,即酪氨酸激酶-4 (SH3 and PX domain-containing protein 2B,SH3PXD2B)。利用在線工具GeneCards進一步分析其功能,結果表明該基因編碼的適配蛋白酪氨酸激酶-4具有一個PX結構域(Phox homology domain)和4個SH3結構域(Src homology 3 domain),參與過氧化物歧化酶的形成和細胞外基質的降解,在脂肪細胞分化的早期階段中促進有絲分裂的克隆擴增。
蛋白質相互作用及共表達分析的結果表明人類GLTPD2蛋白可能參與了轉運脂質、基因的轉錄、細胞增殖與分化等過程。
近年來發現了兩個GLTP蛋白家族的新成員,包括人類CPTP (GLTPD1)及GLTPD2。GLTP蛋白家族的重要成員人類CPTP蛋白的功能已有許多研究[1-3,7]。研究表明人類CPTP蛋白的K60、R106、R110殘基對于蛋白識別和結合1-磷酸神經酰胺(Ceramide-1-phosphate, C1P)是必須的,R113、Y149殘基對于維持CPTP蛋白的空間結構是必要的,當這些關鍵殘基發生突變時,蛋白原有活性喪失[7]。人類CPTP蛋白的L43、L118、L146殘基的突變會顯著降低C1P的轉運活性,而R97殘基的主要作用在于吸附脂類分子的頭部基團[7]。本研究將人類CPTP蛋白的空間結構與人類GLTPD2蛋白的GLTP結構域空間結構及脂轉運相關的關鍵殘基進行了比較,結果表明無論是空間結構上還是在關鍵殘基上,二者均具有較大的相似性(見圖3a)。此外,人類CPTP蛋白的R110殘基對應于人類GLTPD2蛋白的L185殘基,人類CPTP蛋白的L118殘基對應于人類GLTPD2蛋白的S193殘基(見圖3a)。這些關鍵殘基盡管不同,但表現出相似的結構(見圖3c)。這些結果表明人類GLTPD2蛋白可能也具有轉運脂類(盡管目前尚不能確定其轉運脂類種類)的功能。
通過基因的細胞及組織表達譜分析,結果表明人類GLTPD2在肝、腸、腎等組織表達較高,在Caco-2 (腸癌細胞)、HepG2 (肝癌細胞)等細胞系中的表達也較高。這提示人類GLTPD2很可能與肝、腸、腎等組織的功能及疾病的發生密切相關。通過蛋白相互作用分析及共表達分析也表明人類GLTPD2蛋白可能參與轉運脂質、基因的轉錄、細胞增殖與分化等生物學過程。
經研究初步鑒定了人類GLTP蛋白家族的一個新成員,GLTPD2,通過生物信息學分析工具分析了該蛋白的理化性質、結構域、結構比較、表達特征及潛在功能,迄今國內外尚無相關研究的文獻報道。本研究為進一步深入研究人類GLTPD2蛋白的生物學功能及其在疾病發生發展中的作用提供了重要的理論基礎和實驗依據。