李亞萍,鄒余糧,張琳,黃新,秦勇
(1西安市中心醫院,西安710003;2西安交通大學第一附屬醫院)
卵巢癌HELQ蛋白結構和功能的生物信息學工具分析預測
李亞萍1,鄒余糧2,張琳1,黃新1,秦勇1
(1西安市中心醫院,西安710003;2西安交通大學第一附屬醫院)
目的預測卵巢癌抑癌基因HELQ編碼蛋白(HELQ蛋白)的結構和功能。方法采用ExPASy服務器中的工具分析HELQ蛋白的理化特征。分別采用PSORTⅡ和TMHMM預測HELQ蛋白的亞細胞定位和跨膜拓撲結構。采用SignalP 4.0預測HELQ蛋白的信號肽。采用ScanProsite和SMART分析HELQ蛋白的功能結構域以及結構域分區。采用PSIPRED和I-TASSER預測HELQ蛋白的二級和三級結構以及配體結合位點。采用STRING 10.0預測HELQ蛋白與其他蛋白的交互作用。結果HELQ蛋白主要定位在細胞核(47.8%)和細胞質(39.1%)中,有4個保守結構域DEXDc、HELICc、HHH_5和PRK02362,并包含解旋酶ATP結合區和解旋酶C端結合區兩個功能結構域;成功建立了HELQ蛋白的二級和三級結構模型,其中二級結構中α螺旋、無規則卷曲及折疊結構比例分別為54%、31%和6%。三維配體結構分析發現HELQ蛋白包含一個酶活性中心位點His341,催化Ile333、Lys335、Tyr337、Gln340、Pro360、Thr361、Ser362、Gly363、Gly364、Lys365、Thr366、Leu367、Glu464和Ala711等結合位點與配體ATP結合。交聯蛋白質分析發現HELQ蛋白可能與RAD51、POLA1、PLON、FANCD2、DHX8等蛋白存在交互作用。結論HELQ蛋白可能具有ATP依賴性解旋酶的結構和功能,參與DNA損傷的修復過程。
卵巢癌;HELQ基因;HELQ蛋白;三級結構;ATP依賴性解旋酶
Abstract:ObjectiveTo predict the structure and function of ovarian cancer anti-tumor gene HELQ protein.MethodsThe tools of ExPASy Server were employed to analyze the physicochemical properties of HELQ protein. Its subcellular localization and transmembrane topology were predicted by PSORTⅡand TMHMM, respectively. The signal peptide of HELQ was predicted by SignalP 4.0. ScanProsite and NCBI conserved domain search data were used to analyze the function domain and conserved domain. PSIPRED and I-TASSER were employed to construct the secondary structure and three-dimensional model and find the ligand binding sites of HELQ. STRING 10.0 was used to predict the interaction of HELQ with other proteins.ResultsThe HELQ protein was mainly located in the nucleus (47.8%) and cytoplasm (39.1%). HELQ had 4 conserved domains, consisting of DEAD, HELICc, HHH_5, and PRK02362, and contained 2 function domains: Helicase_ATP-Bind_1 and Helicase_Cter. The secondary structure and three-dimensional model were constructed. In the secondary structure, HELQ was composed of α helix (54%), random coils (31%), and 10.26% β-structure. The results of three-dimensional model found that HELQ had a enzyme activity site His341 and the ligand binding sites appeared in Ile333, Lys335, Tyr337, Gln340, Pro360, Thr361, Ser362, Gly363, Gly364, Lys365, Thr366, Leu367, Glu464 and Ala711 which combined with ATP. The result of cross-linked protein analysis discovered that HELQ might be interaction with RAD51, POLA1, PLON, FANCD2, and DHX8.ConclusionHELQ protein may have ATP-dependent helicase structure and function, and participate in the DNA damage repair process.
Keywords: ovarian carcinoma; HELQ gene; HELQ protein; tertiary structure; ATP-dependent helicase
卵巢癌是女性常見癌癥的第二大殺手,早期難以診斷,且預后效果較差,5年生存率約47%[1]。對卵巢癌發生的相關基因的研究,能夠為早期診斷和靶向治療卵巢癌提供方向。HELQ基因是2013年在小鼠體內發現的卵巢癌抑癌基因,該基因缺失時會增加小鼠患卵巢癌的風險[2]。已有研究表明,HELQ基因可以修復細胞增殖時DNA復制過程中發生的DNA損傷,如果該基因發生缺陷或缺失,DNA錯誤復制的可能性會增加,從而提高惡性腫瘤發生的幾率[3]。因而筆者推測,如果HELQ基因在人類和小鼠中的作用一致,未來或許可通過篩查HELQ基因來診斷和治療女性卵巢癌。但縱觀國內外研究,關于該基因的研究尚不夠成熟,該基因表達蛋白的結構及功能也不明確。本研究利用生物信息學工具預測HELQ基因編碼蛋白(HELQ蛋白)的結構和功能。現報告如下。
1.1 HELQ基因序列的來源 從NCBI數據庫中獲取HELQ基因的核苷酸序列,其Genbank序號為AF436845.1,Gene ID:113510,定位于染色體4q21上。HELQ基因又稱HEL308,全長3591 bp,ORF finder分析HELQ基因序列包含17個開放閱讀框,其中ORF3編碼基因的全長,共1101個氨基酸。
1.2 HELQ蛋白結構和功能的預測 用ExPASy服務器[4]中的ProtParam、Compute pI/Mw和ProtScale軟件預測HELQ蛋白的理化性質,包括氨基酸組成、分子質量、等電點、疏水性/親水性、不穩定系數及脂肪系數等。用PSORTⅡ(http://www.genscript.com/psort.html)預測HELQ蛋白的亞細胞定位。用TMHMM軟件[5]預測HELQ蛋白的跨膜拓撲結構。用SignalP4.0 Server軟件[6]預測HELQ蛋白的信號肽。用ScanProsite軟件[7]預測HELQ蛋白的功能結構域。用NCBI保守結構域數據庫[8]分析蛋白序列的保守結構域。用PSIPRED序列分析軟件[9]預測HELQ蛋白的二級結構。用蛋白質結構建模工具I-TASSER[10~13]構建HELQ蛋白的三維結構模型,并分析其配體結合位點及其配體。使用STRING 10.0軟件[14]分析HELQ蛋白與其他蛋白交聯的相互作用。軟件使用方法參照軟件使用說明書或自帶的使用教程。
2.1 HELQ蛋白的理化性質 Prot Param軟件計算出HELQ蛋白的分子量約為124 175.3 Da,理論等電點為6.12,氨基酸組成中酸性氨基酸多于堿性氨基酸,且亮氨酸(Leu)比例最高(12.4%);不穩定指數為45.55,故推測HELQ應為不穩定的酸性蛋白。Prot Scale軟件計算出HELQ蛋白疏水性指數平均值為-0.317,脂肪族指數為92.34,說明其為親脂性蛋白。
2.2 HELQ蛋白亞細胞定位及結構域 PSORTⅡ軟件計算出HELQ蛋白最大可能分布在細胞核(47.8%)和細胞質(39.1%)中,也可能出現在線粒體及囊泡分泌系統(高爾基體、內質網等結構)中,TMHMM和SignalP4.0計算結果顯示HELQ蛋白沒有跨膜結構域及信號肽,說明該蛋白可能不是跨膜蛋白及內分泌蛋白,而可能是代謝調控蛋白或轉錄因子。
Scan Prosite軟件預測HELQ蛋白的功能結構域,結果顯示HELQ蛋白包含兩個功能結構域,分別是Helicase_ATP-Bind_1(解旋酶ATP結合區A)和Helicase_Cter(解旋酶C端結合區),其功能分別是結合和水解ATP。通過查找NCBI 保守結構域數據庫,發現HELQ序列有4個保守結構域,分別是DEAD(解旋酶家族成員之一)、HELICc(解旋酶C端超級結構域)、HHH-5(復合螺旋結構域)和PRK02362(ski2_like結構域),其中DEAD參與各種RNA代謝過程,包括核轉錄、前信使RNA剪接、核糖體合成、核質運輸、翻譯、RNA衰變以及細胞器基因的表達。
2.3 HELQ蛋白的二級和三級結構 PSIPRED軟件構建出的HELQ蛋白二級結構模型顯示HELQ蛋白由α-螺旋(54%)和無規則卷曲(31%)、 β-折疊(6%)組成。I-TASSER軟件構建出了HELQ蛋白三維結構模型,結合3DLigandsite軟件建立HELQ蛋白三維配體結合模型,發現其可能結合的配體為ATP,結合位點為Ile333、Lys335、Tyr337、Gln340、360Pro、361Thr 、Ser362、Gly363、Gly364、Lys365、Thr366、Leu367、464Glu、711Ala,且主要分布在Helicase_ATP-Bind_1和Helicase_Cter兩個功能結構域;另外,結合位點中心區域的His341為HELQ蛋白的酶活性中心位點,因此,推測HELQ的活性依賴于與ATP結合從而提供的能量。
2.4 HELQ蛋白的交聯網絡 STRING 10.0交互式數據庫蛋白質交聯分析結果顯示與HELQ蛋白相互作用的蛋白主要有RAD51、POLA1、PLON、FANCD2、DHX8 等。其中RAD51具有DNA依賴的ATP酶活性,參與同源重組和雙鏈斷裂時的DNA損傷修復的激活;PLON是一種DNA聚合酶;FANCD2參與DNA雙鏈斷裂的修復過程,維持染色體的穩定。而HELQ與這些蛋白存在交互作用,因此推測HELQ的功能作用與這些蛋白相似,也與DNA復制有關,即可能參與修復細胞增殖時DNA復制過程中所發生的的DNA損傷。
DNA修復是細胞對DNA損傷的一種反應,可使DNA結構恢復重新執行原來的功能。若DNA的損傷未被完全消除,且細胞能夠耐受這種損傷繼續生存,那么該DNA損傷有很大幾率會在適合的條件下顯示出來,如導致細胞癌變。因此,DNA損傷修復與腫瘤的發生密切相關。DNA解旋酶可以修復核苷酸的錯配、雙鏈斷裂及同源重組交叉反應等DNA損傷,對于維持機體基因及染色體的穩定至關重要。不同的解旋酶(如RuvAB、RecBCD、RecQ1等)修復不同的DNA損傷[15,16]。研究已經證實小鼠體內該基因的缺失可以提高卵巢癌的發病率[2]。Moldovan等[17]研究發現,人的HELQ蛋白表達缺失同樣可以引起DNA復制過程受阻,且其他研究[18]也進一步證實HELQ蛋白是一種依賴ATP的酶,具有DNA解旋酶活性,參與細胞的增殖過程。本研究結果顯示,HELQ蛋白包含Helicase_ATP_Bind 1和 Helicase_Cter兩個中心區域,功能分別是結合和水解ATP,行使解旋酶的活性;蛋白質交聯網絡分析發現與HELQ相互交聯的蛋白均具有修復DNA損傷的功能,其中RAD51協同同系產物(如RAD51B、RAD51D)在DNA損傷的末端形成核蛋白絲,催化斷裂的DNA雙鏈與同源DNA姐妹鏈進行鏈間重組交換,從而維持基因的穩定性[19]。RAD51是DNA 同源重組修復過程中的關鍵酶,與BRCA1、BRCA2相互協作,干擾DNA損傷修復,引起基因組的不穩定性,誘導乳腺癌等多種腫瘤的發生[20,21]。PLON是由POLH基因編碼的DNA聚合酶ν,修復紫外輻射導致的DNA嘧啶二聚體,使DNA的復制正常進行[18]。FANCD2在應對DNA損傷時第561位的賴氨酸單泛素化,在核中特定位點與FA通路下游相關修復蛋白共定位,修復損傷DNA。FANCD2基因是FA通路的關鍵基因,若缺失則導致DNA損傷修復功能障礙,引發癌癥[22,23]。HDX8是一種依賴ATP的RNA解旋酶。因此推測HELQ 蛋白也具有解旋酶的功能。
已有研究表明人類HELQ蛋白在卵巢、精巢、心臟及骨骼肌均表達,且HELQ蛋白表達與生殖細胞的發育密切相關。HELQ基因發生突變后,導致男性出現少精、唯支持細胞綜合癥、女性卵巢功能不全而不孕[24,25]。目前的研究集中于對HELQ蛋白功能的探索,Ward等[26]研究發現HELQ聯合RAD51修復減數分裂時DNA雙鏈的斷裂。Luebben等[27]研究發現哺乳動物的HELQ蛋白具有維持基因穩定的功能。但其與腫瘤發生發展的關系需進一步研究。Liu等[28]研究發現HELQ激活與DNA損傷相關的CHK1-RAD51,抑制骨肉瘤的生長;敲除HELQ基因導致骨肉瘤的增殖和遷移能力增強。因此推測人類HELQ蛋白表達的缺失可能引起惡性腫瘤尤其是生殖系統腫瘤卵巢癌的發生。
本研究對HELQ蛋白的結構及功能進行了分析,初步推測其可能參與腫瘤發生發展過程中的DNA損傷修復過程,從而影響惡性腫瘤細胞的增殖以及腫瘤治療過程中的治療效果。HELQ基因和蛋白與卵巢癌的關系有進一步研究的價值。
[1] Wagener J,Seybold U. MRSA - Hygiene-Management, Diagnostik und Therapie[J].Dtsch Med Wochenschr, 2014,139(13):643-654.
[2] Adelman CA, Lolo RL, Birkbak NJ, et al. HELQ promotes RAD51 paralogue-dependent repair to avert germ cell loss and tumorigenesis[J]. Nature, 2013,502(7471):381-384.
[3] Dolgova EV, Alyamkina EA, Efremov YR, et al. Identification of cancer stem cells and a strategy for their elimination[J]. Cancer Biol Ther, 2014,15(10):1378-1394.
[4] Gasteiger E, Hoogland C, Gattiker A, et al. Protein identification and analysis tools on the ExPASy server[M].Clifton:Humana Press, 2005:571-607.
[5] Moller S, Croning R, Apweiler R. Evaluation of methods for the prediction of membrane spanning regions[J]. Bioinformatics, 2002,18(1): 218-218.
[6] Petersen TN, Brunak S, von Heijne G, et al. SignalP 4.0: discriminating signal peptides from transmembrane regions[J]. Nature Meth, 2011,8(10):785-786.
[7] Sigrist CJ, Castro E, Cerutti L, et al. New and continuing developments at PROSITE[J]. Nucl Acid Res, 2012,41:D334-337.
[8] Marchler-Bauer A, Bo Y, Han L, et al. CDD/SPARCLE: functional classification of proteins via subfamily domain architectures[J]. Nucl Acid Res, 2017,45(D1):D200-D203.
[9] Buchan DW, Minneci F, Nugent TC, et al. Scalable web services for the PSIPRED Protein Analysis Workbench[J]. Nucl Acid Res, 2013,41(1):349-357.
[10] Yang J, Yan R, Roy A, et al. The I-TASSER Suite: protein structure and function prediction[J]. Nature Meth, 2015,12(1):7-8.
[11] Yang J, Zhang Y. I-TASSER server: new development for protein structure and function predictions[J]. Nucl Acid Res, 2015,43(1):174-181.
[12] Roy A, Kucukural A, Zhang Y. I-TASSER: a unified platform for automated protein structure and function prediction[J]. Nature Prot, 2010,5(4):725-738.
[13] Zhang Y. I-TASSER server for protein 3D structure prediction[J]. BMC Bioinform, 2008,9(1):40.
[14] Szklarczyk D, Franceschini A, Wyder S, et al. STRING v10: protein-protein interaction networks, integrated over the tree of life[J]. Nucl Acid Res, 2014,43(7):447-452.
[15] Spies M. DNA Helicases and DNA Motor Proteins[M]. New York:Springer, 2013:973.
[16] Viziteu E, Klein B, Basbous J, et al. RECQ1 helicase is involved in replication stress survival and drug resistance in multiple myeloma[J]. Leukemia, 2017,26(3):125-128.
[17] Moldovan GL, Madhavan MV, Mirchandani KD, et al. DNA polymerase POLN participates in cross-link repair and homologous recombination[J]. Mol Cell Biol, 2010,30(4):1088-1096.
[18] Tafel AA, Wu L, McHugh PJ. Human HEL308 localizes to damaged replication forks and unwinds lagging strand structures[J]. J Biol Chem, 2011,286(18):15832-15840.
[19] Wang AT, Kim T, Wagner JE, et al. A dominant mutation in human RAD51 reveals its function in DNA interstrand crosslink repair independent of homologous recombination[J]. Mol Cell, 2015,59(3):478-490.
[20] 彭亞婷,梅金紅.Rad51與腫瘤關系的研究進展[J].臨床與實驗病理學雜志,2011,27(1):86-89.
[21] 高麗麗,朱長樂.乳腺癌中Chk2,p53和Rad51的表達及意義[J].臨床與實驗病理學雜志,2014,30(3):308-311.
[22] 劉超,高軍麗,樂貽軍,等.FANCD2在結直腸癌中的表達及其與預后的關系[J].胃腸病學,2014,24(7):404-407.
[23] Lambert MW,Sridharan D,Zhang P. FANCF, a Fanconi anemia core complex protein involved in monoubiquitination of FANCD2, also has a role with nuclear alpha spectrin in DNA interstrand crosslink repair[J]. Cancer Res,2016,35(2):257-259.
[24] Wang W, Zhao S, Zhuang L, et al. The screening of HELQ gene in Chinese patients with premature ovarian failure[J]. Rep Biomed Online, 2015,31(4):573-576.
[25] Pelttari LM, Kinnunen L, Kiiski JI, et al. Screening of HELQ in breast and ovarian cancer families[J].Fam Cancer, 2016,15(1):19-23.
[26] Ward JD, Muzzini DM, Petalcorin MIR, et al. Overlapping mechanisms promote postsynaptic RAD-51 filament disassembly during meiotic double-strand break repair[J]. Mol Cell, 2010,37(2):259-272.
[27] Luebben SW, Kawabata T, Akre MK, et al. Helq acts in parallel to Fancc to suppress replication-associated genome instability[J]. Nucl Acid Res, 2013,41(22):10283-10297.
[28] Liu DN, Zhou YF, Peng AF, et al. HELQ reverses the malignant phenotype of osteosarcoma cells via CHK1-RAD51 signaling pathway[J]. Oncol Re, 2017,37(2):1107-1113.
Bioinformatics analysis and prediction of HELQ protein structure and function
LIYaping1,ZOUYuliang,ZHANGLin,HUANGXin,QINYong
(1Xi'anCentralHospital,Xi'an710003,China)
10.3969/j.issn.1002-266X.2017.35.009
R737.3
A
1002-266X(2017)35-0029-04
2017-03-22)
陜西省科學技術研究發展計劃項目(2013JM4064)。