洪曉愉 李水明 王勇



摘要:多肽組是指生物體表達的所有多肽,尿液等體液的多肽組是生物標記物的重要來源。本研究采用氧化石墨烯磷酸鑭納米磁性復合材料分離富集尿液多肽,進行納升液相色譜高分辨串聯質譜分析,從單一樣本中鑒定了歸屬于123個蛋白質的790條肽段。研究表明,這些肽段在蛋白質水平上不是平均分布的。此外,本研究檢測到了肽段的氧化、磷酸化和脫氨化等翻譯后修飾現象,觀察到了尿液多肽的階梯序列性,從蛋白水平上對尿液多肽組進行了生物信息學分析,結果表明,這些多肽所歸屬的大部分蛋白質之間存在相互作用。本方法可為在尿液中尋找疾病的標志物提供方法學支持。
關鍵詞 :多肽組; 納升液相色譜高分辨串聯質譜; 尿液; 翻譯后修飾
1 引 言
隨著基因組學、轉錄組學和蛋白質組學在生命科學領域中的迅速發展[1],多肽組學的研究也逐漸引起人們的關注。從最簡單的腔腸動物到最高等脊椎動物中,大部分動物體內都存在多肽[2]。多肽組學的研究內容包括體液、組織和細胞等生物體內全部內源性多肽的組成、功能和變化規律[3]。有些多肽作為蛋白質合成、加工、降解的產物[4],可以反映機體內蛋白質的異常代謝過程。蛋白質被剪切成不同的肽段后還可發揮特定的功能[5]。有些多肽作為生化信使分子,如多肽激素、神經多肽、細胞因子、酶抑制因子等,組織調控機體內很多生理生化過程,與疾病的產生有著密切的關系。作為蛋白質組學的延伸,多肽組學技術能很好地監測到低分子量蛋白質的變化。
在疾病生物標志物的篩選、疾病診斷、疾病監測、療效評價及預防等方面,多肽組學也發揮了重要作用[6]。尿液作為機體代謝的終端,用于檢測疾病的樣本時具有可持續性和非侵襲性的優點[7]。表面增強激光解吸/電離飛行時間質譜儀(SELDITOF MS)、基質輔助激光解吸電離質譜(MAIDITOF MS或者MAIDITOF/TOF MS)[8]以及ESI串聯質譜儀,例如三重四級桿質譜儀、離子阱或者四級桿飛行時間質譜儀[9]都可對多肽進行檢測和分析。利用MAIDITOF MS,研究者在胃癌、乳腺癌[10]、膀胱癌[11],IgA腎病[12]等的早期診斷研究中尋找到一些多肽生物標志物。但是此類方法在在尋找疾病差異多肽時,重點在于差異峰的比較,不能準確鑒定蛋白質及其翻譯后修飾。
氧化石墨烯磷酸鑭納米磁性復合材料(LaGM)是由石墨烯、LaPO4納米棒和Fe3O4納米粒子構成的三重復合材料,能夠應用于低豐度多肽的快速富集,如可有效富集尿液中的多肽[13]。本研究采用LaGM分離和富集尿液多肽,采用納升液相色譜串聯高分辨飛行時間質譜儀鑒定多肽序列和翻譯后修飾,1.5 mL尿樣單一樣本中鑒定出歸屬于123種蛋白質的790條肽段,其中有91條肽段帶有氧化、磷酸化和脫氨化翻譯后修飾。本研究為利用尿液多肽組研究疾病生物標志物提供了快速高效的分析方法。
2 實驗部分
2.1 儀器與試劑
Eksigent nanoLCUltraTM 2D 二維納升液相色譜系統、TripleTOF 5600 高分辨質譜儀、Protein Pilot 4.5軟件(AB SCIEX,美國);真空冷凍干燥機、超純水儀(Thermo Scientific,美國);C18反相色譜捕集柱(100 μm × 3 cm, 3 μm, 150 , Eksigent,美國);C18反相色譜分析柱(75 μm×15 cm, 3 μm,120 ,Eksigent美國)。
LaGM按文獻[13]方法自行制備; 實驗用水為超純水;納升反相色譜流動相A:98%水、0.1%甲酸和2%乙腈,納升反相色譜流動相B:2%水、0.1%甲酸、98%乙腈。
2.3 納升液相色譜TripleTOF質譜分析
將磁性材料分離后凍干的多肽樣品用流動相A溶解。在線NanoRPLC液相色譜在Eksigent nanoLCUltraTM 2D系統進行,樣品以2 μL/min的流速上樣到C18預柱上(100 μm×3 cm,3 μm,150 ),以2 μL/min流速沖洗脫鹽10 min。分析柱為C18反相色譜柱(75 μm×15 cm, 3 μm,120 ),梯度洗脫:0~42 min,5%~25% B;42~56 min,25%~40% B;56~64 min,80% B;64~70 min,5% B。質譜分析采用TripleTOF 5600系統(AB SCIEX)結合納升噴霧III離子源(AB SCIEX),噴霧電壓2.4 kV,氣簾氣壓30 psi,霧化氣壓5 psi,加熱溫度150℃,一級TOFMS單張圖譜掃描時間為250 ms,每次IDA循環下最多采集35個電荷為2+~8+,且單秒計數大于100的二級圖譜,每張二級圖譜的累積時間為80 ms。每次循環時間固定為2.5 s, 碰撞室能量設定適用于所有前體離子碰撞誘導解離(CID),動態排除設置為11 s。
2.4 數據分析
采集到的質譜原始wiff圖譜文件,采用Protein Pilot Software v. 4.5(AB SCIEX, USA)軟件進行數據加工處理和檢索分析,數據庫為uniprot庫中的Homo sapiens人種專一數據庫(包含20210條蛋白質序列,2015年1月2日下載),檢索參數設置為非酶切、磷酸化強調和生物學修飾,檢索方式為徹底分析,假陽性率控制為1%FDR。
2.5 生物信息學分析
在String10(http://www.stringdb.org/)進行蛋白質相互作用網絡圖分析,String數據庫是一個搜尋已知蛋白質之間和預測蛋白質之間相互作用的系統,這種相互作用既包括蛋白質之間直接的物理相互作用,也包括蛋白質之間間接的功能的相關性。蛋白質聚類分析在PANTHER(http://www.pantherdb.org/)上進行,Panther是基于基因本體論對蛋白質進行分類的數據庫。
3 結果與討論
3.1 尿液多肽組及其在蛋白質水平上的分析
本研究采用納升液相色譜高分辨串聯質譜分析,在1.5 mL尿樣中共鑒定到790條特異性多肽,其中序列相同、修飾不同的肽段視為不同的肽段,這些肽段的分子量分布在960~6500,理論上等電點分布在3.77~14.38(圖1),肽段電荷數2~7。在不考慮修飾的情況下,鑒定到的特異性肽段有721條,即至少在69條肽段上發生一種或多種修飾。這些肽段在蛋白水平上歸屬于123種蛋白質,95%置信度下這些蛋白質的覆蓋率為0.75%~93.88%,然而這些肽段在蛋白質水平分布并不平均,搜庫得分排位前10位的蛋白質占50.88%,而排位后23位的蛋白質都各有一條肽段被鑒定,在33種蛋白的肽段中鑒定到翻譯后修飾。例如在抗胰蛋白酶的94條肽段中有17條肽段發生翻譯后修飾,尿液中常見蛋白分泌型尿調節蛋白鑒定到的40條肽段中有14條發生修飾。排名前25位蛋白質的總肽段數目和翻譯后修飾數目如表1所示,翻譯后修飾的肽段數與鑒定到的肽段總數之間并沒有明顯的正相關性。
3.2 翻譯后修飾的類型
本研究共檢測到6種主要的翻譯后修飾,即脫氨、N端焦谷氨酸化、N端乙酰化、氨基酸殘基氧化、雙氧化和磷酸化(表2)。其中發生脫氨反應的共有44條肽段,主要發生在谷氨酰胺和天冬酰胺兩種氨基酸上,發生在谷氨酰胺上的有28條,而天冬酰胺上的有16條;發生氧化修飾的共有23條,其中發生在脯氨酸上的有7條,在甲硫氨酸上的有15條(表3),發生在天冬氨酸上的有1條。值得指出的是,肽段發生脯氨酸位點的氧化修飾時,常是多個脯氨酸的位點發生氧化修飾;而肽段發生甲硫氨酸位點的氧化修飾時,則只有一個甲硫氨酸的位點被氧化。甲硫氨酸殘基的氧化常與疾病密切相關,蛋白質的甲硫氨酸殘基能夠被多種類型的活性氧(ROS)氧化, 生成S構型的蛋氨酸亞砜(MetS(O))和R構型的蛋氨酸亞砜(MetR(O)), 導致蛋白功能的降低或喪失。蛋白質甲硫氨酸的氧化與衰老相關的疾病密切相關,例如帕金森病[14]。此外,本研究還鑒定到7條磷酸化修飾肽段。
3.3 尿液多肽組的階梯序列特征
在鑒定到的尿液的多肽中,存在一系列相互之間無論是N端還是C端只相差一個或幾個氨基酸的階梯狀肽段[15](表4和表5)。在血清血漿多肽組中均出現這樣階梯多肽的規律,并且這些階梯多肽在整個血清或血漿多肽組中占主要地位,能夠體現體內特定的蛋白水解作用[16]。本研究表明,該現象在尿液多肽組中同樣存在。Villanueva等[15]認為,來源于纖維蛋白肽A的9個階梯多肽可能成為癌癥的特征性多肽。在尿液總共鑒定到的123種蛋白中,鑒定到至少2條以上階梯多肽的蛋白有61個,C端相差一個或幾個氨基酸的階梯肽段如表4所示。在β2巨球蛋白(β2microglobulin)鑒定到的一系列肽段中,LLKNGERIEKVEHSDLSFSK的C端依次增加5個氨基酸D, W, S, F, K,最長的為LLKNGERIEKVEHSDLSFSKDWSFY;在分泌型尿調蛋白(Uromodulin,secreted form)、富亮氨酸α2糖蛋白(Leucinerich α2glycoprotein)鑒定到的肽段中也是如此。肽段N端出現氨基酸依次遞增,例如表5中列出的血清絲氨酸蛋白酶抑制因子(Plasma serine protease inhibitor)、朊蛋白(Major prion protein (Fragment))、鈉鉀轉運ATP酶(Sodium/potassiumtransporting ATPase)等。
3.4 尿液多肽組的生物信息學分析
目前,多肽組研究較多根據不同分子量的質譜峰的比較,本研究利用納升液相色譜高分辨串聯質譜分析尿液多肽組學,不僅鑒定了肽段序列信息,并且從這些肽段歸屬的蛋白質水平分析了這些蛋白質之間的相關性,為后續的蛋白質降解機制研究提供了新的依據。將得到的123種蛋白在String(http://www.stringdb.org/)數據庫中進行檢索,共檢索到99種蛋白質,其中68種蛋白之間存在相互作用關系,如圖2所示,在肽段水平上沒有看到的潛在聯系能夠在蛋白質水平上予以分析。在PANTHER數據庫(http://www.pantherdb.org/)中對這些蛋白進行聚類分析后發現,在尿液中鑒定到的這些多肽主要參與生物調節(10.8%)、代謝過程(21%)以及細胞進程(15.6%)等(圖3A),主要承擔催化功能(35.4%)、結合功能(18.8%)以及受體功能(15.6%)等(圖3B),主要分布在胞外區(47.1%)和細胞內(17.6%)(圖3C)。
4 結 論
本研究采用納升液相色譜高分辨飛行時間質譜分析尿液多肽組及其翻譯后修飾,建立了一種快速靈敏的尿液多肽組學分析方法。研究結果表明,尿液多肽組具有較寬范圍的分子量和等電點分布,尿液多肽組在蛋白質水平上分布具有不均一性,說明納升液相色譜高分辨串聯質譜可以更全面細致地給出尿液多肽組信息,為相關醫學和生物學研究提供了方法學支持。
References
1 Anderson N L, Matheson A D, Steiner S. Curr. Opin. Biotech., 2000, 11(4): 408-412
2 Baggerman G, Verleyen P, Clynen E, Huybrechts J, De Loof A, Schoofs L. J. Chromatog. B, 2004, 803(1): 3-16
3 Schrader M, SchulzKnappe P. Trends Biotechnol., 2001, 19: 55-60
4 Xiang Y, Kurokawa M S, Kanke M, Takakuwa Y, Kato T. Method Mol. Biol., 2010, 615: 259-271
5 Schulte I, Tammen H, Selle H, SchulzKnappe P. Expert Rev. Mol. Diagn., 2005, 5(2): 145-157
6 XIE Wei, WANG Juan, YU Wei, YANG Li, LIU XiaoLi. Journal of Hygiene Research, 2013, 6: 1031-1035
謝 尉, 王 娟, 于 薇, 楊 笠, 劉小力. 衛生研究, 2013, 6: 1031-1035
7 Dekker L J, Boogerd W, Stockhammer G, Dalebout J C, Siccama I, Zheng P P, Bonfrer J M, Verschuuren J J, Jenster G, Verbeek M M, Luider T M, Smitt P A S. Mol. Cell Proteomics., 2005, 4(9): 1341-1349
8 Verhaert P, UttenweilerJoseph S, de Vries M, Loboda A, Ens W, Standing K G. Proteomics, 2001, 1(1): 118-131
9 Bakun M, Karczmarski J, Poznanski J, Rubel T, Rozga M, Malinowska A, Sands D, Hennig E, Oledzki J, Ostrowski J, Dadlez M. Proteomics Clin. Appl., 2009, 3(8): 932-946
10 Boccardo F, Rubagotti A, Nuzzo P V, Argellati F, Savarino G, Romano P, Damonte G, Rocco M. Profumo A, Int. J. Cancer, 2015, 137(10): 2394-2402
11 Zlotta A R. Euro. Urol., 2006, 49(4): 756-757
12 Graterol F, NavarroMunoz M, Ibernon M, Lopez D,Troya M I, Perez V,Bonet J, Romero R. BMC Nephrol., 2013, 14: 82
13 Cheng G, Wang Z G, Liu Y L, Zhang J L, Sun D H, Ni J Z. Chem. Commun., 2012, 48(82):10240-10242
14 Miotto M C, Rodriguez E E, ValienteGabioud A A, TorresMonserrat V, Binolfi A, Quintanar L, Zweckstetter M, Griesinger C, Fernandez C O. Inorg. Chem., 2014, 53(9): 4350-4358
15 Villanueva J, Shaffer D R, Philip J, Chaparro C A, ErdjumentBromage H, Olshen A B, Fleisher M, Lilja H, Brogi E, Boyd J, SanchezCarbayo M, Holland E C, CordonCardo C, Scher H I, Tempst P. J. Clin. Invest., 2006, 116(1): 271-284
16 Koomen J M, Li D H, Xiao L C, Liu T C, Coombes K R, Abbruzzese J, Kobayashi R. J. Proteome Res., 2005, 4(3): 972-981
Abstract Peptidomics is an emerging field branching from proteomincs that targets endogenous peptides of a whole organism or a subsystem. Many peptides in body fluids including urine are biomarkers with higher clinical sensitivity and specificity. In this study, we separated and enriched these peptides in human urine by the graphene oxidelanthanum phosphate composite nanomaterial (LaGM), then identified and analyzed by nano liquid chromatographyhigh resolution tandem mass spectrometry. In single urine sample, 790 peptides which belong to 123 proteins were identified, and some posttranslational modifications including oxidation, phosphorylation, deamidated etc, were also identified. There existed a series of peptide ladders in urine peptidomic. At last, the string analysis on protein level revealed strong interaction among the proteins which the identified peptides belonged. This method can provide support for finding the biomarkers of disease in urine.
Keywords Peptidomic; Nano liquid chromatographyhigh resolution tandem mass spectrometry; Urine; Posttranslational modifications