聶 麗,邵正英,魏賽金
(江西農業大學 生物科學與工程學院,江西 南昌 330045)
目前,研究蛋白質組學已經成為生命科學的熱點和焦點,開展蛋白質組研究對生命科學研究進入后 基因時代具有跨時代的意義,也是后基因時代中生命科學研究的核心要素。蛋白質組(proteome)一詞 最早在1994年由澳大利亞科學家 Wilkins等[1]提 出的,意指一個組織或細胞中的全部蛋白質由基因組表達。蛋白質組學(proteomics)是從整體動力學角度分析細胞內蛋白質修改狀態、表達水平來了解蛋白質之間的相互作用,從而揭示細胞的活動規律及蛋白質功能。
根據研究目的和手段的不同,蛋白質組學可分為組成性蛋白組學、比較蛋白組學和相互作用蛋白質 組學[2]。組成性蛋白質組學是鑒定并詳細闡述某個體系中蛋白質翻譯后修飾的各種特性;Ohta等[3]用定 量蛋白組學描述了 4 000 蛋白質識別孤立的有絲分裂染色體。比較蛋白質組學即差異顯示蛋白質組學,是以人類重大疾病或以重要生命過程為主要研究對象,進行病理和生理體系或蛋白質在過程中的差異表達;Hamler等[4]應 用二維液相分離結合質譜鑒定的路線比較了乳腺癌上皮細胞與正常乳腺上皮細胞間蛋 白質間的差異表達。蛋 白質組學的相互作用是應用各種先進技術對蛋白質間的相互作用進行研究,將某體 系中蛋白質間的作用繪制成網絡圖譜。Ohta等[3]進 一步通過生物信息學分析,預測蛋白質的功能。
在蛋白質組研究中,常用雙向凝膠電泳(2DE)和聚丙烯酰胺凝膠電泳(SDS-PAGE)分離成混合 物的蛋白質,收集目的蛋白質膠帶和膠點,經膠內酶解后應用質譜法分析以獲得蛋白質信息。其中雙向 電泳(2DE)這是最經典最成熟的蛋白質分離技術產生于20 世紀 70年代[5],是通過相對分子量和蛋白 質的等電點(PI)的不同將高通量地蛋白分離出來[6]。單個蛋白質的鑒定生物化學領域常見的問題,目 前有兩大方法論:Edman降解法和質譜法。質譜法又細分為兩類:基質輔助激光解吸電離飛行時間質譜(MALDI-TOF-MS)和高效液相串聯質譜(LC-MS/MS),如 MALDI-TOF-MS 技術在脂質中的應用[7]。后者較前者具有更高的靈敏度和幾乎 100%的可能性,且 具有MALDI-TOF-MS 不可比擬的從單一蛋白質 膠帶中準確鑒定出多個蛋白質組分的能力。如對膜蛋白的蛋白質組學的研究用同位素親和標記技術、MALDI-TOF-MS 技術、MD-LC 技術相互結合鑒別出未描述的MT1-基質金屬蛋白酶底物[8]。
蛋白質學的核心內容之一就是蛋白質鑒定。傳統的方法如蛋白質微量測序、氨基酸組分分析費時費 力、通量低,存在不容易實現規模化和自動化,結果靈敏度差等問題。當前主流的基于軟電離技術的LC-MS/MS是實現高通量蛋白鑒定的主要方法。Kim等[9]用LC-MS/MS 技術,對 30個來自正常人類的不同組織、器官樣品進行了深度蛋白組解析,共鑒定到了 17 294個蛋白,占人類全部有注釋編碼蛋白基 因的84%,對人類蛋白質組草圖繪制。將純化的蛋白質用消化酶水解成肽段,肽段混合物經過除鹽后進 入液相色譜實現初步分離,經液相分離后的肽段經第一級和第二級系統做進一步碎裂,使肽段離子被打 碎成更小的、更有規律的碎片離子;理論上蛋白質序列經過酶解后形成肽段,肽段再經過理論二級碎裂 形成理論的二級碎片離子譜圖;然 后用實驗產生的MS/MS譜圖信息與理論產生的MS/MS譜圖信息比對,通過比較二者的相似度來確定譜圖對應哪個肽段[10-11]。其中理論蛋白質的數據庫來自基因組預測或前期 實驗驗證等數據。目前的蛋白組數據庫數有(SWISS-PROT、BLOCKS[12]、NOPdb[13]、ExPASy[14]等 )。
從蛋白質的角度研究生命現象和規律已成為研究生命科學的主要手段,而這些研究往往離不開對細 胞、組織或器官中含有的蛋白質表達量和種類的研究。對于不同條件、不同時期下研究蛋白質表達水平的變化,尋找生物標志物,這些研究都需要對蛋白質進行定量和鑒定。生物質譜技術的不斷發展和成熟 為蛋白質的差異表達分析提供了更可靠、動態范圍更廣的研究手段。當前,基于質譜技術的定量手段大 致分為無標記定量(labal-free quantification)和標記定量(labeled quantification)。其中 labal-free定量 不需要對比較樣品做特定標記處理,只需要比較特定的肽段、蛋白在不同樣品間的色譜質譜響應信號便 可得到樣品間蛋白表達量的變化,通常用于分析大規模蛋白鑒定和定量時所產生的質譜數據。如利用Labal-free定量技術規模化分析復雜的蛋白質組學質譜數據[15]。利用iTRAQ 定量技術是目前定量蛋白質 組學中應用最廣泛的技術。在一級質譜圖中,標 記在不同樣本中的所有iTRAQ 試劑在同一蛋白質的質荷 比表現是相同的;在二級質譜中,iTRAQ 試劑中的平衡基團發生中性丟失,信號離子以不同的質荷比表現出不同波峰高度或面積,以此得到同一蛋白在不同樣本中的表達差異;同時,肽段的MS/MS 結果結 合數據庫檢索可以鑒定出相應的蛋白質種類。
現代生物標記物根據發現階段、驗證階段、臨床確認階段這三個階段進行研究。在發現階段,采用蛋白組學技術發現及鑒定生物標記物應用較多,而在確認和驗證階段,樣品高度復雜,傳統蛋白質組學 方法在此背景噪音結果不盡人意。正是在這樣的背景下,發展了目標蛋白質組學技術。它具有特異性強、靈敏度高、準確性高、重現性好、現行動態范圍廣等優勢,基于蛋白質組學的生物標記物研究、蛋白質 翻譯后修飾、定量蛋白質組和蛋白質組相互作用領域應用廣泛。目前有MRMHR(muitiple reacting monitoring)技術和SWATH(sequential window acquisition of all mass sepectra)定量技術。MRMHR是一種數據獲取方式,基于假定信息設定或已知信息的質譜檢測規則,信號記錄符合規則的離子,去除大量有干擾能力或不符合規則的離子信號,從而得到質譜信息[16]。而 SWATH 定量技術是一種新型的、高通 量的、全景式的MS/MS 掃描技術,將掃描范圍劃分為一系列區間,此區間是以25da 為間隔的,進而 超高速掃描全部離子,來 獲得掃描范圍內的所有碎片信息,拓 展了 MS/MSALL技術[17-18]。如 利用SWATH 和iTRAQ 定量技術揭示 CD109在晚期非小細胞的過表達和生物相關性[19]。
蛋白質很少單獨發揮作用,在所有微生物功能中,占主導地位的是蛋白質混合物的功能。蛋白質組的相互作用的研究方法主要有酵母雙雜交技術(Y2H)、親和純化(AP)、化學交聯偶聯質譜(CXMS)等方法。Y2H 和CXMS 雖然通量相對較高,但結果假陽性較大,不同實驗室做出的結果差距較大。AP-SWATH 技術是在AP 技術基礎上,在非常接近于生理條件的情況下使用的純化標簽是經過特別設計的,能捕捉到分子伴侶及其特定的蛋白質,研究人員經質譜分離技術分析可鑒別出這種蛋白質相互作用組。該方法特異性非常高,能夠準確地富集到靶蛋白的特異性相互作用蛋白。如采用AP-SWATH 定量技 術研究 14-3-3家族的蛋白質相互作用[20]。
第一個古細菌蛋白質組研究的初級階段完成的基因組闡述。Z ivanovic等[21]從 熱液煙囪收集的樣品中 分離的一株嗜熱耐 ? 輻射菌(Gammatolerans),它是古細菌最抗輻射的生物。對其測定出基因組序列與 其他嗜熱菌基因組比較,進一步通過鳥槍法與 LC-MS/MS 進行蛋白質組學分析。結果發現 10 931個獨 特的肽,對應 951個蛋白質。這一信息驗證了基因組注釋的準確性。嗜鹽古生菌是Halobacteriacea家族的一員,大多數嗜鹽古生菌需要 1.5mol/L氯化鈉增長來保持細胞的結構完整性。因此這些生物體的蛋白 質在高鹽度適應是活躍的和穩定的條件。W A Joo等[22]討論了當前蛋白質組研究嗜鹽古生菌和引入有效篩 查程序,預測,確認新嗜鹽酶的功能。嗜冷微生物能夠持續低溫的環境生存和增殖,克服了低溫這項挑 戰包括:酶活性降低,膜流動性降低,改變運輸營養物質和廢物,減少轉錄、翻譯和細胞分裂、不適當的蛋白質折疊,胞內冰的形成。Salvino等[23]介 紹了Psychropiezophilic微生物適應寒冷和生活在深深的海洋,最大增長速度在2℃和最高生長溫度僅 12℃,這表明在溫度低至2℃,一些酶或超分子結構已 經顯示出改變構象,消極地影響代謝通量。
放線菌與人類之間密切相關,有益菌占絕大多數,對人類健康做出了重要的貢獻,不但合成多種維 生素、生物活性物質及酶類,而且具有復雜發育過程和形態分化,具有較強的環境適應能力。Maréchal等[24]應 用比較蛋白組學對產抗生素量相對高的ppk突變株和產抗生素量低的野生菌株S.lividans的蛋白質 組差異進行比較,分析發現了新的蛋白 12個;證實鏈霉菌的生物合成中存儲脂類代謝和抗生素之間的聯 系。Manteca等[25]使用LC-MC/MC 技術和iTRAQ 技術對S.coelicolor液體發酵和固體培養下比較不同發 育階段的蛋白質組,在早期的區分菌絲體(MI)和多核菌絲體(MII)的蛋白質比較鑒定發現這兩菌絲體中相 似的蛋白質達到 83%之多,參與初級代謝的蛋白質在MI更豐富,參與次級代謝的蛋白質上調在MII時,最主要的是在末期形成孢子的過程中 MII的蛋白質存在顯著差異。Mastronunzio[26]基于具有共性的3個 基因組序列,應用LC-MS/MS 蛋白組學技術對弗蘭克氏菌屬 CcI3的胞外蛋白質進行處理,進過生物信 息學分析檢測到共生蛋白質 1 000多個,其中有固氮蛋白、轉運蛋白、信號蛋白、結節性分泌蛋白和細 胞表面蛋白,且含量最豐富的是固氮蛋白。這為揭示共生細菌的生活方式提供了依據。Chen等[27]目的性的篩選 26 株未被測序的放線菌株中 NRPs 和PKs的表達,發現 10個含高 GC 基因組的NRPS/PKS 基因 簇存在于6株菌株中。
凡能引起人類疾病的細菌統稱為病原菌或致病菌,目前,有40多種病原菌被測出其全基因序列,對 其中的十幾種病原菌的蛋白組學進行了研究。Jungblut等[28]應 用蛋白組學技術對結核分枝桿菌 H37Rv,發現了蛋白質在6個基因庫中都未測序到,其中在CDC1551 菌株中發現 5個的ORF。這一結果表明基因組測序還存在某些缺陷,蛋白質組的研究對其結果起到修飾和補充的作用。Jungblut等 [29]對幽門螺桿 菌 26695 和J99 研究發現,通過高分辨率的二維電泳技術分離的分辨能力 5 000個蛋白質斑點,使用基 質輔助激光解吸/電離質譜(MALDI-MS)、肽質量指紋識別了 152個蛋白質,其中包括9個已知的毒力因 子和28個抗原。尿路致病性大腸埃希菌(E.coli)536菌株有4個毒力因子(PAIs I536~IV536),PAI II536 可使 leuX 失活,其編碼 tRNA5Leu,影響毒力因子不同的表達特征 [30]。Duffes等 [31]對產單核細胞李斯特 氏菌野生型和具有抗性 DivercinV41 進行全細胞蛋白表達的研究,通過 2DE 分析發現蛋白質模式存在很 大差異,具有抗性菌株中未發現存在與野生菌株中的9個蛋白點,但新發現了 8個蛋白點,其中新增的蛋白點中有一個被確定為鞭毛蛋白,且此鞭毛蛋白的胞內合成可能通過σ 因子間接影響在轉錄調控中具有廣泛修飾作用。
首次將“元蛋白組學(宏蛋白組學)”一詞提出的是Wilmes 和Bond [32],將其定義為:環境微生物群 在特定的時間內蛋白質的所有總和。在生命有機體內蛋白質參與生物轉化,而在構建微生物群動態功能 學時元蛋白組學是最全面、最恰當的方法,同時也是研究代謝組學中代謝途徑和調節機制最重要的一步。元蛋白組學可以分析活性污泥、廢水處理系統的生物除磷過程中的代謝信息。Wilmes等[33]應用2-DE 和質譜技術發現了 46個蛋白,與生物除磷過程(EBPR)相關的宏基因組序列最近,這些蛋白直接參與EBPR 過程,包括參與乙醛酸/檸檬酸循環、糖原的分解與合成、糖酵解、脂肪酸的β 氧化、磷酸脂肪酸合成和運輸;還發現了幾個蛋白參與細胞應激反應。這實驗直接表明了通過元白組學了解代謝調控機制。元蛋 白組學可以分析水體微生物群落的組成和蛋白質功能。Kan等[34]以切薩皮克灣的微生物群落(0.2~3.0μm)的元蛋白質組進行研究,應用LC-MS/MS 分析法發現該地區微生物的所有蛋白質中,中灣重復蛋 白約占 92%,上下灣的重復蛋白分別約為 30%和70%。應用MS-BLAST搜索法有3 種蛋白質被檢測出,這些蛋白質的識別來源于海洋微生物,與切薩皮克灣α-變形菌、擬桿菌屬高度相關。而 Morris等 [35]應用比較元蛋白組學揭示了海洋微生物群落的能源利用率和能量轉換。首次將元蛋白組學技術應用在嬰兒糞 便微生物是Klaassens等 [36],將2-DE、MALDI-TOF-MS 分析法結合起來表明糞便生物群落元蛋白組圖 譜會隨著時間的變化而變化。
目前,蛋白質組學技術仍處在不斷發展、完善的階段,并迅速在各行各業中廣泛應用。微生物蛋白 質組學的應用具有重大意義,同時也存在不少困難:在極端微生物中,雖然闡述了些極端微生物在不同 脅迫下的抵御機制,因脅迫因素導致傷害的改善提供了新的依據,但是還有大部分極端微生物未被發現,未被測序出; 在放線菌中廣泛存在的次級代謝物基因資源可被繼續挖掘和利用; 病原菌感染機制及過程,疫苗及新藥的開發和應用等生物蛋白質組學策略的研究可被進一步的完善和補充;元蛋白質組學處于初 級階段,但微生物群落功能信息的研究潛力巨大 [37],目前進行元蛋白組學的研究過少,需要對生物化學 循環中功能成分進行深入研究。
[1]Wilkins M R,Sanchez J C,Gooley A A,et al.Progress with proteome projects:Why all proteins expressed by a genome should be identified and how to do it?[J].Biotechnology and Genetic Engineering Reviews,1996,13(1):19-50.
[2]Pandey A,Mann M.Proteomics to study genes and genomes[J].Nature,2000,405:837-846.
[3]Ohta S,Bukowski-Wills J C,Sanchez-Pulido L,et al.The protein composition of mitotic chromosomes determined using multiclassifier combinatorial proteomics[J].Cell,2010,142(5):810-821.
[4]Hamler R L,Zhu K,Buchanan N S,et al.A two-dimensional liquid-phase separation method coupled with mass spectrometry for proteomic studies of breast cancer and biomarker identification[J].Proteomics,2004,4(3):562-577.
[5]O'Farrell P H.High resolution two-dimensional electrophoresis of proteins[J].Journal of Biological Chemistry,1975,250(10):4007-4021.
[6]G?rg A,Weiss W,Dunn M J.Current two-dimensional electrophoresis technology for proteomics[J].Proteomics,2004,4(12):3665-3685.
[7]Schiller J,Suss R,Fuchs B,et al.MALDI-TOF MS in lipidomics[J].Frontiers in Bioscience:A Journal and Virtual Library,2006,12:2568-2579.
[8]Tam E M,Morrison C J,Wu Y I,et al.Membrane protease proteomics:Isotope-coded affinity tag MS identification of undescribed MT1–matrix metalloproteinase substrates[J].Proceedings of the National Academy of Sciences of the United States of America,2004,101(18):6917-6922.
[9]Kim M S,Pinto S M,Getnet D,et al.A draft map of the human proteome[J].Nature,2014,509(7502):575-581.
[10]Henzel W J,Watanabe C,Stults J T.Protein identification:The origins of peptide mass fingerprinting[J].Journal of the American Society for Mass Spectrometry,2003,14(9):931-92.
[11]Calleri E,Temporini C,Perani E,et al.Trypsin-based monolithic bioreactor coupled on-line with LC/MS/MS system for protein digestion and variant identification in standard solutions and serum samples[J].Journal of Proteome Research,2005,4(2):481-490.
[12]Henikoff J G,Greene E A,Pietrokovski S,et al.Increased coverage of protein families with the blocks database servers[J].NucleicAcids Research,2000,28(1):228-230.
[13]Ahmad Y,Boisvert F M,Gregor P,et al.NOPdb:Nucleolar proteome database:2008 update[J].Nucleic Acids Research,2009,37(suppl 1):181-184.
[14]Gasteiger E,Gattiker A,Hoogland C,et al.ExPASy:The proteomics server for in-depth protein knowledge and analysis[J].Nucleic Acids Research,2003,31(13):3784-3788.
[15]Griffin N M,Yu J,Long F,et al.Label-free,normalized quantification of complex mass spectrometry data for proteomic analysis[J].Nature Biotechnology,2010,28(1):83-89.
[16]Addona T A,Abbatiello S E,Schilling B,et al.Multi-site assessment of the precision and reproducibility of multiple reaction monitoring–based measurements of proteins in plasma[J].Nature Biotechnology,2009,27(7):633-641.
[17]R?st H L,Rosenberger G,Navarro P,et al.Open SWATH enables automated,targeted analysis of data-independent acquisition MS data[J].Nature Biotechnology,2014,32(3):219-223.
[18]李春波.創新的蛋白質組學質譜應用新技術——SWATH 技術[J].現代科學儀器,2011(5):161-162.
[19]Zhang F,Lin H,Gu A,et al.SWATH?-and iTRAQ-based quantitative proteomic analyses reveal an overexpression and biological relevance of CD109 in advanced NSCLC[J].Journal of Proteomics,2014,102:125-136.
[20]Collins B C,Gillet L C,Rosenberger G,et al.Quantifying protein interaction dynamics by SWATH mass spectrometry:Applicationto the 14-3-3 system[J].Nature Methods,2013,10(12):1246-1253.
[21]Zivanovic Y,Armengaud J,Lagorce A,et al.Genome analysis and genome-wide proteomics ofThermococcus gammatolerans,the most radioresistant organism known amongst the Archaea[J].Genome Biol,2009,10(6):R70.
[22]Joo W A,Kim C W.Proteomics of halophilic archaea[J].Journal of Chromatography B,2005,815(1):237-250.
[23]D'Amico S,Collins T,Marx J C,et al.Psychrophilic microorganisms:challenges for life[J].EMBO Reports,2006,7(4):385-389.
[24]Manteca A,Jung H R,Schwammle V,et al.Quantitative proteome analysis of Streptomyces coelicolor nonsporulating liquid cultures demonstrates a complex differentiation process comparable to that occurring in sporulating solid cultures[J].Journal of Proteome Research,2010,9(9):4801-4811.
[25]Le Maréchal P,Decottignies P,Marchand C H,et al.Comparative proteomic analysis of streptomyces lividans wild-type and ppk mutant strains reveals the importance of storage lipids for antibiotic biosynthesis[J].Applied and Environmental Microbiology,2013,79(19):5907-5917.
[26]Mastronunzio J E.Genomic and proteomic analyses of extracellular and symbiosis-related proteins in Frankia[D].Connecticut:University of Connecticut,2009.
[27]Chen Y,Ntai I,Ju K S,et al.A proteomic survey of nonribosomal peptide and polyketide biosynthesis in actinobacteria[J].Journal of Proteome Research,2011,11(1):85-94.
[28]Jungblut P R,Müller E C,Mattow J,et al.Proteomics reveals open reading frames inMycobacterium tuberculosisH37Rv Not predicted by genomics[J].Infection and Immunity,2001,69(9):5905-5907.
[29]Jungblut P R,Bumann D,Haas G,et al.Comparative proteome analysis ofHelicobacter pylori[J].Molecular Microbiology,2000,36(3):710-725.
[30]Piechaczek K,Dobrindt U,Schierhorn A,et al.Influence of pathogenicity islands and the minor< i> leuX</i>-encoded tRNA< sub> 5</sub>< sup> Leu</sup> on the proteome pattern of the uropathogenic< i>Escherichia coli</i> strain 536[J].International Journal of Medical Microbiology,2000,290(1):75-84.
[31]Duffes F,Jenoe P,Boyaval P.Use of two-dimensional electrophoresis to study differential protein expression in divercin V41-resistant and wild-type strains ofListeria monocytogenes[J].Applied and Environmental Microbiology,2000,66(10):4318-4324.
[32]Wilmes P,Bond P L.The application of two-dimensional polyacrylamide gel electrophoresis and downstream analyses to a mixed community of prokaryotic microorganisms[J].Environmental Microbiology,2004,6(9):911-920.
[33]Wilmes P,Wexler M,Bond P L.Metaproteomics provides functional insight into activated sludge wastewater treatment[J].PLoS One,2008,3(3):1778.
[34]Kan J,Hanson T E,Ginter J M,et al.Metaproteomic analysis ofChesapeakebaymicrobial communities[J].Saline Syst,2005:1(7).
[35]Morris R M,Nunn B L,Frazar C,et al.Comparative metaproteomics reveals ocean-scale shifts in microbial nutrient utilization and energy transduction[J].The ISME Journal,2010,4(5):673-685.
[36]Klaassens E S,De Vos W M,Vaughan E E.Metaproteomics approach to study the functionality of the microbiota in the human infant gastrointestinal tract[J].Applied and Environmental Microbiology,2007,73(4):1388-1392.
[37]Ogunseitan O A,LeBlanc J F,Kowalchuk G A,et al.Environmental proteomics:Methods and applications for aquatic ecosystems[J].Molecular Microbial Ecology Manual,2004,1(2):1027-1044.