陳 可,李翠翠,李 博,3*
(1中國藥科大學藥物分析系,南京211198;2中國藥科大學蛋白質化學與結構生物學重點實驗室,南京211198;3中國藥科大學(杭州)創新藥物研究院,杭州310018)
目前,絕大多數蛋白質組學的分析都是采用基于串聯質譜的自下而上(bottom-up)的方法,對酶解的肽段進行LC-MS分析,通過肽段的串聯質譜數據鑒定蛋白質[1]。應用中色譜共洗脫是多肽串聯質譜鑒定中的常見問題,多達50%的肽段串聯質譜(MS/MS)譜圖中包含一個以上的肽[2],所產生的豐富質譜數據使得合理的解析變得困難:一方面碎片離子會受到母離子和共洗脫肽段碎片離子的干擾,增加了數據解析的難度;另一方面很多共洗脫多肽無法被鑒定。此外,蛋白質的翻譯后修飾(post-translational modifications,PTMs)增加了蛋白質及多肽的多樣性,對數據分析工作帶來了進一步的挑戰。
多肽的色譜保留取決于色譜方法和多肽本身的性質,而多肽的性質在很大程度上是由它們的氨基酸序列決定的。因此在給定的色譜條件下,保留時間(retention time,RT)包含了多肽序列的信息[3-5]。多肽保留時間預測是將多肽色譜保留行為轉變為穩定獨立的特征時間屬性,作為蛋白質組學中輔助和驗證指標,增加靶向蛋白質組學的覆蓋率[6],或為數據非依賴采集(data independent acquisition,DIA)樣品提供輔助信息,提高譜圖匹配的準確性[12,34]。
本文對未修飾多肽和修飾多肽保留時間預測的各類方法進行了綜述,對各方法原理、模型、特點及其在蛋白質定性及定量中的應用進行總結,討論了這些方法在蛋白質組學中預測完整蛋白質的可行性和準確性,并對多肽保留時間預測方法的發展方向及其應用前景進行了展望。……