梁乾德,馬 靖,高 月
(軍事醫學科學院放射與輻射醫學研究所, 北京 100850)
2012-04-05;
2012-07-17
國家自然科學基金(81073161)資助
梁乾德(1971~),男(漢族),吉林農安縣人,博士,從事藥物分析、中藥現代化等研究。E-mail: liangqiande@yahoo.com.cn
通信作者:高 月(1963~),女(漢族),江蘇宜興人,研究員,從事藥理毒理學、中藥現代化等研究。E-mail: gaoyue@bmi.ac.cnc
高分辨電噴霧離子化質譜數據批量自動化預鑒別軟件的研制
梁乾德,馬 靖,高 月
(軍事醫學科學院放射與輻射醫學研究所, 北京 100850)
為了克服高分辨電噴霧離子化質譜數據預鑒別工作量大、繁瑣的技術瓶頸,采用Microsoft Excel插件方式,研制了用于高分辨電噴霧離子化質譜數據批量自動化預鑒別的軟件。此軟件可根據用戶指定的Excel文件中數據庫數據和待鑒別數據的位置,最小質荷比偏差等信息,自動鑒別并生成鑒別結果報告。實際測試表明,該軟件與人工鑒別結果完全相同,既節省了人力,又能夠極大地提高工作效率,并且操作簡便,容錯性好,具有實用性。
質譜;預鑒別;軟件;自動化;高分辨
代謝組學(metabolomics)致力于生物系統中小分子物質(相對分子質量<1 500)的定性和定量分析[1],目前已運用于微生物學、動物學、植物學、診斷標志物發現、毒理學、藥物研發、食品和環境科學等諸多領域[2-3]。核磁共振和質譜是代謝組學研究的主要技術手段,后者在靈敏度等方面擁有優勢[4-5]。近年來,高分辨質譜技術的出現,使質譜定性分析能力大大提高,從而在代謝組學中的地位越來越重要[6-9]。其中,電噴霧離子化方式以其“軟電離”特性而倍受青睞[1]。
在代謝組學研究中,樣品組成不明確且目標化合物不確定的分析稱為“非靶標分析(untargeted analysis)”。目前,在基于質譜的代謝組學領域,化合物的定性鑒別已經成為非靶標分析的技術瓶頸[6],這很大程度上因為對復雜樣品中大量化合物進行定性鑒別的工作量極大[3]。含未知成分樣品的高分辨電噴霧離子化質譜數據的鑒別通常需要借助化合物數據庫[3,10-14]。將實驗獲得的待定精確質荷比與數據庫中化合物相應離子的精確質荷比進行比對,確定一種或數種可能的化合物,即預鑒別,然后用對照品進行實驗驗證以確定化合物的結構[1]。但是,優質的數據庫通?;衔飻盗魁嫶?,例如人類代謝組學數據庫HMDB(Human Metabolome Database)目前含有超過7 900個代謝物[15]。而且同一種化合物通過電噴霧離子化有可能形成多種形態的離子[3],如正離子模式下有可能形成[M+H]+、[M+NH4]+、[M+Na]+、[M+K]+、[2M+H]+、[2M+H+K]2+、[2M+H+Na]2+等,在負離子模式下有可能形成[M―H]-、[M+HCOO]-、[2M―H]-、[M+Cl]-等。必須分別對多種可能的離子形態進行計算和比較,才能較為全面地排查,減少預鑒別的疏漏和誤判,可見預鑒別的工作量很大。另一方面,當所分析的樣品為成分未知的復雜混合物(如中藥提取物、動植物體液、組織等)時,會產生大量待鑒別的數據,從而進一步增加預鑒別的工作量。
對于如此巨大的工作量,利用計算機實現自動化鑒別是必然的選擇。目前國外已經研制了一些自動化預鑒別軟件[3],但國內還未見這方面的研究報道。為了向國際水平靠攏,以及能夠根據自身需要開發具有特定功能的軟件,有必要開展在本領域的研究探索,獲得自主研制這類軟件的能力。本工作研制了一種用于高分辨電噴霧離子化質譜數據批量自動化預鑒別的軟件,定名為“Searcher”。旨在用計算機代替人完成繁瑣的預鑒別工作,以期節省人力,提高工作效率。
1.1儀器與試劑
Microsoft WindowXPTM操作系統,Microsoft ExcelTM軟件(2003或2007版本),普通個人電腦。Waters AcquityTM超高效液相色譜系統(UPLC),Waters SYNAPT HD MSTM四極桿飛行時間質譜系統(使用電噴霧電離源),Waters HSS T3(100 m×2.1 mm×1.8 μm)色譜柱。乙腈(HPLC級):美國Fisher Scientific公司產品;甲酸(HPLC級):德國CNW Technologies GmbH公司產品;水:由美國Millipore超純水系統制備。
1.2Searcher軟件的工作原理及操作流程
Searcher軟件采取Excel插件的方式工作。安裝后在任意打開的Excel工作簿中生成一個啟動按鈕。首先將數據庫數據和待鑒別數據拷貝到任意一個Excel工作簿中。數據庫數據必須包含化合物各種離子形態下的精確質荷比、化合物名稱等信息,排列方式為:每種化合物占一行,每種信息(各種離子的精確質荷比、化合物名稱等)占一列。待鑒別數據必須排成一列。兩種數據可以拷貝到同一個工作表,也可以拷貝到不同工作表。點擊Searcher啟動按鈕后出現軟件界面,示于圖1。點擊界面上的“指定標準數據(庫數據)的范圍”按鍵,用鼠標選擇數據庫中用于預鑒別的精確質荷比數據區域;點擊界面上的“指定標準數據(庫數據)的標識列”按鍵,用鼠標選擇數據庫中化合物標識(如化合物名稱)所在列;點擊界面上的“指定受檢數據(實際觀測數據)的范圍”按鍵,用鼠標選擇待鑒別質荷比數據所在列。根據需要修改質荷比準確度(mass accuracy)的上限(單位是ppm),然后點擊“檢索鍵”,啟動鑒別。鑒別時,計算機對每一個待鑒別數據,都會在全部指定的數據庫數據范圍內逐一比對,當二者差異小于等于指定的匹配準確度上限時,就會將該數據認定為匹配數據。鑒別完成后,自動生成一個鑒別結果報告表,示于圖2。報告表中列出全部待鑒別質荷比,其中在庫中有匹配數據者所在單元格填充紅色,并在右側列出匹配化合物個數、全部匹配化合物的標識及其匹配準確度值(單位是ppm)。

圖2 鑒別結果報告表示例Fig.2 Example of identification results report sheet
1.3軟件功能的驗證
通過文獻檢索,建立中藥地黃Rehmannia glutinosa LIBOSCH的化合物數據庫,共含有113種化合物。對其中所有化合物,依其分子式,計算出[M-H]-、[M+HCOO]-、[2M-H]-3種常見負離子的精確質荷比。待鑒別數據是本實驗室某次地黃成分分析獲得的部分精確質荷比數據,共62個,分析系統為UPLC-TOF MS,負離子模式,此處省略分析過程。所有數據在Excel表格中排成一列。分別以人工方式和軟件方式進行預鑒別,然后比較鑒別結果。
2.1軟件功能驗證結果
經比較,人工方式和軟件方式預鑒別結果完全一致,共得到14個匹配數據。人工方式耗時數小時,而軟件方式耗時僅1 s左右。在節省人力的同時,工作效率得到極大提高。
2.2軟件特點
此軟件使用簡單方便,容錯度高。鑒于研究工作中通常以Microsoft Excel文件為質譜實驗數據和數據庫數據的載體,該軟件采取Excel插件的方式工作。在指定數據庫數據范圍和待鑒別數據范圍時,無需用鍵盤輸入,只需用鼠標將Excel表上相應范圍框住,然后點擊確定即可。在指定數據庫數據標識列時,只需用鼠標點擊該列任意單元格,然后點擊確定即可。匹配準確度限值可以根據需要任意改變。當發現不合法數據(非數值、空單元格等)時會自動跳過。
Searcher軟件能代替人工完成高分辨電噴霧離子化質譜數據批量自動化預鑒別。既節省人力,又能夠極大地提高工作效率,并且操作簡便,容錯性好,具有實用性。
[1] XIAO J F, ZHOU B, RESSOM H W. Metabolite identification and quantitation in LC-MS/MS-based metabolomics[J]. Trends Anal Chem, 2012, 32: 1-14.
[2] SUGIMOTO M, KAWAKAMI M, ROBERT M, et al. Bioinformatics tools for mass spectroscopy-based metabolomic data processing and analysis[J]. Curr Bioinform, 2012, 7(1): 96-108.
[3] DUNN W, ERBAN A, WEBER R Z, et al. Mass appeal: Metabolite identification in mass spectrometry-focused untargeted metabolomics[J]. Metabol, 2012, published online: 26 May.
[4] THEODORIDIS G A, GIKA H G, WANT E J, et al. Liquid chromatography-mass spectrometry based global metabolite profiling: A review[J]. Anal Chim Acta, 2012, 711: 7-16.
[5] COY S L, CHEEMA A K, TYBURSKI J B,
et al. Radiation metabolomics and its potential in biodosimetry[J]. Int J Radiat Biol, 2011, 87(8): 802-823.
[6] KUEGER S, STEINHAUSER D, WILLMITZER L, et al. High-resolution plant metabolomics: From mass spectral features to metabolites and from whole-cell analysis to subcellular metabolite distributions[J]. Plant J, 2012, 70(1): 39-50.
[7] HNATYSHYN S, SHIPKOVA P, et al. Autom-
ated and unbiased analysis of LC-MS metabolomic data[J]. Bioanal, 2012, 4(5): 541-554.
[8] BURGESS K, CREEK D, DEWSBURY P, et al. Semi-targeted analysis of metabolites using capillary-flow ion chromatography coupled to high-resolution mass spectrometry[J]. Rapid Commun Mass Spectrom, 2011, 25(22): 3 447-3 452.
[9] REGAL P, ANIZAN S, ANTIGNAC J P, et al. Metabolomic approach based on liquid chromatography coupled to high resolution mass spectrometry to screen for the illegal use of estradiol and progesterone in cattle[J]. Anal Chim Acta, 2011, 700(1/2): 16-25.
[10] TSUTSUI H, MAEDA T, MIN J Z, et al. Biomarker discovery in biological specimens (plasma, hair, liver and kidney) of diabetic mice based upon metabolite profiling using ultra-performance liquid chromatography with electrospray ionization time-of-flight mass spectrometry[J]. Clin Chim Acta, 2011, 412(11/12): 861-872.
[11] MOHAMED R, VARESIO E, IVOSEV G,
et al. Comprehensive analytical strategy for biomarker identification based on liquid chromatography coupled to mass spectrometry and new candidate confirmation tools[J]. Anal Chem, 2009, 81(18): 7 677-7 694.
[12] YOO B C, KONG S Y, JANG S G, et al. Identification of hypoxanthine as a urine marker for non-Hodgkin lymphoma by low-mass-ion profiling[J]. BMC Cancer, 2010, 10: 55.
[13] LOFTUS N, BARNES A, ASHTON S, et al. Metabonomic investigation of liver profiles of nonpolar metabolites obtained from alcohol-dosed rats and mice using high mass accuracy MSn analysis[J]. J Proteome Res, 2011, 10(2): 705-713.
[14] XU F, ZOU L, LIN Q, et al. Use of liquid chromatography-tandem mass spectrometry and online databases for identification of phosphocholines and lysophosphatidylcholines in human red blood cells[J]. Rapid Commun Mass Spectrom, 2009, 23(19): 3 243-3 254.
[15] WISHART D S, KNOX C, GUO A C, et al. HMDB: A knowledgebase for the human metabolome[J]. Nucleic Acids Res, 2009, 37(Database issue): D603-610.
SoftwareDevelopmentforBatchAutomaticPreliminaryIdentificationofHighResolutionElectrosprayMassSpectrometricData
LIANG Qian-de, MA Jing, GAO Yue
(InstituteofRadiationMedicine,AcademyofMilitaryMedicalScience,Beijing100850,China)
In order to tackle the bottleneck of heavy-workload and cumbersomeness with preliminary identification of high resolution electrospray mass spectrometric data, a software as Microsoft Excel Plug-in for batch automatic preliminary identification of high resolution electrospray mass spectrometric data was developed, which performs automatic identification and creates report of results based on information such as location of library data and data to be identified in an Excel document and mass accuracy, etc. designated by user. Test showed that the software produces same result compared with handwork, but saves manpower and greatly improves efficiency, with simple operation, high fault tolerance and practicability.
mass spectrometry; identification; software; automatic; high resolution
O 657.63
A
1004-2997(2012)05-0286-04