牛 歡,張紅燕,彭佳喜,王 莉,趙興云,周孝禹,萬麗紅,吳仁安*
(1.中國科學院大連化學物理研究所,遼寧 大連 116023;2.中國科學院大學,北京 100049)
糖尿病是一種由多種因素引起糖代謝穩定功能受損而致高血糖為主要特征的全身性代謝紊亂綜合征,患者高血糖的形成與肝臟、胰臟、腸道、脂肪肌肉組織、腎臟、腦等多臟器的功能失調相關,已成為嚴重危害人類健康的全球性流行的多發疾病[1,2]。血糖控制的失穩可導致多種糖尿病并發癥,如:并發心腦血管、腎臟、視網膜及神經系統的慢性病變和各種感染,嚴重時可發生酮癥酸中毒等,甚至導致殘疾或死亡[3]。據統計,我國已成為全球糖尿病第一大國,目前糖尿病人數已超過1億,其中,1型糖尿病主要由自身免疫系統損害所致,約占糖尿病患者總數的5%;2型糖尿病(T2D)主要以胰島素抵抗和胰島β細胞功能受損為特點,患者數約占糖尿病患者總數的90%[4]。糖尿病的早發現、早診斷及早治療對于病情的延緩和控制至關重要。在分子水平上呈現、跟蹤糖尿病發生發展過程中的變化分子譜圖,對糖尿病臨床診斷、分子分型及病理過程的理解可提供更加全面的數據支持。
隨著系統生物學的發展,組學分析技術已發現部分蛋白質、糖、脂質、代謝物等生物分子在糖尿病中異常表達,可以作為糖尿病的潛在分子標志物[5-8]。內源性多肽是相對分子質量小于10 kDa的多肽或蛋白質水解片段,是細胞合成、調控等過程的重要內源性生物分子,能夠反映機體基因表達的變化,也能引起相應新陳代謝活動的改變[9-11]。多肽組學作為一門系統性、全面性研究內源性多肽結構、功能及變化規律的學科,是蛋白質組學的重要補充,也是目前的熱點研究領域[12-15]。血清中含有豐富的內源性多肽,可實時反映人體生理、病理狀態的變化和特性,被認為是最有價值的生物標本之一。血清內源性多肽組的研究對于疾病標志物的篩選、早期診斷、疾病動態監測及治療具有重要的臨床意義,已受到研究者的廣泛關注[16-18]。針對白血病,有研究者采用弱陽離子交換磁珠對血清內源性多肽進行純化并結合基質輔助激光解吸-飛行時間質譜(MALDI-TOF-MS)鑒定技術,對比分析了急性淋巴細胞白血病患者和健康對照者血清樣本的內源性多肽組,篩選出33條差異多肽[19]。此外,葡萄膜黑色素瘤[20]、兒童自閉癥[21]及膿毒癥[22]等多種疾病研究中也通過多肽組學技術鑒定到潛在的血清內源性多肽標志物。針對2型糖尿病,Wang等[23]通過對糖尿病患者和健康對照者血清樣本的內源性多肽組的分析,鑒定到6條差異多肽,可作為診斷2型糖尿病的潛在多肽標志物。在臨床樣品分析的多肽組學技術中所使用的MALDI-TOF-MS定性定量分析準確性往往較差,而液相色譜-串聯質譜(LC-MS/MS)能夠提供較為穩定、精確的多肽定性定量結果。本工作應用低濃度乙腈輔助超濾聯合LC-MS/MS的定量多肽組學技術,對臨床上健康組、糖尿病前期組及2型糖尿病組的血清樣本的內源性多肽組進行對比分析,篩選識別糖尿病發展過程中的差異內源性多肽,旨在尋找2型糖尿病早期診斷及分子分型的多肽分子標志物。
截留相對分子質量為10 kDa的離心超濾管購于Millipore公司(美國);甲酸(formic acid,FA)購自Sigma-Aldrich公司(美國);23例人血清樣品(包括7例健康者血清樣本、7例糖尿病前期患者血清樣本和9例2型糖尿病患者血清樣本)來自上海第六人民醫院。實驗用的乙腈為色譜純(Merck公司),實驗用水全部經Milli-Q(Millipore,美國)處理。
血液樣品采集后保存于-80 ℃冰箱。糖尿病前期患者和2型糖尿病患者由專家確診或排除,3組受試人群的年齡、體重指數(BMI)、血糖等指標均相匹配。血液樣品獲得當地醫院倫理委員會的批準,所有受試者都簽署知情同意書。樣本臨床信息見表1。
血清內源性多肽的提取采用低濃度乙腈輔助超濾離心法。具體操作流程如下:從-80 ℃冰箱中取出血樣并在冰浴中解凍,渦旋混勻,20 000 g離心5 min,棄去脂質。每例血清樣本取25 μL于1.5 mL離心管中,加入125 μL去離子水稀釋并煮沸變性5 min。待溫度冷至室溫后,加入150 μL 40% ACN(含0.1% FA)溶液使乙腈終體積分數為20%,渦旋混勻并于冰浴中靜置40 min。然后將樣品轉移到截留相對分子質量為10 kDa超濾管中,在6 000 g、4 ℃條件下離心20 min,并用300 μL 20% ACN(含0.1% FA)溶液清洗濾餅兩次。收集濾液,冷凍干燥,經C18 SPE柱除鹽后,儲存在-80 ℃冰箱中備用。進樣分析前,樣品復溶到25 μL 0.1% FA溶液中,渦旋混勻2 min,在20 000 g、4 ℃條件下離心5 min,取上清液置于進樣瓶中用于nano-LC-MS/MS分析。

表1 血液樣本的臨床信息Table1 Clinical information of blood samples
LC-MS/MS數據采集由nano-RPLC-MS/MS系統完成。該系統由四元梯度泵的高效液相色譜(Ultimate 3000)、自動進樣器和線性離子阱-靜態軌道阱(LTQ-Orbitrap Elite)組成,采用3 cm長的C18預柱(200 μm i.d.)輔助自動進樣,樣品首先保留到預柱上,然后經梯度洗脫到分析柱上(150 μm i.d.,14 cm)進行分離,質譜鑒定。
液相色譜流動相組成:A相為0.1%的FA水溶液,B相為80% ACN(含0.1% FA)溶液。分離梯度設為:0~10 min,2%B;10~13 min,2%B~5%B;13~73 min,5%B~28%B;73~88 min,28%B~45%B;88~89 min,45%B~95%B;89~94 min,95%B;94~95 min,95%B~2%B;95~105 min,2%B。流動相流速為0.5 μL/min。
質譜條件:LTQ離子傳輸管的溫度設為275 ℃,電噴霧電壓設為2.7 kV。所有的數據采集模式均為數據依賴模式(data-dependent mode,DDA),質譜全掃描在Orbitrap中采集,掃描范圍為200~2 000 Da,分辨率設為12 000。二級質譜掃描在LTQ中采集,采用碰撞誘導解離(CID)碎裂方式。利用Xcalibur軟件(version 2.1,Thermo公司)進行系統控制和數據收集。
LTQ-Orbitrap質譜儀所采集的質譜數據利用Mascot(Version 2.6.0)軟件進行數據檢索,檢索數據庫為人源庫(UniProt,約17萬個蛋白質)。檢索參數設為:甲硫氨酸殘基(+15.994 9 Da)為可變修飾,無酶切,母離子質量誤差為20 ppm,二級碎片離子誤差為0.8 Da。多肽篩選門檻設定如下:得分值高于20,假陽性率(FDR)小于1%。多肽定量采用MaxQuant軟件(http://maxquant.org/,version 1.6.1.0)進行數據分析。假陽性率(false discovery rate,FDR)為0.01。
將MaxQuant軟件所得的肽段信號強度導入Perseus軟件進行過濾無效值、對數變換、正態分布以及缺失值補齊等數據前處理。采用悟空平臺(https://www.omicsolution.org/wu-kong-beta-linux/main/)構建PLS-DA模型及非參數檢驗。使用在線數據庫Panther和String分別對差異肽段匹配的蛋白質進行GO功能和KEGG信號通路分析。
采用超濾法提取血清內源性多肽時,多肽與蛋白質的結合以及超濾膜的吸附作用會導致嚴重的多肽損失。為此,本實驗對超濾法提取血清內源性多肽過程進行了優化,以低濃度乙腈處理超濾管中被截留的蛋白質組分,改善了多肽回收率。標準多肽回收率測試表明,無低濃度乙腈處理的直接超濾法中,強疏水性多肽(AINVAVHVF、VLDAVRGSPAINVAVHVF、NVHSAGAAGSRMNFRPGVLS)無法被檢測到,弱疏水性和親水性多肽(ATASRGASQAGAPQGR、SSKITHR、RHDWGHEKQ)的回收率均低于40%。而經低濃度乙腈處理后,弱疏水性和親水性多肽的回收率均提高至90%以上,強疏水性多肽被質譜成功鑒定,回收率也可達約30%~50%。進一步將該方法用于血清內源性多肽的提取中,通過LC-MS/MS可從5 μL健康人血清中鑒定到868條內源性多肽,3針重復可鑒定到598條內源性多肽,是血清直接超濾鑒定數量的2倍,顯示了低濃度乙腈輔助超濾在實際樣本多肽組深度鑒定中的有效性與可靠性。由此,建立了低濃度乙腈輔助超濾法結合LC-MS/MS的多肽組學分析方法,用于糖尿病3個發展階段的血清內源性多肽組的分析鑒定。根據Mascot檢索結果及MaxQuant定量結果,認為至少一組中有60%以上樣本鑒定到的肽段為可靠肽段。對23例血清樣本所鑒定的unique peptide取并集,共鑒定到690條可靠血清內源性肽段。構建PLS-DA模型,將實際樣品投影到兩個主成分組成的二維平面上(見圖1),對照組(N組)、糖尿病前期組(preT2D組)和2型糖尿病組(T2D組)之間有明顯的分離趨勢,表明3類樣本在多肽水平上具有顯著性差異。

圖1 3組樣品間構建的PLS-DA模型散點圖Fig.1 Partial least squares-discriminant analysis(PLS-DA)score plots for the three groups
2.2.1僅在preT2D組表達和僅在T2D組表達的血清內源性多肽
對這690條可靠肽段進一步分析發現有39條內源性多肽(對應23個蛋白質)僅在preT2D組中被鑒定(表2,上標為a的肽段),有97條內源性多肽(對應43個蛋白質)僅在T2D組中被檢測(表2,上標為b的肽段)。

表2 差異多肽及匹配蛋白質的詳細信息列表Table2 Detailed information of differential peptides and matched proteins

表2 (續)Table2 (Continued)

表2 (續)Table2 (Continued)

表2 (續)Table2 (Continued)
a:endogenous peptides detected only in preT2D group;b:endogenous peptides detected only in T2D group;-:not significantly changed peptide compared with the normal group.
2.2.2ANOVA方差分析尋找3組間顯著性變化的內源性多肽
對3組均鑒定到的內源性多肽(376條)進行ANOVA方差分析(p-value<0.05,fold change>2),發現3組間有27條顯著性變化多肽。
對這27條差異多肽做聚類分析并對每個聚類部分的差異多肽在3組中的強度進行統計(見圖2),結果顯示這些差異肽段主要聚類為4部分(以N組作為參考),包括在T2D組顯著性變化的肽段(圖2a:下調4條肽段,上調9條肽段)、在preT2D組顯著性變化的肽段(圖2b:下調3條肽段,上調2條肽段)、在preT2D組和T2D組同時顯著性變化的肽段(圖2c:1條下調和5條上調的肽段)以及3條在preT2D組上調而在T2D組下調的肽段(圖2d)。
將2.2.1節和2.2.2節所得的差異多肽進行匯總,共篩選出163條差異多肽(匹配56個蛋白質),作為進一步研究糖尿病標志物的候選集。它們的詳細信息(包括肽段序列、匹配的蛋白質信息以及它們在preT2D組和T2D組的變化趨勢)見表2。

圖2 3組間顯著性變化多肽的強度Fig.2 Intensities of the significantly changed peptides among the three groups a.Cluster that the peptide contents are significantly different (p-value<0.05,fold change>2)only in the type 2 diabetes (T2D)group;b.cluster that the peptide contents are significantly different only in the preT2D group.c.cluster that the peptides are up-regulated or down-regulated in both preT2D and T2D groups;d.cluster that the peptides are up-regulated in the preT2D group but down-regulated in the T2D group.
2.3.1GO功能分析
對這些差異多肽所匹配的蛋白質通過在線數據庫Panther進行功能注釋分析(見圖3)。結果表明這些蛋白質的功能類別主要涉及分子水平的結合、催化、轉運、調節,其中結合功能占主導地位;它們多數位于細胞外,也有一部分位于細胞膜以及組織中;所參與的生物學過程主要為代謝、應激、生物黏附、免疫系統、生物調節等過程。

圖3 差異多肽所匹配蛋白質的GO分析Fig.3 Gene ontology analysis of the differential peptide matched proteins a.molecular function analysis;b.cellular component analysis;c.biological process analysis.

圖4 差異多肽匹配蛋白質的KEGG信號通路分析Fig.4 KEGG signal pathway of differential peptide matched proteins
2.3.2KEGG信號通路分析
將差異蛋白質導入在線數據庫String中進行KEGG信號通路分析,結果顯示這些蛋白質主要富集在補體(complement cascade)和凝血(coagulation cascade)通路中,共涉及14個蛋白質(見圖4)。此外,還有4個蛋白質(APOA1、APOA4、APOC3、APOE)富集在膽固醇代謝(cholesterol metabolism)通路中。補體系統是固有免疫系統的重要組成部分,通過經典途徑、旁路途徑及凝集素途徑被激活,主要介導免疫和炎癥過程。補體系統的激活也與胰島素抵抗存在潛在聯系,可能與2型糖尿病及其并發癥相關[24,25]。凝血系統在機體中也發揮著重要的作用,尤其是在抵抗感染和維持機體止血方面。糖尿病的發生發展過程也涉及凝血系統的激活,研究發現高血糖可以通過加劇葡萄糖氧化和使線粒體產生活性氧成分而增加氧化應激,損傷血管內膜使病人處于凝血、纖溶等血液病理狀態[26,27]。糖尿病患者長期高凝血狀態還是其發生心血管疾病腦卒中和栓塞的高風險因素[28,29]。另外,血脂代謝的異常也被報道為2型糖尿病高風險因素以及病理表現特點之一,可以作為糖尿病早期篩查和診斷以及預測糖尿病患者脂質代謝紊亂相關并發癥的早期指標[30]。
除此之外,還有包括S100-A8蛋白、凝溶膠蛋白、叢生蛋白、結合珠蛋白、組蛋白H2B型F-S、胰島素樣生長因子結合蛋白3、胸腺素β4、α2-HS-糖蛋白、甲狀腺素轉鐵蛋白等蛋白質可能也參與了2型糖尿病的病理過程。S100-A8蛋白、凝溶膠蛋白主要介導炎癥過程,與糖尿病的發生發展密切相關[31-35]。叢生蛋白和結合珠蛋白被報道與糖尿病眼病、腎病等并發癥有關[36-39]。胰島素樣生長因子結合蛋白3是一種癌癥風險的保護劑,是評估癌癥風險的重要因子,具有潛在的應用價值,也與糖尿病相關[40-42]。胸腺素β4具有多重生物學功能,在組織再生、重塑、創傷愈合、維持肌動蛋白平衡、腫瘤發病與轉移、細胞凋亡、炎癥、血管生成、毛囊發育等生理、病理過程中扮演著極為重要的角色,也可能參與糖尿病病理過程[43]。α2-HS-糖蛋白是先天免疫Toll-like受體(TLR)-4,也可以與胰島素受體β亞單位相結合來阻止胰島素受體酪氨酸激酶調節胰島素信號,從而出現胰島素抵抗,與T2D的發病關系密切[44]。
綜上所述,通過對2型糖尿病3個不同發展階段的血清樣本內源性多肽組的定性定量分析,從正常組、糖尿病前期組及2型糖尿病組樣品中篩選出163條差異內源性多肽,為2型糖尿病早期篩查、早期診斷及分子分型等生物標志物的發現提供了可能。