孟 霄,管 艷
濰坊醫學院 醫學檢驗學院,山東濰坊 261053
呼吸系統疾病是影響公共健康的重大問題,嚴重威脅著人類健康。肺癌是臨床最常見的呼吸系統疾病之一,其發病率和病死率均居各類型腫瘤之首,受到廣泛關注[1]。此外,肺結核、慢性阻塞性肺病、肺炎等呼吸系統疾病給患者的家庭和社會帶來了巨大的經濟負擔。因此,揭示呼吸系統疾病的發生機制、尋找特異性生物標志物以及發現新治療靶點是改善現有診療狀況的重要策略。1995年,Wilkins 等首次提出蛋白質組學(proteomics)的概念——由基因組、細胞或組織類型表達的全部蛋白質成分[2]。幾十年來,蛋白質組學技術迅速發展,已成為基因組技術的重要補充,憑借獨特的技術方法和研究策略,為呼吸系統疾病病因、診斷、治療和耐藥性等方面的研究提供了更加全面的依據。本文簡述了蛋白質組學技術,并對近年來蛋白質組學技術在呼吸系統疾病研究中的應用進行了總結。
1.1 雙向凝膠電泳(two-dimensional gel electrophoresis,2-DE) 和熒光差異凝膠電泳(difference in gel electrophoresis,DIGE)2-DE 技術可根據蛋白質的等電點和分子量將復雜的蛋白質混合物分解為單個的蛋白質點,從而實現蛋白質的大規模分析[3]。2-DE 的缺點是重復性差及敏感度有限。2DDIGE 是2-DE 的一種進化,用不同的熒光染料標記蛋白質樣品,在同一塊膠上共同電泳,通過掃描不同波長的最終圖像,檢測凝膠上不同樣品的斑點,從而克服了2-DE 的缺點[4]。
近年來,流行病學數據顯示肺腺癌的發病率極高,已成為最常見的肺癌病理類型[5],為了尋找肺腺癌的生物標志物,Liu 等[6]分離了A549 和16HBE 的細胞線粒體,提取線粒體總蛋白并進行2-DE,采用液相色譜-串聯質譜(liquid chromatography-tandem mass spectrometry,LC-MS/MS)進行鑒定,發現AAA-TOB3 在肺腺癌線粒體中顯著上調,該研究提示AAA-TOB3 表達增高可能與肺腺癌的發生、發展有關。Li 等[7]使用2D-DIGE 技術分析肺腺癌患者的腫瘤標本,發現PRDX6型蛋白表達與腫瘤反應密切相關,可作為化療不良反應的預測性生物標志物。Ciereszko 等[8]采用2DDIGE 技術對肺癌患者化療前后的血液樣本進行比較分析,發現對照組與肺癌組的轉鐵蛋白和血清轉鐵蛋白水平差異有統計學意義,這可能反映了化療誘導貧血后鐵代謝的紊亂,此外腺癌(adenocarcinoma,ADC) 患者與鱗狀細胞癌(squamous cell carcinoma,SCC)患者的血漿蛋白差異也有統計學意義,這一發現提示蛋白質組學可用于區分ADC 與SCC。
1.2 數據非依賴性采集定量技術(data independent acquisition,DIA)該技術是將質譜整個全掃描范圍分為若干個窗口,高速、循環地對每個窗口中所有離子進行選擇、碎裂、檢測,從而無遺漏、無差異地獲得離子的全部碎片信息[9]。連續窗口全理論碎片離子采集質譜(sequential window acquisition of all theoretical fragment ions mass spectra,SWATHMS)是DIA 的一種特殊變體,該方法在快速掃描混合質譜儀上進行測量,通常采用四極桿作為第一質量分析儀,TOF 或Orbitrap 作為第二質量分析儀。在SWATH-MS 模式下,先記錄一個前驅體離子光譜,然后記錄具有寬前驅體隔離窗口的碎片離子光譜,通過在一個確定的質量范圍內重復循環連續前驅體隔離窗,記錄一個全面的數據集。與經典的靶向蛋白質組學方法平行反應監測(parallel reaction monitoring,PRM)相比,SWATHMS 對肽的定量敏感度低3~ 10 倍,其優勢是支持覆蓋1 000 種蛋白質的多肽的定量分析,將深度覆蓋能力與精準定量分析相結合,適合復雜樣品的大規模定量[10]。
Ortea 等[11]采用DIA 技術對支氣管肺泡灌洗液(bronchoalveolar lavage fluid,BALF) 進行定量蛋白質組學研究,證實了CO4A、HPT 和GTSP1是潛在的肺癌生物標志物。Yang 等[12]從健康對照者、2型糖尿病患者、肺腺癌患者和2型糖尿病合并肺腺癌患者中共采集20 份樣本進行SWATHMS 分析,用PRM-MS 分析和酶聯免疫吸附劑測定法(enzyme-linked immunosorbent assay,ELISA)進行了驗證,發現妊娠區帶蛋白(pregnancy zone protein,PZP)可作為一種新的血清生物標志物用于2型糖尿病合并肺腺癌的輔助診斷和早期治療。Ma 等[13]對肺癌患者和健康人群的呼出氣冷凝液(exhaled breath condensate,EBC) 樣本進行DIA 分析,共鑒定出1 151個蛋白質,與健康對照組相比,肺癌組有10 種蛋白表達顯著上調,其中S100A11、ANXA1、ENO1、和FABP5 可能是肺癌的新型生物標志物。Geary 等[14]在肺腫瘤手術過程中采集血液,用以鑒定從腫瘤流至肺靜脈的蛋白質,發現與健康肺靜脈血相比,腫瘤引流靜脈血中40 種蛋白質的豐度增加,使用SWATHMS 對這些蛋白質進行分析后,發現AQR、C9、EPPK1、F13B、GPI、GPX3、LAMC1、LDHA、MTA2、NAMPT、P4HB 和SCP2 均與肺腺癌有關。以上研究表明DIA 技術有利于肺癌的早期篩查和臨床診斷,可作為發現肺癌生物標志物的重要工具。
1.3 非標記定量蛋白質組學技術(label-free quantitative proteomics,LFQP)LFQP 技術是對蛋白質酶解肽段進行質譜分析,通過比較肽段的質譜信號或肽段數量完成相應蛋白質的定量。該技術對質譜分析高度敏感,不容易出錯,因此能夠從體液(血液、血漿、唾液和尿液)、細胞系和組織等復雜樣本中鑒定數千種蛋白質,適用于生物樣本的大規模分析,并且具有成本低、耗時短等優勢,在生物醫學研究領域得到了廣泛認可[15]。
結核性胸腔積液(tuberculous pleural effusion,TBPE)和惡性胸腔積液(malignant pleural effusion,MPE)在滲出性胸腔積液中較為常見,二者的鑒別診斷在臨床上備受關注[16],LFQP 技術有助于發現二者潛在的鑒別診斷標志物。Pan 等[17]對TBPE 和MPE 進行非標記定量蛋白質組學分析,用Western blot 和ELISA 對其進行驗證,發現AGP1、ORM2、C9 和SERPING1 這4 種蛋白可能是TBPE 與MPE的鑒別診斷標志物。此外,LFQP 技術也為結核分枝桿菌感染機制的研究和生物標志物的發現提供了重要數據。Li 等[18]采用LFQP 技術鑒定兒童活動性肺結核(active tuberculosis,ATB)與潛伏結核感染(latent tuberculosis infection,LTBI) 的血漿蛋白差異,選擇4 種蛋白用qPCR 和Western blot 進一步驗證,發現與LTBI 相比,ATB 組中XRCC4、PCF11 和SEMA4A 的表達呈上升趨勢。
1.4 同位素親和標簽技術(isotope-coded affinity tags,ICAT)ICAT 技術是用帶有生物素半分子的同位素標簽標記樣品中蛋白質的半胱氨酸殘基,標記后的蛋白樣品經過酶解成為肽段后,經過親和層析,進行質譜分析鑒定[19]。該方法只標記蛋白質的半胱氨酸殘基,而生物素幫助捕獲含有半胱氨酸的多肽,因此大大降低了樣品的復雜性,從而簡化了之后的質譜分析過程。ICAT 的主要缺點是連接區中的氘原子改變反相色譜過程中輕肽和重肽的洗脫時間,導致了肽的鑒定困難,而ICAT 的新變種——可裂解同位素親和標記(cleavable isotope-coded affinity tag,c-ICAT),用13C、13C9或12C9來代替氘原子,解決了這一問題[15]。
非小細胞肺癌 (non-small cell lung cancer,NSCLC)約占肺癌的80%。由于大多數NSCLC 患者在就診時已屬晚期,故總體的治療效果不理想[20]。利用ICAT 技術可發現用于預測NSCLC 藥物療效的新型生物標志物,對于開發新的治療途徑有重要作用。Qu 等[21]使用ICAT 和串聯質譜技術比較了NSCLC 細胞系H460 及其吉西他濱耐藥亞系H460/GEM 的蛋白質組特征,并用免疫組織化學方法進行驗證,結果顯示66.1%的NSCLC 腫瘤表達抗藥蛋白SORCIN,該蛋白的過度表達與吉西他濱耐藥和預后不良有關。
1.5 同位素標記相對和絕對定量技術(isobaric tags for relative and absolute quantification,ITRAQ)和串聯質譜標簽法(tandem mass tag,TMT)ITRAQ 技術是由AB SCIEX 公司開發的基于其公司生產的質譜的體外同位素標記技術。該技術可分析多達4個(iTRAQ 4-plex)或8個(iTRAQ 8-plex)不同的生物樣本,與無標記質譜技術相比,增加了統計相關性和結果準確性[22]。TMT 是用等壓標簽標記不同樣本中的多肽,將其混合后以反相高效液相色譜儀結合串聯質譜儀進行分析。其流程包括蛋白質消化、TMT 反應、樣品純化、分離、高效液相色譜-質譜分析和數據分析[23]。TMT 試劑最初能夠同時定量6個樣本,之后進一步擴展到10~ 11個樣本,最近開發的16-plex TMT pro(TMT16)試劑將通道擴展到了16個,實現了一次性對16個樣品的量化,在多達16個不同的生物樣本中,可對超過10 000個蛋白質和翻譯后修飾同時進行定量分析,為基礎和臨床研究提供了有力工具[24]。
為尋找新型冠狀病毒肺炎(COVID-19)潛在的治療靶點,Shu 等[25]采用22 份新冠肺炎患者感染高峰期血漿和8 份健康人血漿,經TMT 標記定量分析、基因本體論(gene ontology,GO)分析和京都基因與基因組百科全書(Kyoto encyclopedia of genes and genomes,KEGG) 分析,發現差異蛋白高度富集于炎癥、免疫細胞遷移/脫顆粒、補體系統凝血級聯和能量代謝過程,最終確定了11個宿主蛋白和1 組生物標志物組合。慢性阻塞性肺疾病(chronic obstructive pulmonary disease,COPD)是全球病死率和發病率較高的疾病之一,嚴重影響患者身體健康和生活質量,為全球第四大死亡原因[26],TMT 為探究COPD 的生物標志物提供了技術方法。Sun 等[27]采集19例COPD 患者和19例對照者的EBC 樣本進行TMT 分析,共鑒定出257 種蛋白質,與對照組相比,COPD 患者有24 種蛋白表達存在差異,經過GO 和KEGG 分析,發現這些蛋白可能是COPD 中EBC 的新型生物標志物。此外,Zhang 等[28]收集了1例接受HER2 定向治療和化療并存活了7年的轉移性肺腺癌患者的腫瘤組織,采用Super-SILAC 和TMT10plex 定量蛋白質組學方法對不同轉移瘤進行磷酸化蛋白質組學分析,經靶向多反應監測(multiple reaction monitoring,MRM)技術檢測,發現cdk12-g879v 突變可能與肺轉移部位的化療易感性有關。為了研究雷公藤甲素(triptolide,TP)誘導肺癌細胞凋亡的分子機制,Li 等[29]使用iTRAQ 技術分析了TP 處理NSCLC 的A549 細胞后蛋白譜的變化,經GO 與KEGG 分析,發現TP 對A549 肺腺癌細胞有抗腫瘤作用。該發現揭示了可作為肺癌治療潛在靶點的候選蛋白。
1.6 細胞培養穩定同位素標記技術(stable isotope labeling by amino acids in cell culture,SILAC)SILAC技術是高通量定量蛋白質組學的有力手段,使用穩定同位素標記的氨基酸對整個細胞蛋白質組進行代謝編碼,從而實現高精度的蛋白質定量[30]。該技術將同位素標記的氨基酸摻入細胞的所有蛋白質中——輕型(1H、12C、14N)細胞的蛋白質組成可以與重型(2H、13C、15N)細胞的蛋白質組成進行比較[31],其主要優點是能夠在單個儀器運行中同時檢測同位素標記的肽,從而保證大量肽的相對定量[32]。
SILAC 技術已被用于研發肺癌的新療法。Duan 等[33]利用SILAC 定量蛋白質組學方法,從小細胞肺癌細胞系中鑒定出82個去整合素金屬蛋白酶12(a disintegrin and metalloproteinase domain 12,ADAM12S) 調控蛋白,通過生物信息學分析、基因操作和體外實驗,揭示了ADAM12S 可促進小細胞肺癌細胞的增殖、集落形成、遷移和侵襲,為小細胞肺癌的治療干預研究提供了有價值的信息。Wang 等[34]采用SILAC 技術對肺癌細胞中6-O-angeloylenolin(6-OA) 調節蛋白進行了鑒定,發現6-OA 通過產生活性氧(reactive oxygen species,ROS) 發揮抗癌作用,提示6-OA 可用于肺癌的治療。Wang 等[35]采用SILAC 技術結合生物信息學分析,發現異去氧苦地膽素(isodeoxyelephantopin,ESI) 可以通過Nrf2-p62-Keap1 反饋環激活保護性自噬以維持細胞存活,靶向此調控軸結合ESI 治療可作為肺癌治療的新策略。
鳥槍法(shotgun)是一種高通量的蛋白質鑒定技術,其原理是將蛋白質混合物酶解成肽段,引入質譜儀對這些肽進行分析,數據集生成后,與數據庫中的理論肽進行匹配[36]。該技術的特色是基于肽段水平而非完整的蛋白質,可實現自動化、快速、高通量的蛋白組學分析。
鳥槍法已被用于研究多種呼吸系統疾病的發病機制和診斷方法。Rahman 等[37]采用鳥槍法在肺癌患者的氣道上皮細胞中鑒定出2 869個蛋白,選擇其中312個顯著改變的蛋白進行WebGestalt途徑分析,在這些蛋白質中,有48個代謝酶在支氣管上皮細胞調節中表現為失調,這一發現為研究肺癌的分子發病機制提供了新的思路。Heyder等[38]采用鳥槍法對慢性肺部疾病患者支氣管肺泡灌洗液和血清中的Fc 多糖進行檢測,發現IgG4 Fc 段半乳糖基化與慢性肺部疾病有關,該發現有助于解釋潛在肺部疾病的病因。Rivera 等[39]采集了10 份用于診斷COVID-19 的口咽拭子樣本,其中5 份為核酸檢測陽性標本,5 份為核酸檢測陰性標本,用鳥槍法鑒定這些樣本中的蛋白質,所有的陽性標本中均檢測到SARS-CoV-2 核蛋白的特異性肽段。
迄今為止,蛋白質組學的各種分析技術不斷完善與革新,其研究的廣度和深度也在迅速發展,使我們對于蛋白質的組成、表達和功能有了更加深刻的理解。利用蛋白質組學技術,已成功篩選出很多較為特異的新型潛在生物標志物,為肺癌等呼吸系統疾病的早期診斷和治療提供了可能的靶點。將來,蛋白質組學憑借已取得的重大進展及其獨特優勢,會在探索呼吸系統疾病發病機制、診斷、尋找有效治療靶點等方面發揮更大作用。