楊若愚,李曉凡,李馨逸,朱利揚,王碧云
隨著我國人口老齡化的不斷加劇,老年人的健康狀況越來越受到重視。有相關研究表明,老年人肌肉衰減綜合癥的發病率呈上升趨勢,嚴重影響到了老年人群的生活質量[1]。 肌肉衰減綜合癥是一種以肌肉質量、力量、功能喪失為特征的老年綜合征,可能會導致老年人肌肉萎縮、 肌力下降、 行動能力受限、跌倒、骨折、喪失自主生活能力甚至死亡,嚴重影響患者的身心健康,并給家庭社會帶來沉重負擔[2]。
近年來的研究數據顯示,肌肉衰減綜合癥作為一種增齡性疾病,與多種發病因素相關,這些因素主要包括:個體運動量消減、神經肌肉功能衰退、蛋白質的攝取及合成降低、個體激素水平波動、細胞凋亡及微環境變化、骨骼肌線粒體功能異常、活性氧水平增高、 慢性炎癥反應、 骨骼肌自噬性程序性細胞死亡、鈣的穩定狀態失衡、自由基氧化受損、缺乏熱量與蛋白質的攝取、 骨骼肌修護功能損壞及基因與人種等[3-4]。 肌肉衰減綜合癥的高發人群為老年人,多伴有骨質疏松癥[5],且與跌倒、活動障礙及代謝紊亂密切相關[6],并易造成慢性心肺疾病和吞咽功能障礙,是老年人生理功能逐漸減退的表現之一和重要原因。
肌肉衰減綜合癥的發病機制目前尚不完全明確,但其與年齡、激素水平、炎癥及促細胞分解因子、神經肌肉調節失衡、營養等因素有關[7]。 隨著高通量測序技術的不斷發展,高通量測序技術在人類疾病診斷、文庫篩選、轉錄調控、植物反轉錄研究等方面得到了越來越普遍的應用,并取得了巨大的成功,使得通過高通量測序技術研究肌肉衰減綜合癥成為了一種可能。 通過篩選與肌肉衰減綜合癥可能相關的差異表達基因,為之后針對肌肉衰減綜合癥進行有效的靶基因治療,提供肌肉衰減綜合癥可靠的診斷和預后生物學標志物的研究及診斷模型的建立打下基礎。本研究利用生物信息學的方法,從美國國立生物 中 心 (National Center for Biotechnology Information,NCBI)的基因芯片公共數據庫(GEO)下載并整理股外側肌增齡性的轉錄組高通量數據,篩選差異表達基因,尋找可能與骨骼肌增齡性因素相關的分子標記作為肌肉衰減綜合癥相關的診斷、治療、預后的生物學標志物。
GSE1428 數據集包含的10 名年輕 (19~25 歲)和12 名老年(70~80 歲)男性受試者,均為高加索人種。這些受試者健康狀況良好,體檢及臨床實驗室檢查正常。在采集樣本前的6 個月內,受試者沒有服用過處方藥,也沒有進行過阻抗或耐力訓練[8]。
1.2.1 數據獲取及標準化處理
利用GEO 下載與肌肉衰減綜合癥相關的基因表達數據集GSE1428,用于篩選差異表達基因,該組數據采用Affymetrix Human Genome U133A Array(GPL96)平臺進行檢測。利用R 語言平臺對GSE1428芯片數據集進行數據評估和標準化處理。
1.2.2 差異基因的篩選
利用R 語言平臺讀取探針平臺文件GPL96,安裝并加載limma 包進行差異基因的分析,安裝并加載BiomaRt 包對基因ID 進行轉換和注釋。 分析年輕男性股外側肌樣本和老年男性股外側肌樣本獲得差異基因,包括表達上調基因和表達下調基因,顯著差異基因的篩選條件設定為adj.P<0.05 且|log FC|>0.6(adj.P 為調整后的P,FC 為差異倍數,指老年人基因表達與青年人基因表達的比值),并利用R 語言軟件包繪制相關圖表。
1.2.3 差異基因的富集分析
利用R 語言平臺和Cytoscape 軟件進行GO 和KEGG pathway 富集分析并繪制相關圖表。 其中,GO富集分析包括生物過程 (Biological Process,BP)、分子 功 能 (Molecularfunction,MF) 和 細 胞 組 分(Cell Components,CC),adj.P<0.05 為具有統計學意義。
1.2.4 蛋白互作網絡制作及核心基因的確定
利用STRING 在線工具和Cytoscape 軟件制作蛋白互作網絡,并篩選相關核心基因。
經過對GSE1428 芯片數據進行基因表達差異分析及差異基因的篩選,共獲得差異表達基因2 028個,其中有2 020 個表達下調基因和8 個表達上調基因,根據adj.P 升序排序,將其中排序前25 個差異表達的基因列入表1。

表1 差異表達基因的篩選Table1 Screening of Differentially Expressed Genes
在篩選出差異基因后,對數據進行可視化分析。利用R 語言平臺制作差異表達基因的熱圖(圖1)和火山圖(圖2)。 如圖1 所示,熱圖中的每個小方格表示每個基因,其顏色表示該基因表達量大小,顏色越深,其表達量就越大(紅色為上調,綠色為下調)。 每行代表不同樣本中每個基因的表達量情況,每列表示每個樣品中所有基因的表達量情況。 可從圖2 直觀地看到上調基因和下調基因差異倍數與adj.P 的分布情況。

圖1 差異基因熱圖Figure1 Heat Map of Differential Genes
2.2.1 GO 富集分析
在進行差異基因的篩選之后,利用R 語言平臺和Cytoscape 以及Cytoscape 的插件BinGO 進行GO富集分析,GO 分析具體過程包括生物過程、分子功能和細胞組分。 圖3 為GO 功能富集分析的結果。

圖2 差異基因火山圖Figure2 Volcano Map of Differential Genes
如圖3 所示,差異表達基因主要參與信號轉導(signal transduction)、RNA 聚 合 酶Ⅱ啟 動 子 轉 錄 的正調控 (positive regulation of transcription from RNA polymerase II promoter)、炎 癥 反 應(inflammatory response)等生物過程。 差異表達基因主要參與的分子功能方面有轉錄激活子活性、RNA 聚合酶II 核心啟動子近端區序列特異性結合(transcriptional activator activity, RNA polymerase II core promoter proximal region sequence-specific binding)、蛋白質異源二聚化活性(protein heterodimerization activity)、受 體 結 合(receptor binding)等。 而在細胞組分方面,差異基因主要與細胞質膜(plasma membrane)、質膜的組成成分(integral component of plasma membrane)、 細胞外基質(extracellular exosome)等方面有關。

圖3 GO 功能富集分析氣泡圖Figure3 Bubble Diagram of GO Functional Enrichment Analysis
對其KEGG 通路富集分析,得到了KEGG 通路相關數據信息。 圖4 為KEGG 通路富集分析的氣泡圖。其中富集差異基因較多的通路有代謝信號轉導通路(metabolic pathways)、 神經活性配體受體相互作用通路(neuroactive ligand-receptor interaction)、抗菌素生物合成通路(biosynthesis antibotics)和細胞因子-細胞因子受體相互作用通路(cytokine-cytokine receptor interaction)等。

圖4 KEGG 通路富集分析的氣泡圖Figure4 Bubble Diagram of KEGG Pathway Enrichment Analysis
2.2.2 蛋白互作網絡及核心基因的篩選
基于差異基因的篩選結果和KEGG 通路相關數據信息,使用STRING 在線數據庫將差異基因導入,將最低互作分值(minimum required interaction score)設置成最高可信(highest confidence 0.9),刪除與其他蛋白質無相互作用的節點后,完成肌肉衰減綜合癥的蛋白互作網絡,分析差異基因所編碼的蛋白質之間的相互作用,得到蛋白互作網絡圖(圖5)。

圖5 差異基因的蛋白互作網絡圖Figure5 Map of Protein Interaction Networks of Differential Genes
將圖5 所顯示的蛋白互作網路的數據導入Cytoscape 軟件進行分析,計算節點的度(degree),利用蛋白互作網絡核心基因互相作用的具體算法得出基因在互作網絡中的權重值,數值越大說明該基因在網絡中的作用越大,并列出degree 排名前10 位的中心節點蛋白,然后與差異基因的KEGG 富集分析所得到的顯著性基因取交集,得到核心基因(hub genes)。圖6 為排名前10 的核心基因的相互作用關系。

圖6 排名前10 位的核心基因互作網絡關系圖Figure6 Top 10 Core Gene Interaction Networks
表2 顯示了圖6 中所涉及的核心基因的具體信息及其對應的degree。 這些基因對于肌肉衰減綜合癥都是下調基因,說明這10 個基因表達水平的下調可能與肌肉衰減綜合癥的發生和發展存在著一定的關系。

表2 核心基因的具體信息Table2 Basic Information of Hub Gene
肌肉衰減綜合癥作為一種增齡性的退行性疾病,其發生與發展有著循序漸進的過程,很多基因在肌肉衰減綜合癥的發生和進展過程中起到至關重要的作用[9]。 肌肉衰減綜合癥作為一種在老年人群中常見的疾病,對老年人的日常生活活動能力造成了嚴重的危害,但卻又往往被忽視,所以探究與肌肉衰減綜合癥有關的差異基因則具有重要的臨床意義與研究價值[10-11]。雖然有許多關于肌肉衰減綜合癥發生機制的研究,但其發生機制仍未完全明確,隨著新技術特別是高通量基因測序技術的不斷發展,通過從基因層面對肌肉衰減綜合癥進行進一步的討論和研究,可對肌肉衰減綜合癥有更深層次的了解。本研究通過對基因芯片數據再挖掘分析,尋找與肌肉衰減綜合癥有關的差異表達基因,為之后研究肌肉衰減綜合癥的機制、診斷、治療和預后提供參考。
本研究首先通過對芯片數據集GSE1428 進行分析,最終發現有2 028 個差異表達基因,其中有2 020個下調基因和8 個上調基因,隨后對這些差異基因進行GO 功能富集分析,發現差異基因主要富集于信號轉導、RNA 聚合酶Ⅱ啟動子轉錄的正調控、 炎癥反應等生物過程。 在分子功能方面主要富集于轉錄激活子活性,RNA 聚合酶II 核心啟動子近端區序列特異性結合、蛋白質異源二聚化活性、受體結合等。 而在細胞組分方面,差異基因富集于細胞質膜、質膜的組成成分、細胞外基質等。 結果提示這些差異基因可能通過不同的信號通路、生物學過程產生了關鍵的作用,從而影響到肌肉衰減綜合癥的發生和發展。
在篩選所得到的差異基因KEGG 富集通路結果中,神經活性配體-受體相互作用這一通路具有最高的顯著性,而鈣信號通路同時具有較高顯著性和較多的基因富集。 肌肉衰減綜合癥患者患病期間肌肉含量的減少和肌肉生理功能的衰退可能與多種神經遞質及其受體相關,而神經活性配體受體相互作用信號通路是質膜上所有與細胞內外信號通路相關的受體和配體的集合[12]。
肌肉衰減綜合癥患者的部分臨床表現如肌肉肌力的減弱和引發肌肉收縮的刺激閾值增大都或許與鈣信號通路相關。Ca2+通道的化學本質是載體蛋白,在達到刺激閾值之后,Ca2+可與此載體蛋白相結合從而被轉運,進而引發后續生理功能的實現,這種Ca2+和載體蛋白的結合過程類似酶與底物的結合過程,具有一定的專一性。生物體中刺激以神經沖動的形式通過運動神經傳遞至效應器即可引起肌肉收縮,即沖動由神經肌肉接頭傳達于肌纖維細胞膜,使肌纖維細胞膜產生一個可傳導的動作電位,即興奮-收縮偶聯,從而引發橫橋運動,引起肌肉的收縮,收縮后的肌肉必須發生舒張后才具有下一次收縮的條件[13]。 在發生興奮-收縮偶聯過程中,由刺激產生的動作電位沿橫管系統進入三聯管,此時橫管膜去極化使終池大量釋放Ca2+,Ca2+通過鈣離子通道的轉運[14],才可以產生一系列的肌肉功能運動。除了肌細胞本身,衰老、缺氧、缺血所造成的損傷會引起機體過度釋放興奮性神經遞質,從而使突觸后膜處于一種持續性去極化狀態, 造成大量鈣離子內流,引發細胞內一系列鈣離子的生化反應,導致神經細胞凋亡[15]。
本研究得到的可能與增齡性骨骼肌肌力和功能衰減相關的排名前10 的核心基因,可為后續尋找肌肉衰減綜合癥相關分子標記物提供線索,但因為是通過對組學數據進行的生物信息學分析,并沒有進行相關的功能驗證,所以如果直接進行應用還存在一定問題,如果能在模型動物上進行相關的基因功能驗證則較為穩妥。
骨骼肌增齡性變化存在大量的基因表達的變化,其中絕大多數為基因表達的下調;差異基因可能通過多條重要的分子通路影響老年人群骨骼肌功能的下降和衰退,調控肌肉衰減綜合癥的發生與發展;篩選出的核心基因可為后續肌肉衰減綜合癥分子標記的相關研究工作提供新的線索和思路。