張艷,吳瑜瑜
(福建醫科大學附屬第二醫院眼科,福建 泉州 362000)
視網膜母細胞瘤(retinoblastoma,RB)是兒童最常見眼內惡性腫瘤,可損害患兒視力、眼球,甚至危及生命。2/3患者3歲以內發病,在世界范圍內,新生兒發病率為1:16 000~1:18 000,每年約有8 000例新生病例確診[1]。雖然已經發現RB1基因的突變或缺失是RB發生的主要原因,即使RB具有明確RB1突變,癌變發展過程中也會發生其他基因組的變化,例如轉錄相關基因(BCOR)是繼RB1之后最常見的突變基因[2]。而且有一部分單側發病的病例未發現RB1突變,因此近年來在探索RB1突變之外的其他發病機制。基因芯片技術能快速檢測差異表達基因(differentially expressed genes,DEGs),經過十余年的應用,已被證明是一種可靠的技術[3],大量基因芯片上的數據存儲在公共數據庫中,通過這些數據庫,整合生物信息學方法對RB和正常視網膜組織進行DEGs篩選,對其進行生物學功能、信號通路及差異基因的蛋白互作網絡(protein-protein interaction,PPI)分析,從而幫助我們進一步研究和更好地探索RB發生發展的潛在機制。
從美國國立生物技術信息中心(National Center of Biotechnolog y Information,NCBI)公共數據平臺GEO中獲取2 組基因芯片數據譜GSE97508芯片,平臺是GPL15207 [(PrimeView) Affymetrix Human Gene Expression Array)和GSE110811[4],芯片平臺是GPL16686 [(HuGene-2_0-st) Affymetrix Human Gene 2.0 ST Array transcript (gene) version],該2個芯片數據分別包括6個RB組織和3個正常視網膜組織和28個RB組織和3個正常視網膜組織。
采用GEO2R在線工具對2組芯片的RB組織標本與正常視網膜組織標本之間的DEGs進行篩選,篩選條件為|log(差異倍數FC)|>2,差異顯著性矯正P<0.05,log FC<0為下調DEGs,而log FC>0為上調DEGs。然后對2組芯片篩選出的DEGs用在線Draw Venn Diagrams(http://bioinformatics.psb.ugent.be/webtools/Venn/)軟件取交集進一步找出共同的DEGs。
基因本體注釋(gene ontology analysis,GO)是一種常用的定義基因及其RNA或蛋白產物的方法,用于識別高通量轉錄組或基因組數據的獨特生物學特性[5]。GO注釋目前包括3個方面的生物學內容:分子功能(molecular function,MF)、細胞成分(cellular components,CC)、生物過程(biological process,BP)。KEGG是1個關于基因組、疾病、生物途徑、藥物和化學物質的數據庫集合[6]。本研究采用在線STRING檢索工具(search tool for the retrieval of interacting genes,STRING)對DEGs進行GO注釋和KEGG富集通路分析,并對KEGG通路進行可視化圖形展示(P<0.05)。
采用STRING數據庫對DEGs的PPI進行可視化[7],去除網絡未連接點,并進一步篩選出中心性最高,即與其他節點關系最密切的核心基因。
本研究中有34個RB組織和6個正常視網膜組織。通過GEO2R在線工具,我們分別從基因芯片GSE97508和GSE110811中根據篩選條件為|log(差異倍數FC)|>2,差異顯著性矯正P<0.05,分別篩選出1 356和1 150個DEGs。然后利用Draw Venn Diagrams軟件對2組DEGs進一步取交集共篩選到20個常見DEGs,其中RB組織中有17個下調DEGs (logFC<0),3個上調DEGs (logFC>0) (表1,圖1)。

圖1 通過Venn Diagrams軟件對2組芯片數據(GSE97508和GSE118011)DEGs取交集共20個DEGsFigure 1 Venn Diagrams are used to intersect two groups of chip data (GSE97508 and GSE118011)DEGs,and there are 20 DEGs in total

表1 20個DEGsTable 1 20 DEGs
20個RB的DEGs的GO分析結果如下,1)上調DEGs對于生物過程(biological process,BP):DNA構象改變、染色體濃縮、調控有絲分裂細胞周期過程、姐妹染色單體分離、核分裂、細胞分裂;2)上調DEGs對于分子功能(molecular function,MF):DNA催化劑;3)下調DEGs對于BP:調節視紫紅質介導的信號通路、光刺激的感覺、光感受器細胞的修復、視覺感知、磷酸鹽代謝過程負調控、蛋白質修飾過程的負調控、類維生素A代謝過程;4)下調DEGs對于MF:細胞內環狀核苷酸激活了陽離子通道活性、cGMP連接;5)下調DEGs對于CC:光感受器外節、睫狀體、睫狀體膜、細胞膜、質膜、感光細胞內外節、神經投射、高爾基體膜和突觸(表2)。KEGG通路分析結果表明:DEGs富集于光傳導信號通路,其中包括CNGA1,CNGB1,RHO,SAG四個基因均為下調DEGs,并對通路進行可視化圖形展現(表3,圖2)。而上調DEGs沒有顯著的信號通路(P<0.05)。

圖2 DEGs 的KEGG 富集在光傳導通路,標紅色五角星為4 個DEGs,其中CNG 為CNGA1,CNGB1,RH 為RHO,Arr 為SAGFigure 2 KEGG of DEGs was enriched in the photoconductive pathway,and there were four DEGs marked with red pentagrams,among which CNG was CNGA1,CNGB1,RH was Rho,and Arr was SAG

表2 DEGs的GO功能注釋Table 2 GO analysis of DEGs

表3 DEGs的KEGG富集通路Table 3 KEGG pathway of DEGs
使用Str ing在線工具對20個DEGs進行蛋白質與蛋白質相互作用網絡的構建,結果顯示 20節點和9條相互作用關系(圖3)。發現與其他節點連接最緊密核心基因RHO,連接基因包括CNGA1,CNGB1,SAG,CABP5和BCO2。

圖3 使用String (https://string-db.org/)在線工具對20 個DEGs 進行蛋白質與蛋白質相互作用網絡的構建,結果顯示20節點和9 條相互作用關系。與其他節點連接最緊密核心基因為RHO,連接基因包括CNGA1,CNGB1,SAG,CABP5 和BCO2Figure 3 The String (https://string-db.org/) online tool showed PPI network of 20 DEGs,and the results showed 20 nodes and 9 interaction relationships.The most closely linked core gene was Rho,which included CNGA1,CNGB1,SAG,CABP5 and BCO2
RB是兒童最常見的眼內惡性腫瘤,在RB早期及時診斷和干預,患兒的存活率超過95%,而一旦發生眼外轉移,其存活率低于50%[8]。近年來對RB基因組學研究增多,本研究利用生物信息學分析方法對GEO數據庫下載的RB組織和正常視網膜組織的基因片數據進行DEGs分析,并對其進行功能聚類分析、功能富集分析和相互作用網絡分析,從而深入了解RB發生、發展的分子機制,篩選可作為除RB基因以外的診斷的關鍵基因和治療藥物靶點。
在本研究通過R B組織和正常視網膜組織的比較,共篩出20個DEGs,其中上調基因3個,下調基因17個,應用在線STRING數據庫進行GO功能注釋結果顯示表達上調基因所富集的功能主要在細胞分裂、染色體濃縮、核分裂和DNA構象改變。下調基因主要富集在光傳導、視覺感知、光感受器細胞修復、感光細胞內外節和調節視紫紅質介導的信號通路等。這些生物學過程的調節異常是參與RB發生發展。KEGG通路顯示上調基因上調DEGs沒有顯著的信號通路,下調基因參與光傳導信號通路,其中包括CNGA1,CNGB1,RHO,SAG四個基因,通過PPI網絡提示這4個基因相互聯系,并發現與其他節點連接最緊密核心基因RHO。基因RHO(rhodopsin)為視紫紅質,早先Donoso等[9]使用單克隆抗體組織病理研究在人胎兒視網膜和五個視網膜母細胞瘤中鑒定了視紫紅質,視網膜母細胞瘤中視紫紅質和s抗原的存在可能有助于理解光感受器細胞的發育,并參與視覺光轉導蛋白的表達。包括與視覺直接相關的事件。之后Hurwitz等[10]研究發現:只有2種抗視紫紅質抗體識別腫瘤上的表位,而在正常人視網膜上完整識別的五種表位的視紫紅質分子可能在視網膜母細胞瘤中不表達。二者均與本研究篩選出核心基因RHO為下調基因情況相符,因此視紫紅質低表達為RB的發生發展提供了一個新的思路,由于近年鮮有對RHO與RB相關性研究,需要對其進一步實驗驗證,希望有助于成為新的抗腫瘤治療靶點。本研究KEGG通路富集在光傳導信號通路與Hurwitz等[10]在RB中發現存在錐細胞特異性光轉導級聯反應相符,該研究推測該腫瘤沿著錐細胞譜系進行了生化分化。也與數據譜GSE11081發現感光細胞表達與視網膜母細胞瘤嚴重程度呈負相關有關聯。因此考慮RB與正常視網膜組織差異基因通路可能與光信號轉導有關。
本研究也有局限性,一是GSE11081對其提供28例RB組織進行間變質輕中重的分級,從而得出感光細胞表達與視網膜母細胞瘤嚴重程度呈負相關,而本研究并未對RB分級而是直接將RB組織與正常視網膜差異進行篩選,因此GSE110811研究表明的核孔蛋白表達增加,光感受器表達減少,是嚴重間變性RB的特征在本研究中并未發現。今后若有更多對RB輕中重分級的數據譜,可對其納入及進行分級研究;二是基因芯片數據譜才2組偏少,且發現共同差異基因過少,這些對基因功能富集和通路分析意義都是比較有限的,期待今后能從更多的數據庫納入發現更多研究RB基因的數據譜,從而豐富差異基因。
綜上所述,本文采用生物信息學方法對RB基因芯片數據進行挖掘,通過對RB發生發展的生物過程、分子功能、細胞定位和信號通路等分析,以期往能為RB發生的機制研究、腫瘤標志物的篩選及藥物靶點提供參考。