卜 珂, 古力曼·木黑亞提, 陶 寧
(新疆醫科大學公共衛生學院, 烏魯木齊 830017)
前列腺癌是中老年男性最常見的癌癥之一,2022年全球約有140萬名男性被診斷為前列腺癌,在西方發病率居男性惡性腫瘤之首,是僅次于肺癌的男性第二大癌癥死因[1]。現階段中國前列腺癌發病率也在逐年升高,在中國男性泌尿生殖系統惡性腫瘤中居首位[2],患者發現晚、預后差,是中國前列腺癌患者高死亡率的主要原因[3]。研究表明,早期診斷且接受治療的患者預期壽命在10年內可能高達99%,然而,晚期前列腺癌(遠處轉移)患者的總生存率在5年內僅為30%左右[4]。前列腺癌早期發病隱匿,不易被發現,大多數患者初診時即為晚期。隨著分子研究的深入,前列腺癌的相關基因組學以及腫瘤標志物、分子信號通路等已經成為近幾年該領域的研究重點[5],有助于提高前列腺癌的診斷率,為前列腺癌的精準治療提供依據。為進一步了解前列腺癌基因組學和分子研究的研究現狀,從宏觀視角探討前列腺癌未來可能的研究熱點和趨勢,本研究利用可視化軟件對相關研究文獻進行文獻計量和可視化圖譜展示,以期為前列腺癌的診斷和治療提供參考。
1.1 文獻來源與檢索策略中文文獻來源于中國知網、萬方和維普數據庫;英文文獻選自Web of Science和PubMed數據庫。發表時間為2011年1月1日-2022年10月31日。中文數據庫檢索方式為高級檢索,檢索式為“主題=前列腺癌基因表達 OR 主題=前列腺癌信號通路 OR 主題=前列腺癌分子機制 OR主題=前列腺癌分子生物標志物”。Web of Science核心數據庫中使用普通檢索以“(主題=Gene expression of prostate cancer)OR(主題=Signal pathway of prostate cancer)OR(主題=Molecular mechanism of prostate cancer)OR(主題=Molecular biomarker of prostate cancer)”為檢索式。PubMed數據庫中使用高級檢索,檢索式為:(All Fields=Gene expression of prostate cancer) OR (All Fields=Signal pathway of prostate cancer) OR (All Fields=Molecular mechanism of prostate cancer)OR(All Fields=Molecular biomarker of prostate cancer),文獻收集時間為2022年11月1日,數據庫文獻篩選流程見圖1。

中文數據庫1. 萬方: n=1 7222. 維普: n=6813. 知網: n=1 821英文數據庫1. PubMed: n=2 2842. Web of Science: n=3 016↓ NoteExpress合半文獻,統一以“refworks”格式導出↓ CiteSpace軟件格式轉換并去重↓ 去重后剩余文獻中文文獻: n=2 502英文文獻: n=2 794
1.2 文獻納入標準前列腺癌基因組學和分子機制相關研究領域的期刊論文、學位論文。
1.3 文獻排除標準主題與前列腺癌基因組學和分子機制研究不相關者、主題與前列腺癌基因組學和分子機制研究相關但為重復發表者、新聞報道、會議等。
1.4 數據處理將中文數據庫的文獻導入文獻管理軟件NoteExpress中,統一以“refworks”格式導出并存為以“download_**”命名的文本文檔,導入到CiteSpace軟件進行去重以及格式轉換;Web of Science核心數據庫的文獻以純文本中的“全紀錄與引用的參考文獻”格式導出,保存并重命名為“download_**”;PubMed數據庫篩選的文獻以NBIB Formatted File形式導出,在CiteSpace中進行格式轉換。
1.5 研究方法本文是以文獻計量學的方法對前列腺癌基因和分子研究進展相關文獻進行可視化展示與分析。采用CiteSpace分別對中英文文獻的發文基本情況和該領域高頻關鍵詞進行可視化知識圖譜的繪制。CiteSpace軟件閾值和參數設置如下:時間范圍為2011年1月-2022年10月,Years Per Slice為1,g index設置為25,Node Types依次選擇作者、機構、國家和關鍵詞展開可視化分析,Pruning算法選擇常用的Pathfinder、Pruing sliced networks和Pruing the merged network,其他均為默認設置。
在對發文國家、機構、作者以及關鍵詞共現分析時,圖譜中節點依次代表國家、機構、作者以及關鍵詞;頻次和中介中心性在共現分析中用以度量節點的重要程度,中介中心性是指網絡中經過某點并連接這兩點的最短路徑占這兩點之間的最短路徑線總數之比,用來描述節點在網絡中作為橋梁連接其他關鍵詞的能力[6]。聚類分析將關鍵詞分類并劃分為不同色塊,每一個色塊對應一個聚類,聚類標簽值越小,表示該聚類所包含的關鍵詞越多[7]。突現分析能夠捕捉詞頻共現度突然發生驟增的關鍵詞,突現圖中紅色條柱表示對應關鍵詞詞頻的爆發年份。時間線圖分析以時間為軸,將關鍵詞平鋪在時間軸上清晰展示該領域重要關鍵詞在不同年份的發展情況。
2.1 發文趨勢分析共收錄中文文獻2 502篇,英文文獻2 794篇,2011-2022年期間發文量年度分布如圖2所示。2011-2021年中英文文獻年度發文量持平,波動范圍在50篇左右。2022年至今英文文獻年發文量水平較高,高出中文發表文獻200篇以上,總體發文量保持穩定。

圖2 發文趨勢圖
2.2 發文國家、機構分布對近10年國內外關于前列腺癌基因組研究和分子研究領域相關文獻進行分析,經過國家共現分析得到發文量最高的五個國家分別是美國(1 112篇)、中國(621篇)、加拿大(204篇)、意大利(194篇)和德國(186篇),其中美國發文量最多,影響力最大(圖3)。機構共現分析得到發文量排行前10所的機構(表1),中文數據庫中發表該領域文獻量最多的機構是武漢大學人民醫院泌尿外科,發文量26篇;英文數據庫中發表相關文獻最多的機構為杜克大學醫學中心病理科,共計發文127篇。

表1 排名前10的發文機構

圖3 發文量排名前10位的國家分布
2.3 發文作者分布共有586位中文文獻作者和523位英文文獻作者納入作者合作網絡分析(圖4、5),圖譜中每一個節點代表一位作者,節點直徑與發表文獻數量呈正相關,節點之間的連線代表作者之間具有合作關系,圖譜由多個子網絡構成,中文作者合作網絡中最突出的是楊澤為代表的合作團隊,該團隊合作網絡最豐富,且有6人發文量>10篇;英文作者合作網絡中發文量位于首位的作者是ANGELO M DE MARZO(音譯:安吉洛·梅德·馬佐),共發表24篇前列腺癌基因組學相關研究的文獻(表2)。

表2 發文量排名前5的作者

圖4 中文文獻發文作者圖譜

圖5 英文文獻發文作者圖譜
2.4 關鍵詞分析對納入文獻進行關鍵詞共現分析,共得到521個中文關鍵詞和596個英文關鍵詞,頻次最高的中文關鍵詞是細胞增殖(245次)、中心性最高的是甲基化(0.44);英文關鍵詞中頻次和中心性最高的分別是gene expression/基因表達(293次)和醋酸阿比特龍(0.32),結果見表3、4。聚類分析共得到17個中文聚類(圖6)和21個英文聚類(圖7)。為詳細呈現高頻關鍵詞在該研究領域的興衰歷程,依次對中英文關鍵詞進行突現分析并繪制時間線圖,突現強度前10的中英文關鍵詞如圖8、9所示,對應的時間線圖見圖10、11。

表3 中文高頻關鍵詞

表4 英文高頻關鍵詞

圖7 英文文獻關鍵詞聚類圖譜

圖8 中文關鍵詞突現圖譜

圖9 英文關鍵詞突現圖譜

圖10 中文關鍵詞時間線圖

圖11 英文關鍵詞時間線圖
通過對相關文獻進行發文趨勢分析和作者機構合作網絡分析,得到前列腺癌基因和分子研究領域發文量緩慢增長且處于較高發文趨勢,表明近幾年前列腺癌基因和分子研究一直是該領域的研究重點。美國在該研究領域影響力較大,發文量居首位。武漢大學人民醫院泌尿外科和杜克大學醫學中心病理科是該領域主要發文機構。從國家、機構、作者的合作網絡分析中可以看出,國外機構的發文量水平遠高于國內機構,且國外作者的合作網絡更加豐富,不同合作團體之間具有良好合作關系。
以楊澤和安吉洛·梅德·馬佐為主的團隊是該領域核心發文團隊。以楊澤為主的研究團隊主要研究基因突變與前列腺癌患病風險的關聯性以及雄激素受體(AR)信號通路的研究[8-10]。BRCA2是65歲以下男性早發性前列腺癌中最常見的基因改變[11],目前研究表明,BRCA2發生突變,與癌癥更快進展為晚期以及較短生存期有關[12-13]。除此之外,在前列腺癌進展中AR起著重要作用,在幾乎所有的原發性和轉移性前列腺癌中都有表達,不論分級如何,AR信號均在前列腺癌中活躍并支持癌細胞存活和生長[14],因此被認為是治療前列腺癌的一個有吸引力的靶點。新一代的AR抑制劑恩雜魯胺被證明可以顯著提高去勢抵抗性前列腺癌患者的生存率,然而并不能長期適用以改善患者預后[15],最新研究將恩雜魯胺與EPI-001兩種雄激素受體抑制劑共同結合到同一分子中表現出更高的癌細胞殺傷能力[16],還有更多的研究正在關注基因突變對AR信號通路的調節作用以及分子標志物的研究[5, 17]。安吉洛·梅德·馬佐為代表的研究團隊主要研究基因重排在前列腺癌中的表達及臨床意義以及影響前列腺癌侵襲性的細胞因子的研究[18-20]。最新研究包括白細胞介素1β(IL-1 beta)表達對前列腺癌侵襲性風險的影響[21],乳鐵蛋白CpG島高甲基化與前列腺癌早期mRNA和蛋白表達的解耦[22]、通過定制的4-plex DiLeu等壓標記對遺傳性前列腺炎小鼠模型的定量蛋白質組學分析[23]。
通過關鍵詞分析可知,該領域包括細胞水平和分子水平的研究,基因表達、基因檢測和治療是當下主要研究方向。高頻關鍵詞包括基因表達、甲基化、雄激素、基因治療等。轉錄調節、翻譯后修飾和啟動子的高甲基化導致的表觀遺傳沉默與腫瘤的發生相關[24],其中甲基化在中文關鍵詞中的中心性最高,DNA甲基化是人類癌癥中最有潛力的早期發現和評估預后的生物標志物之一[25],Ke等[26]的研究發現啟動子的高甲基化導致抑癌基因表達下調,與患者較差預后相關。此外,因治療和基因檢測也是當下重要的高頻關鍵詞,隨著高通量基因測序等技術的發展,基因檢測與治療成為當下的研究熱點,Zhao等[27]通過對轉移性癌癥的全甲基組、全轉錄組測序鑒定了甲基化與致癌驅動基因AR、MYC和ERG等的RNA表達相關的基因間區域,展現了晚期前列腺癌的DNA甲基化景觀,為腫瘤治療及預后提供了新方向。
綜上所述,本文通過繪制前列腺癌基因和分子研究領域文獻的知識圖譜,將目前研究現狀可視化展示并系統梳理了該領域研究現狀和研究熱點,發現前列腺癌分子研究正受到極大關注,相關發文量一直處于高水平,研究團隊有穩定的合作關系,研究內容主要集中于前列腺癌基因檢測、治療以及相關預后標志物;腫瘤侵襲性、基因檢測、腫瘤微環境可能成為研究重點和未來趨勢,發現更多潛在治療靶點和分子標志物可以為前列腺癌的精準治療提供理論依據。