藍康澍 雷柞 何祎雯 高龍鑫 潘傳英 王勇勝*
(1,西北農林科技大學動物醫學院 712100;2,西北農林科技大學圖書館 712100;3,西北農林科技大學動物科技學院 712100)
微小RNA(microRNA,miRNA)是一種內源性、長度為18~25 個核苷酸的非編碼單鏈RNA。1993 年Lee 等首次在其研究中提到Lin-4(miRNA 的一種),由此拉開了對miRNA 研究的序幕[1]。近年來,miRNA 被證實與多種癌癥有關[2],因此,逐漸引起人們的重視。miRNA 的出現使得對癌癥早期診斷和治療成為可能,因此,近年來,miRNA 一直是癌癥相關研究的熱點,關于miRNA 與癌癥發生機制的研究層出不窮[3]。但目前對miRNA 的研究只是冰山一角,對其作用機制還存在許多未知,加快對miRNA 的研究有助于進一步了解腫瘤的發生發展過程及其治療手段。
文獻計量學(Bibliometrics)是一門采用數學、統計學方法對研究文獻等計量指標進行分析,以對某個領域進行有效可視化,進而幫助科研人員分析領域整體趨勢,為該領域的后續發展提供不同見解的學科[4]。文獻計量學最早的應用可追溯到18世紀,科研人員利用文獻計量學完成對某一領域的基礎文獻統計。隨著文獻計量學在越來越多的領域應用,以及使用越趨成熟,文獻計量學的內容已從簡單的數理統計發展為使用可視化軟件對計量指標進行分析以達到解析研究熱點和預測發展趨勢[5,6]。
目前,國內外尚未有學者對miRNA 相關論文發表進行系統分析,因此,miRNA 相關研究趨勢及論文發表情況仍不明確。本文從文獻計量學的角度,基于Web of science(WOS)和中國知網(CNKI)數據庫,首次對20 世紀以來miRNA 的相關論文進行分析,結合Excel 2019、Citespace 5.6[7]和GraphPad Prism 9.3.0[8]等軟件,從論文發表量、國家、作者、研究領域等方面進行動態分析,旨在為未來miRNA 相關研究提供全新方向及思路。
國際miRNA 論文發表概況分析以WOS 數據庫為基礎,對20 世紀以來發表的相關文獻進行可視化分析;國內miRNA論文發表概況則以CNKI 數據庫為基礎,同樣以2000~2021 年作分析區間,將miRNA 研究概況具體化。
數據源于WOS 核心合集(Web of Science Core Collection),檢索方式為高級檢索-檢索式:TI=(miRNA OR microRNA),索引日期為:2000-01-01 至2021-12-31,檢索日期為2022 年2 月5 日,共檢索出56284 條SCI 論文,其中有23939 篇來自國內(通過添加國際/地區篩選條件)。對論文發表的國家/地區和發表論文質量進行進一步分析。
由于WOS 數據庫不太收錄中文論文,而我國部分論文都發表在中文期刊,因此,對CNKI 數據庫上的論文進行分析,有助于我們更進一步了解國內miRNA 相關研究進展。
在知網中進行專業檢索,檢索式為:TI=‘miRNA’ +‘microRNA’+‘微小RNA’+‘微RNA’,檢索區間與WOS 中檢索區間一致,為2000-01-01 至2021-12-31,檢索日期為2022 年2 月5 日,共檢索出論文25541 篇,對結果進行可視化分析,進一步得出結論。
在Web of Science 和中國知網上對相關關鍵詞進行檢索,使用網站的可視化分析功能對文章發表情況(如發表主題、國家等)進行初步分析,再將數據導出至Excel 2019 軟件中進行整理。通過網站輸出的數據,利用Citespace 5.6 軟件進行關鍵詞共現分析和聚類分析:從Web of Science 中導出數據(文件格式為txt)后,將Citespace 界面的node types 選定為“Keyword”,時間區間設為“2000~2021”,時間切片設為1。在進行正式分析前對數據進行預試驗分析,界面中Top N%(表示每個時間切片引用次數最多的前N%)設定為10.0,由于文獻數量太多,分析結果的節點過大且圖譜雜亂交錯,最終選定適宜設定值為1.0。
分析結果顯示,自20 世紀以來,miRNA 相關SCI 論文發表趨勢是先上升后下降。2001~2019 年,miRNA 相關論文的發表數量大幅度提升;但在2019 年后,miRNA 相關論文的發表數量明顯下降,如圖1。

圖1 WOS 數據庫20 世紀以來miRNA 相關論文發表量變化
從研究方向看,腫瘤學以12146 篇相關論文在所有miRNA 相關SCI 論文中占比最大(21.58%),遠超于第二名生物化學/分子生物學(相關論文7985,占總發表論文數的14.187%)和第三名細胞生物學(相關論文7266 篇,占總發表論文數12.91%)。
在miRNA 相關論文發表的國家中,中國以23939 篇占總發表論文的42.53%,遠超于第二名的美國(發表論文14445篇,占總發表論文的25.66%)和第三名的德國(發表論文2841篇,占總發表論文的5.09%),見表1;此外,在發表miRNA相關論文的作者中,發表論文數前十名都來自我國;在基金資助機構方面,我國國家自然科學基金委員會資助相關論文10500 篇,占所有論文數的18.66%,見表2。

表1 國際miRNA 相關論文發表數Top 10 國家

表2 國際miRNA 相關論文發表數Top 5 基金資助機構
論文發表數量不能作為單一衡量指標,所發表論文的質量也需要受到重視。為更準確衡量國家之間miRNA 發表論文的質量,筆者通過添加“高被引論文or 熱點論文”和“國家/地區”條件進行進一步分析,發現我國發表的文章篇均被引頻次為207.52 次,h 因子(h-index,h 因子為N 則表示有N 篇論文分別被引用了至少N 次)達99,與其他兩個論文發表數前三的國家相比仍有一定差距;美國發表miRNA 相關SCI 論文篇均被引頻次為364.82,h 因子為127;德國發表miRNA 相關SCI 論文篇均被引頻次為370.38,h 因子為42。
根據CNKI 數據庫可視化分析結果發現,2006 年以前,我國miRNA 有關中文論文發表數量較少,每年發表數量均在100 篇以下,2006 年以后論文發表數進入增長期,2018 年論文發表數出現短暫下降,但總體保持穩定;2019 年后,論文發表數量明顯下降,參見圖2。由此可見,基于CNKI 數據庫論文可視化的分析,我國發表在中文期刊的miRNA 相關論文數量變化趨勢與國際miRNA 相關SCI 論文發表變化趨勢大致一致。

圖2 20 世紀以來中文期刊miRNA 相關論文發表數量趨勢
從論文主要主題分布情況看,除去miRNA 本身名稱主題(miRNA、miRNAs、微RNAs 等),我國對miRNA 的研究主題主要為靶基因、差異表達、細胞凋亡、細胞增殖等;“靶基因”關鍵詞占比較高的原因是近年來許多研究人員都開始將重點放在具體miRNA 的靶基因預測和挖掘上,如梁學振等[9]和張寧芳等[10]的研究,以及高陽[11]對miR-202 的靶基因預測以進一步miR-202 對早期胚胎影響的研究?!安町惐磉_”主題體現了miRNA 的差異表達對細胞生理過程及疾病過程的影響,如曲蕾對miR-202 差異表達的研究[12]。而“細胞凋亡”“細胞增殖”等代表miRNA 通過調節不同靶基因表達而形成的影響。
從學科分布看,發表在中文期刊的miRNA 相關論文大多都與腫瘤學相關,腫瘤學以10435 篇論文處于絕對數量優勢,甚至超過其他前五名學科發表論文數的總和(心血管系統疾病相關論文2310 篇,生物學相關論文2196 篇,基礎醫學相關論文1678 篇,婦產科學相關論文1385 篇),而且其他學科分布相對均勻,如婦產科學、泌尿科學、消化系統疾病等,參見圖3。這與miRNA 參與各系統器官腫瘤調控有密切關系,如Sun等[13]和巫夢雪[14]等對miRNA 與卵巢癌關系的研究,李亞男等[15]和李杰[16]等對消化系統癌癥的研究。

圖3 20 世紀以來中文期刊miRNA 相關論文學科分布Top 20(來源:中國知網)
筆者進一步使用Citesapce 軟件對國外miRNA 相關發表論文進行關鍵詞共現分析和聚類分析,根據Citespace 分析結果得出出現頻率最高的前十個關鍵詞,見表3。

表3 Citespace 分析得出出現頻率最高的關鍵詞前10
在關鍵詞共現圖譜中,節點大小與該詞出現的頻數成正比,圖譜中關鍵詞“expression”出現的頻數最多,結合miRNA 功能分析得出miRNA 的差異表達仍是國際miRNA 相關研究的重點,miRNA 在癌癥中的差異表達(過表達或者表達下調)可以調控癌癥的發生發展。關鍵詞“proliferation”出現的高頻率很可能與miRNA 對癌癥的增殖擴散作用有關,這一點也可與關鍵詞“cancer”的高頻出現相聯系,見圖4。綜合可得,miRNA 相關研究的重點仍與癌癥緊密相關。

圖4 miRNA 相關論文關鍵詞共現分析圖譜
用關鍵詞聚類分析以對聯系緊密的關鍵詞進行聚類,共得出7 個聚類。聚類圖譜的聚類模塊值(Q 值)為0.3674,聚類結構顯著[17]。由聚類圖譜可得,#0 上皮-間質轉化(EMT)是最主要的研究方向,EMT 也與癌癥緊密相關(EMT 與腫瘤轉移機制有關)。此外,#2 再灌注損傷也是miRNA 相關研究的熱點之一,說明miRNA 在除腫瘤、癌癥外的其他機體疾病、損傷過程也有重要的調控功能[18],見圖5。

圖5 關鍵詞聚類圖譜
本研究利用文獻計量學的方法對20 世紀以來國際和國內miRNA 相關發表論文趨勢進行梳理,從發文量、基金資助機構、發文作者和發文作者等角度進行深入分析,為將來miRNA 研究趨勢提供參考。通過分析得出以下結論。
從國際和國內miRNA 發表論文的趨勢看,miRNA 的研究熱度處于總體上升的趨勢,由于miRNA 能調控靶基因的表達,在細胞生理過程和疾病過程中扮演重要角色,人們逐漸重視對miRNA 的研究。國內miRNA 相關研究的不斷發展離不開國家基金的支持,從論文基金支持機構看,我國國家自然科學基金共資助10500 篇miRNA 相關研究的論文發表,占總論文發表數的18.656%。2010 年,國家自然科學基金成立了“非編碼RNA 與腫瘤發生、發展及轉歸”的重點項目立項領域[19],這極大程度推動了國內miRNA 研究領域的發展。國內許多miRNA 相關項目受到資助后[20,21],相關研究人員開始對miRNA 進行進一步研究,miRNA 的生理功能及其作用機理被不斷挖掘。有學者對國家自然科學基金在中醫內科學領域立項項目的研究熱點進行分析,發現在1997~2019 年國家自然科學基金在中醫內科學領域中立項的1751 項項目中,主題詞miRNA 以155 次的出現頻率位居第二,僅次于信號轉導通路(791次)[22]。相較于美國等發達國家,我國科研起步雖然相對較晚,但通過后續發展過程中的基金資助及研究人員的不斷努力,我國在各領域的研究均已處于領先地位,在miRNA 相關領域,我國論文發表情況現已位居第一。
2019 年之后miRNA 相關研究出現了相對滯后的現象,推測為2019 年爆發的新冠肺炎疫情對各領域都帶來了重大沖擊,包括科研領域,何禮邦等[23]對國際山羊相關論文發表態勢的分析中也提到,由于疫情影響,相關領域的研究論文呈下降態勢。但這在后疫情時代的不斷調整后會有所改善,筆者預測,在今后幾年,miRNA 相關研究發展趨勢會逐步回歸正軌。值得一提的是,我國在國際上發表的miRNA 相關論文數最多。此外,在miRNA 發表論文的基金資助機構中,中國國家自然科學基金資助力度最大,說明我國對miRNA 研究的重視。但在論文水平上,從熱點文章被引頻次和h 因子看,我國相對其他發達國家(如美國和德國)仍有一定差距,只有后續不斷提高研究和論文質量,我國在國際miRNA 相關領域中才能更具有話語權。在研究主題方面,國內外miRNA 研究側重點各不相同,國外研究更側重于研究miRNA 在各類腫瘤、癌癥中的調控作用;而國內則側重于miRNA 調控機理,如探究其“靶基因”,引起“細胞凋亡”、“細胞增殖”等。對miRNA 機理的探究固然對深入全面了解miRNA 有重要意義,但也要注意綜合其機理及其內涵、應用,防止出現對領域內涵理解不深刻,盲目追求研究熱點,過度強調細胞信號通路等微觀分子機制問題[22]。在國內研究方面,miRNA 研究學科分布較廣,miRNA 在各系統的研究都有涉及。此外,通過關鍵詞共現分析和聚類分析可知,miRNA 相關研究熱點仍與腫瘤、癌癥相關,說明未來miRNA 相關研究重點可能仍與腫瘤和癌癥相關,miRNA 很可能通過相似的機制對腫瘤、癌癥的發生發展進行調控,研究miRNA 部分調控機制,可以為miRNA 在其他疾病的研究提供可靠思路。此外,根據關鍵詞聚類分析結果,再灌注損傷作為現階段miRNA 相關研究的熱點之一(僅次于腫瘤),很可能在未來發展為miRNA 主要的研究主題。
目前,國內外對miRNA 的研究大部分還停留在理論層面,在實踐應用方面還有待進一步的提升。只有將miRNA 相關研究理論應用到實踐,為疾病診斷和治療提供新技術,才能深化miRNA 相關的研究意義,進一步造福人類。