謝 菲,黃東蘭,岑東芝,張積仁
(南方醫科大學附屬珠江醫院腫瘤中心,廣州 510282)
乳腺癌是女性最常見的惡性腫瘤,其發病率占女性腫瘤的20%以上,隨著年齡的增加而增加,而且早期即有遠處轉移,其死亡原因幾乎都是遠處轉移所致。乳腺癌的轉移是一個較為復雜、由多基因參與及多步驟完成的過程。與腫瘤轉移密切相關的基因被認為是抗轉移干預治療的潛在靶點,深入闡述乳腺癌轉移的機制將為預測和阻止乳腺癌轉移提供堅實的基礎。目前臨床上病理和免疫組化指標不能準確判斷乳腺癌患者轉移的風險[1],嚴重影響腫瘤患者治療的療效和預后。為了了解目前乳腺癌轉移相關基因的研究概況及發展趨勢,本文對國際上2001~2010年10年間乳腺癌轉移相關基因研究的文獻進行了計量學分析。
1.1 一般資料 數據庫的選擇以荷蘭Elsevier Science出版公司建立的Embase數據庫、美國國立醫學圖書館建立的Medline/Pubmed數據庫及美國生物科學信息服務社建立的世界上最大的有關生命科學的文摘和索引數據庫——BIOSIS Preview數據庫為數據源,統計這3個數據庫2001年1月至2010年12月收錄的有關乳腺癌轉移相關基因的文獻,選擇這3個收錄范圍既有交叉又有區別的權威數據庫來確保數據的完整性及準確性。
1.2 方法
1.2.1 檢索方法 為提高文獻的查準率,對Embase數據庫進行Emtree擴展檢索,輔以自由詞的題目及摘要字段的檢索;對Pubmed/Medline數據庫進行MeSH檢索,輔以自由詞的題目及摘要字段的檢索;對BIOSIS Preview數據庫進行主題檢索。擬定的檢索詞為乳腺癌、轉移及基因。乳腺癌的檢索詞包括:(1)MeSH 詞breast neoplasm;(2)EMtree詞breast cancer;(3)自由詞檢索使用 breast cancer、breast tumor*、breast neoplasm*、breast carcinoma*、mammary neoplasm*。轉移的英文 檢索詞包括:(1)MeSH 詞 neoplasm metastasis;(2)EMtree詞檢索使用 metastasis、cancer recurrence、cancer relapse及metastasis inhibition;(3)自由詞檢索使用 metastasis、metastases?;虻挠⑽臋z索詞為gene。
1.2.2 文獻納入與排除 文獻形式主要為論著、會議論文及會議摘要,納入全部與乳腺癌轉移相關基因及基因產物相關且以人類為研究對象的臨床研究,能提供足夠信息的摘要或可以獲取全文資料的文獻。排除了綜述、個案報道、回信、書籍、社論、無法獲取摘要的文獻、與轉移相關的非基因研究、針對基因的結構和機制等研究、細胞株體外研究、老鼠及其他動物體內試驗及重復文獻與其他與研究目的不符的文獻。納入與排除的過程,由2名研究人員獨立進行,最終結果互相比較,不一致的地方互相討論,或向臨床醫生、實驗研究人員(研究員)請教。
1.2.3 文獻計量分析 采用NoteExpress X3軟件對所檢索文獻進行管理,使用Excel 2007軟件對最終納入的文獻的出版年、作者、國家、研究機構、發表期刊及基因進行計量學分析。
2.1 檢索結果 Embase數據庫檢出文獻2246篇,其中論著1573篇,綜述353篇,會議論文105篇,會議摘要77篇,信件35篇,筆記33篇,社論31篇。Pubmed/Medline數據庫檢出文獻1009篇,其中綜述126篇。BIOSIS Preview數據庫檢出文獻1441篇,其中論著974篇,會議論文440篇,書籍目錄22篇,信件9篇。三庫共檢出文獻4696篇。根據前述的文獻納入排除標準,最終納入研究的文獻共有363篇。
2.2 文獻發表年限分析 對最終納入的363篇文獻進行發表年限分析,其年度發表數量及變化見圖1。從各年度的文獻量分布上可以看出,近10年乳腺癌轉移相關基因的臨床研究在2001~2007年間呈緩慢增長趨勢,研究處于萌芽階段,2008年總體開始呈現明顯上升趨勢,2009~2010年間呈平穩發展狀態,說明科研人員對該領域的研究越來越多,目前研究正處于穩定發展的階段。由此推測,今后知識研究文獻仍將會保持一定的增長速度,進一步達到研究的成熟階段。

圖1 乳腺癌轉移相關基因文獻年份分布
2.3 文獻發文量國別分析 通過對363篇文獻的發表國家的統計分析得知,共有45個國家發表了關于乳腺癌轉移相關基因方面的研究。發文量前20位的國家見圖2??梢园l現,中國發文量為84篇,位列第1位,為發文量最多的國家,占據了文獻總數的23.1%,遙遙領先于其他國家。美國繼中國之后,發文量為65篇,占據了文獻總數的17.9%,德國、日本、意大利、英國、法國、波蘭、韓國及土耳其分列3~10位。以上表明,中國目前是研究乳腺癌轉移相關基因最活躍的國家,體現了我國在該領域研究的先進地位和較高的科研能力,其他傳統型生物學領域研究大國也是這一領域的主要力量。發文量前10名的國家中,除中國外,均為高收入國家。除中國和美國外,在發文量前20名的國家中,半數為歐洲國家,說明歐洲在該領域研究中也占據了重要地位。從學術生產力方面分析[2],由于我國人口基數大,人均發文量與美、德、日等國相距甚遠,因此我國的研究者應加大對該領域研究投入,吸取國外優秀科研經驗,加強與國外權威科研機構合作,從而提高我國的學術生產力,增強我國的學術影響力。
2.4 文獻期刊分析 對最終納入的363篇論文進行統計分析,共發表在140種生物醫學期刊上,平均每刊發文2.59篇。發文量達8篇的期刊有9種,根據2009年公布的SCI期刊目錄,上述期刊均為SCI收錄期刊,其發文量及影響因子見表1,其中Cancer Research的影響因子最高。根據布拉德福分散定律[4],從發文量的角度,Breast Cancer Research and Treatment是該研究領域核心的英文期刊。通過查閱以上9種期刊可以較快地了解該領域的研究動態。

圖2 乳腺癌轉移相關基因文獻國家分布

表1 發文量達8篇及其以上的期刊
2.5 文獻發表的研究機構 按第一作者所在單位進行統計,共統計出280個研究機構在進行乳腺癌轉移相關基因方面的研究,發文量達4篇的研究機構有6個,分別為Tianjin Medical University(12 篇),The Netherlands Cancer Institute(6篇),The University of Texas M.D.Anderson Cancer Center(4篇),General Hospital of Chinese People′s Liberation Army(4篇),University of Lodz(4篇),Fu Dan University(4篇),University of Hong Kong(4篇),其中我國研究機構有4個,占據了主要地位,說明我國在乳腺癌轉移相關基因方面實力較強。但總體來講,在乳腺癌轉移相關基因研究領域,無論國際上還是國內,均未形成一些核心研究機構。
2.6 核心作者分析 經調研統計得知,Netherlands的Mook、Malaysia的Naidu在10年間以第一作者發表了乳腺癌轉移相關基因方面的論文3篇,為該領域發文量最大的作者。國外有學者主要研究MammaPrint70基因模型在預測乳腺癌預后及轉移風險方面的作用[4-6],也有很多學者研究方向為基因多態性與乳腺癌患病風險的關系[7-9]。根據洛特卡和普賴斯對科學家的生產率和活動規律的研究,發表論文為N篇以上的作者為該學科的杰出科學家,即核心作者。計算公式為:N=0.749×(ηmax)1/2。式中ηmax為發文量最多的作者發表的論文數量[10]。根據上述公式,發表論文達2篇的作者為該研究領域的核心作者。經統計核心作者共有20位,對核心作者所在國家進行統計發現,美國、英國各有3位,日本、荷蘭、愛爾蘭、法國各有2位,馬來西亞、加拿大、德國、韓國、意大利、瑞典各有1位,所有核心作者均在發達國家,特別是歐美地區,說明歐美的學者在該研究領域造詣較深。
2.7 乳腺癌轉移相關基因的文獻量分析 通過對最終納入的363篇文獻的詳細閱讀,共統計出567個乳腺癌轉移相關基因。其中研究文獻量達6篇的基因有18個,它們的基因名稱及所涉及的文獻量如下:ERBB2(52)、TP53(26)、ESR1(23)、NME1(16)、KRT19(14)、PGR(12)、VEGFA(12)、EGFR(10)、PTGS2(10)、BRCA1(8)、CD44(8)、CDH1(8)、MMP9(7)、BCL2(6)、CCND1(6)、GSTP1(6)、MKI67(6)、PTEN(6)。其中對ERBB2基因研究的文獻量最多,共52篇,遠遠多于其他基因,TP53基因作為最早發現的抑癌基因,緊隨其后,有26篇文獻進行研究。而在2006~2010年間文獻量達4篇的基因有19個,ERBB2(33)、ESR1(14)、VEGFA(10)、TP53(10)、PTGS2(6)、PGR(6)、MMP9(6)、KRT19(6)、EGFR(6)、NME1(5)、BRCA1(5)、BCL2(5)、VEGFC(4)、TERT(4)、SCGB2A2(4)、GSTP1(4)、CXCL12(4)、CD44(4)、CCND1(4)??梢园l現,近10年間與近5年間研究較多的基因稍有變化,ERBB2、TP53、ESR1、NME1、KRT19、PGR、VEGFA、EGFR、BRCA1、CD44、BCL2等基因仍然是研究的熱點,CDH1、MKI67、PTEN基因在近5年的研究逐漸減少,對CXCL12、TERT、VEGFC基因的研究在近5年逐漸增多。
通過對最終納入的363篇乳腺癌轉移相關基因研究文獻的計量學分析,可以發現,乳腺癌轉移相關基因方面的研究目前正處于穩定發展階段。中國、美國、日本、英國、德國等國均已經開展了這方面的研究,我國在發文量方面遙遙領先于其他國家,但在人均發文量方面遠遠落后于其他國家。在發文量達4篇的6個研究機構中,有4個在中國,充分說明我國在乳腺癌轉移相關基因方面研究方面已經形成了自己的優勢,并有形成核心研究機構的趨勢。各研究機構發文量均較少,目前尚未形成該研究領域的核心研究機構,迫切需要國內外研究機構間通力合作。各位學者發表文獻數也較少,尚無該領域的領軍人物。由此可見,目前的研究較為分散,多為單中心研究,樣本量較小,迫切需要進行多中心、大樣本的研究,因此研究人員之間甚至是國家之間合作是乳腺癌轉移相關基因方面研究的趨勢。
基因檢測技術的發展,促使基因功能研究從基因產物表達檢測逐漸發展為基因突變、啟動子甲基化、單核苷酸多態性檢測。而隨著基因芯片技術的發展,乳腺癌轉移相關基因的研究逐漸由單基因研究向多基因研究方向發展。多基因模型開始多用于評估乳腺癌預后,近年來開始有人把多基因模型用于評估乳腺癌轉移風險,如國外已進入臨床應用的MammaPrint70基因模型[7],以及Oncotype Dx21基因模型[12],Tutt等[12]和Yau等[13]構建的14基因模型,Culhane和 Quackenbush[14]及Landemaine等[15]建立的預測乳腺癌患者肺轉移風險的6基因模型。由于乳腺癌轉移是一個復雜的、由多基因參與及多步驟完成的過程,應用單一基因預測乳腺癌的轉移風險,其敏感度及精確度均欠佳,而應用多基因模型可顯著提高其預測的敏感度及精確度。建立多基因預測模型的根本在于尋找預測價值高、性能穩定的候選基因。本文通過對文獻的計量學分析,初步篩選了一些研究較成熟、預測性好的基因,為建立高效的多基因預測模型奠定了基礎。多基因預測模型為乳腺癌復發轉移風險預測、治療療效預測及個體化治療方案的制訂提供了可能,逐漸成為乳腺癌轉移研究的熱點,顯示出巨大的潛力和廣泛的應用前景。
[1]Fisher B,Jeong JH,Bryanl J,et al.Treatment of lymphnode-negative,oestrogen_receptor-positive breast cancer:long-term findings form National Surgical Adjuvant Breast and Bowel Project randomised clinical trials[J].Lancet,2004,364(9437):858-868.
[2]Swaminathan M,Phillips-Bute BG,Grichnik KP.Bibliometric analysis of global clinical research by anesthesia departments[J].Anesth Analy,2007(105):1741-1746.
[3]羅式勝.文獻計量學概論[M].廣州:中山大學出版社,1994:34-46.
[4]Mook S,Schmidt MK,Weigelt B,et al.The 70-gene prognosis profile predicts early metastases in postmenopausal breast cancer patients[J].Cancer Res,2009,69Suppl 2:S124.
[5]Mook S,Schmidt MK,Weigelt B,et al.The 70-gene prognosis signature predicts early metastasis in breast cancer patients between 55and 70years of age[J].Ann Oncol,2010,21(4):717-722.
[6]Mook S,Knauer M,Bueno-de-Mesquita JM,et al.Metastatic potential of T1breast cancer can be predicted by the 70-gene MammaPrint signature[J].Ann Surg Oncol,2010,17(5):1406-1413.
[7]Naidu R,Yip CH,Taib NA.Polymorphisms of HER2 Ile655Val and cyclin D1(CCND1)G870Aare not associated with breast cancer risk but polymorphic allele of HER2is associated with nodal metastases[J].Neoplasma(Bratislava),2008,55(2):87-95.
[8]Naidu R,Har YC,Taib NA.Polymorphism of FGFR4 Gly388Arg does not confer an increased risk to breast cancer development[J].Oncol Res,2009,18(2/3):65-71.
[9]Naidu R,Har YC,Taib NA.Associations between hypoxia-inducible factor-1(alpha)(HIF-1(alpha))gene polymorphisms and risk of developing breast cancer[J].Neoplasma,2009,56(5):441-447.
[10]邱均平.信息計量學[M].武漢:武漢大學出版社,2007:106-192.
[11]Cobleigh MA,Tabesh B,Bitterman P,et al.Tumor gene expression and prognosis in breast cancer patients with 10 or more positive lymph nodes[J].Clin Cancer Res,2005,11(24Pt 1):8623-8631.
[12]Tutt A,Wang A,Rowland C,et al.Risk estimation of distant metastasis in node-negative,estrogen receptor-positive breast cancer patients using an RT-PCR based prognostic expression signature[J].BMC Cancer,2008(8):339.
[13]Yau C,Esserman L,Moore DH,et al.A multigene predictor of metastatic outcome in early stage hormone receptor-negative and triple-negative breast cancer[J].Breast Cancer Res,2010,12(5):R85.
[14]Culhane AC,Quackenbush J.Confounding effects in“A six-gene signature predicting breast cancer lung metastasis”[J].Cancer Res,2009,69(18):7480-7485.
[15]Landemaine T,Jackson A,Bellahcene A,et al.A six-gene signature predicting breast cancer lung metastasis[J].Cancer Res,2008,68(15):6092-6099.