徐 潔,鄭 光,何小鵑,呂愛平,馬超英
(1.西南交通大學,成都 610031;2.中國中醫科學院中醫臨床基礎醫學研究所,北京 100700;3.蘭州大學信息學院,蘭州 730000)
隨著生物醫學的不斷發展,大量的醫學數據和信息逐漸積累,利用數據挖掘技術提取出潛在的有用知識和信息進行分析,已成為醫學研究的重要方向。文本數據挖掘(Text Mining),亦稱文本挖掘或文字勘探,是基于數據挖掘對文本開發的一種信息提取分析技術,可對海量數據信息進行整合、分析,以獲得更具有代表性和更高可信度的結果,常用于探討疾病治療的用藥規律[1]。
胰腺癌(Pancreatic cancer,PC)致死率高居惡性腫瘤第四位,其病人平均存活期短,只有5~6個月,5年生存率不足6%[2,3]。胰腺癌具有癌細胞易轉移[4]和多重耐藥性[5]等特點,嚴重阻礙治療。近年來,眾多研究結果顯示中醫藥治療胰腺癌具有獨到之處,尤其是中西藥結合治療效果顯著。本文利用文本挖掘技術探尋胰腺癌的臨床用藥規律,以期為胰腺癌的科學研究提供參考。
登錄中國生物醫學文獻數據庫(Chinese BioMedical Literature Database,CBM,http://sinomed.cintcm.ac.cn/index.jsp),在“缺省”狀態下,以“胰腺癌”為關鍵詞進行檢索,共得到文獻10426篇(檢索日期:2013/11/1),并選擇“詳細”和“記錄號”的顯示格式,以獲得每篇文獻的流水號、標題、摘要、主題詞等信息備用。
按照下載的先后順序將收集到的數據整合到一個平面文件(TXT)中,以ANSI編碼格式保存,借助專門的文本提取工具(軟件著作權,軟著登字第0261882號,登記號2010SR073409)對“1.1”中下載的非結構化TXT文本數據進行信息提取,以格式化形式儲存于大型關系型數據庫(Microsoft SQL Server,SQL)中處理。
文章中出現的關鍵詞可反映文章信息,相互關聯的關鍵詞之間存在著“共同出現”的特點,其中高頻協同的關鍵詞是科研工作者分析的很好素材。因此,采用相應的算法構建針對每一篇文獻中共同出現的關鍵詞對,從而得到關鍵詞對數據表并進行頻次統計,合并相同的關鍵詞,統計其在文獻摘要中出現的頻次。該頻次數據表包含關鍵詞對以及對應頻次,每個關鍵詞對僅有1個結果。
從關鍵詞對頻次數據表中抽取出不同頻次的關鍵詞對,采用軟件Cytoscape 2.8進行可視化處理,形成可視化網絡圖。
人工閱讀初步挖掘結果發現,異常條目通過反查原文獻確認為噪音,如中藥天冬具有養陰清熱、潤肺滋腎的功效,常用于肺燥干咳、頓咳痰黏、咽干口渴、腸燥便秘等癥狀,與胰腺癌治療并無關聯。然而挖掘結果顯示,天冬的頻數最高。因此,返回原文獻查閱發現,51個天冬條目中有48條是由“天冬氨酸”中的子字符串“天冬”引起,2條由“天冬酰胺”中的子字符串“天冬”引起,1條由“半胱天冬酶”中的子字符串“天冬”引起(見表1和表2)。人工篩查發現噪音出現的規律,依據這些規律構建降噪規則,以優化挖掘結果。
表1顯示,初步挖掘結果顯示,治療胰腺癌的常用中藥為天冬、大黃、苦參、藜蘆、雷公藤、人參、薏苡仁、姜黃、柴胡和黃芪。返查原文獻發現有噪音出現,人工降噪后重新進行文本挖掘優化結果(詳見“2.2”)。表2顯示,治療胰腺癌的常用西藥為吉西他濱、氟尿嘧啶、順鉑、5-氟尿嘧啶、生長抑素、奧沙利鉑、造影劑、阿霉素、絲裂霉素、卡培他濱。返查原文獻發現噪音—“造影劑”,人工降噪后重新挖掘得到新結果(詳見“2.3”)。

表1 中藥挖掘結果噪音確認
圖1、2顯示,雷公藤是治療胰腺癌最常用的中藥,其次為人參和薏苡仁。具有益氣養陰、消腫散結功效的康萊特注射液是治療胰腺癌最常用的中成藥,姜黃素和復方苦參注射液則分別位列第二和第三。

表2 西藥挖掘結果噪音確認

圖1 胰腺癌常用中藥使用文獻頻數圖

圖2 胰腺癌常用中成藥使用文獻頻數圖
圖3、4顯示,治療胰腺癌的首選藥物吉西他濱使用頻數最高,與臨床實際應用相吻合。其余西藥使用頻數由高到低依次為氟尿密度、順鉑、5-氟尿嘧啶、生長抑素、奧沙利鉑、阿霉素、絲裂霉素、卡培他濱、奧曲肽,均為抗腫瘤的一線藥物。除單獨使用外,吉西他濱、順鉑、氟尿嘧啶等還多與其他西藥聯用,如吉西他濱常與卡培他濱、奧沙利鉑等聯用,順鉑常與阿霉素、絲裂霉素等聯用。

圖3 胰腺癌常用西藥使用文獻頻數圖

圖4 胰腺癌常用西藥聯用文獻頻數圖
圖5顯示,5-氟尿嘧啶多與中成藥聯用,包括康萊特、三妙散、舒血寧注射液、強力寧等。康萊特常與5-氟尿密度和順鉑聯用。此外,康艾注射液常與吉西他濱聯用。

圖5 胰腺癌常用中成藥和西藥聯用文獻頻數圖
由文本挖掘結果得知,雷公藤是胰腺癌治療最常用的中藥。雷公藤主要成分雷公藤甲素是一種廣譜抗癌藥,其抗癌活性比傳統抗癌藥物順鉑、阿霉素、紫杉醇等更強[6,7]。體外研究顯示,低濃度雷甲素能有效誘導胰腺癌細胞凋亡,尤其對胰腺癌耐藥細胞株有殺傷作用,是極具潛力的抗癌候選藥[8]。其余常用中藥人參、薏苡仁、柴胡和苦參等均已證實,具有良好的抗腫瘤活性。多項研究結果表明,薏苡仁煎劑、丙酮提取物或醇提物具有明顯的抑癌作用[9],尤其是薏苡仁油具有抗人胰腺癌BxPC-3細胞增殖的作用,上調IL-18表達[10]。苦參主要成分氧化苦參堿,可下調人胰腺癌SW1990細胞的血管內皮生子因子(Vascular endothelial growth factor,VEGF)和基質金屬蛋白酶2(matrix metallo proteinases 2, MMP-2)mRNA表達,抑制癌細胞侵襲和轉移[11,12]。
康萊特注射液是治療胰腺癌最常用的中成藥,其次為姜黃素和復方苦參注射液。康萊特是一種新型抗腫瘤制劑,主要成分為中藥薏苡仁中提取得到的薏苡仁油。眾多研究報道,康萊特可誘導胰腺癌細胞凋亡,殺傷癌細胞,同時提高免疫力[13,14]。姜黃素是從姜科植物姜黃中提取的一種酚類化合物。現代藥理學研究證實,姜黃素可通過抑制Ras-ERK、shh-GLI1和STAT3等信號通路活化,進一步抑制下游靶基因表達,從而抑制胰腺癌細胞增殖并誘導細胞凋亡[15,16]。
吉西他濱、5-氟尿嘧啶和順鉑是治療腫瘤的常用藥物,其中吉西他濱是治療胰腺癌的首選藥物。由挖掘結果可得,使用頻次較高的藥物均是臨床常用的一線抗腫瘤藥物,諸如5-氟尿嘧啶、奧沙利鉑、阿霉素等,與臨床實際應用相吻合。
中西藥聯用是目前治療胰腺癌的重要策略,合理聯用中西藥不僅能起到增強療效的作用,還可降低不良反應發生率。如姜黃素聯合吉西他濱或順鉑可顯著抑制胰腺癌PANC-1細胞增殖,提高PANC-1細胞對順鉑的敏感性,降低藥物有效治療濃度[17]。王偉等研究康萊特聯合5-氟尿嘧啶治療人胰腺癌PC-3細胞裸鼠皮下移植瘤實驗,發現康萊特顯著提高胰腺癌細胞凋亡率,降低Bcl-2的蛋白質水平表達,二者聯用治療胰腺癌效果優于兩藥單獨使用[18]。本研究結果顯示,康萊特注射液常與5-氟尿嘧啶或順鉑聯用。5-氟尿嘧啶廣泛應用于治療胰腺癌等在內的實體瘤,通過抑制胸苷酸合成酶活性誘導敏感腫瘤細胞凋亡。順鉑則通過結合腫瘤細胞膜上的蛋氨酸轉運蛋白,阻止蛋氨酸進入胞內,進而破壞腫瘤細胞DNA合成。化療藥物多具有劑量依賴性,隨著劑量的增加,患者不可避免地出現高效高毒現象。因而降低化療藥物的使用劑量,同時合理配伍中成藥是治療胰腺癌的有效途徑。
本文利用文本挖掘從海量文獻中探尋治療胰腺癌的用藥規律,獲得的結果忠于原文獻的表述。在未來的應用中,應注意篩查和去除噪音。通過審閱初步挖掘結果,若發現異常則進一步返查原文獻確認是否為噪音,一旦確認為噪音則構造降噪規則,優化挖掘結果,從而提高挖掘結果的質量。
[1] 呂婷, 姜友好. 文本挖掘在生物醫學領域中的應用及其系統工具[J]. 中華醫學圖書情報雜志, 2010 (4): 56-64.
[2] Fillat C, Jose A, Bofill-DeRos X, et al. Pancreatic cancer gene therapy: from molecular targets to delivery systems[J]. Cancers, 2011, 3(1): 368-395.
[3] Warsame R, Grothey A. Treatment options for advanced pancreatic cancer: a review[J]. Expert review of anticancer therapy, 2012, 12(10): 1327-1336.
[4] Li D, Xie K, Wolff R, et al. Pancreatic cancer[J]. The Lancet, 2004, 363(9414): 1049-1057.
[5] Long J, Zhang Y, Yu X, et al. Overcoming drug resistance in pancreatic cancer[J]. Expert opinion on therapeutic targets, 2011, 15(7): 817-828.
[6] Pan J. RNA polymerasean important molecular target of triptolide in cancer cells[J]. Cancer letters, 2010, 292(2): 149-152.
[7] Pinmai K, Chunlaratthanabhorn S, Ngamkitidechakul C, et al. Synergistic growth inhibitory effects of Phyllanthus emblica and Terminalia bellerica extracts with conventional cytotoxic agents: doxorubicin and cisplatin against human hepatocellular carcinoma and lung cancer cells[J]. World journal of gastroenterology: WJG, 2008, 14(10): 1491.
[8] Borja-Cacho D, Yokoyama Y, Chugh R K, et al. TRAIL and triptolide: an effective combination that induces apoptosis in pancreatic cancer cells[J]. Journal of Gastrointestinal Surgery, 2010, 14(2): 252-260.
[9] 鮑英, 夏璐, 姜華, 等. 薏苡仁提取液對人胰腺癌細胞凋亡和超微結構的影響[J]. 胃腸病學, 2005, 10(2): 75-78.
[10] 蔡瓊, 許健, 沃興德. 薏苡仁油對人胰腺癌 BxPC-3 細胞影響 IL-18 表達的體外實驗研究[J]. 中醫研究, 2010, 23(7): 11-14.
[11] 冀潤利, 邸瑤, 夏時海, 等. 氧化苦參堿對 SW1990 細胞 MMP-2 表達的抑制作用及對細胞侵襲力的影響[J]. 世界華人消化雜志, 2011, 19(1): 19-24.
[12] 冀潤利, 夏時海, 李飛, 等. 氧化苦參堿對人胰腺癌細胞血管內皮生長因子表達的影響[J]. WORLD CHINESE JOURNAL OF DIGESTOLOGY, 2006, 18: 3401.
[13] 田琦, 孫寶勝, 張矛. 康萊特注射液誘導人胰腺癌細胞凋亡[J]. 中國實驗診斷學, 2010, 14(12): 2026-2027.
[14] 李玉升. 康萊特注射液治療晚期胰腺癌新進展[J]. 中國腫瘤臨床, 2012, 39: 1158-1160.
[15] 孫曉東,劉杏娥. 姜黃素通過抑制 Ras-ERK 和 Shh-GLI1 信號誘導胰腺癌細胞凋亡[J]. 中國病理生理雜志, 2012, 28(6): 996-1000.
[16] 楊芳, 趙秋, 王渝, 等. 姜黃素抑制 STAT3 信號通路對胰腺癌細胞增殖的影響[J]. 世界華人消化雜志, 2011, 19(30): 3149-3153.
[17] 王若天, 錢明, 田園. 姜黃素聯合吉西他濱對人胰腺癌 Panc-1 細胞增殖的影響[J]. 中國生化藥物雜志, 2012, 33(4): 449-451.
[18] 王偉, 金建光, 秦兆寅. 康萊特聯合 5-Fu 治療人胰腺癌 PC-3 裸鼠皮下移植瘤的實驗研究[J]. 西安交通大學學報·醫學版, 2005, 10(26): 473-476.