摘要:目的 使用文本挖掘技術,對中成藥和西藥治療2型糖尿病的用藥規律進行探索和分析。方法 登錄《中國生物醫學文獻數據庫》,對2型糖尿病的治療文獻進行收集,建立Access數據庫,對數據進行人工降噪處理,對中成藥、西藥治療2型糖尿病的用藥規律進行分析。結果 在西藥應用中,吡格列酮、阿卡波糖、格列吡嗪、格列齊特、長效胰島素、瑞格列奈、預混胰島素、短效胰島素、羅格列酮、胰島素泵、二甲雙胍等西藥治療2型糖尿病的治療方式或者是高文獻頻數。在中藥應用中,生脈注射液、燈盞細辛注射液、參麥注射液、丹參片、玉泉丸、六味地黃丸、黃芪注射液、丹參注射液、消渴丸等中成藥為治療2型糖尿病的常用治療藥物。結論 使用文本挖掘技術對中成藥和西藥治療2型糖尿病的用藥規律進行探索,可以為臨床用藥和研究實驗提供客觀的依據。
關鍵詞:文本挖掘技術;中成藥;西藥;2型糖尿病;用藥規律
在臨床疾病中,2型糖尿病(簡稱T2DM)是一種對人類健康危害較大的疾病,患有代謝性疾病的患者主要臨床表現為伴有長期慢性高血糖癥狀,在糖尿病患者人群中,大多數為2型糖尿病類型。在中醫治療的理論中,糖尿病屬于\"消渴病\",通過長時間的臨床試驗,使用中醫藥治療糖尿病的經驗得到了豐富的積累。同時,中、西醫治療2型糖尿病的臨床實驗文獻也大量的保存在數據庫當中,本文使用文本挖掘技術,通過已有文獻中對治療2型糖尿病的中成藥、西藥用藥頻率方面進行分析,對中成藥、西藥治療2型糖尿病的用藥規律進行探索,現報告如下。
1資料與方法
1.1數據收集 本研究的資料選取自《中國生物醫學文獻數據庫》(簡稱CBM),登錄后在主題檢索欄輸入關鍵詞\"2型糖尿病\",通過搜索出現命題文獻數、主題詞、款目詞列表,將搜索主題詞進行合并,一共獲得38422篇相關文獻。
1.2數據處理 將所收集的數據遵循前后順序整理到一個文檔文件中,用ANSI編碼格式進行文件的存儲。使用專有的文本提取工具提取已下載的非結構化文本數據,并將提取的數據已格式化、方便數據庫處理的方式進行保存。
1.3文本分析和文本挖掘 在同一篇文獻中,當關鍵詞重復出現,只按照兩次進行計算。本研究中針對每篇文獻共同出現的關鍵詞對使用圖1算法進行構造,從而獲得DN-pairs數據。再對所獲得的數據表中的相同關鍵詞使用圖2的算法進行合并處理,對關鍵詞的出現頻率數進行保留,最終獲得DN-pairs-frqcy數據。
1.4使用專業知識對數據進行清洗 使用醫學專業知識評估DN-pairs-frqcy中的數據,對針對的特定疾病進行篩選,在DN-pairs-frqcy數據中仍有噪音問題的出現。例如在中藥的挖掘分析中,\"白及\"通常出現在文獻的\"蛋白及……\"中,西藥中的\"度和\"通常出現在文獻的\"胰島素抵抗程度和……\"等中。針對該現象可以對得到藥物進行原文獻回溯方法進行逐個分析,對規則進行建立,按照建立的規則清洗所得到的數據。
1.5可視化數據 將不同頻數的關鍵詞對從DN-pairs-frqcy數據表中抽出,使用Cytoscape2.7技術對數據進行可視化處理,最終獲得治療2型糖尿病的西藥、中成藥的文獻頻數信息。
2結果
2.1治療2型糖尿病的西藥文獻頻數表,見表1。
通過文本挖掘技術對數據進行清洗得出,吡格列酮、阿卡波糖、格列吡嗪、格列齊特、長效胰島素、瑞格列奈、預混胰島素、短效胰島素、羅格列酮、胰島素泵、二甲雙胍等西藥治療2型糖尿病的治療方式或者是高文獻頻數。
2.2治療2型糖尿病的中成藥文獻頻數表,見表2。
通過文本挖掘技術對數據進行清洗得出,生脈注射液、燈盞細辛注射液、參麥注射液、丹參片、玉泉丸、六味地黃丸、黃芪注射液、丹參注射液、消渴丸等中成藥為治療2型糖尿病的常用治療藥物。
3討論
通過本次研究表明,在西藥使用中,主要是針對胰島素分泌受損和胰島素抵抗這兩方面引發因素進行治療,將口服降糖藥分為非促胰島素分泌劑和促胰島素分泌劑兩大類。在西醫臨床治療中,主要是對胰島素進行治療,適用于口服降糖藥不理想或者是2型糖尿病初發的患者[1]。在中醫的治療中,主要是對患者進行滋腎養陰、活血通絡、益氣健脾方面進行治療[2]。
由此可見,使用文本挖掘技術對中成藥、西藥治療2型糖尿病用藥規律進行分析,可以對治療2型糖尿病用藥提供客觀意見,使醫生能夠合理的選擇,為藥物的相互作用機制和臨床研究提供有效的依據。
參考文獻:
[1]孔琳琳,張方.中醫藥與中西醫結合對比西藥治療2型糖尿病隨機對照試驗的Meta分析[J].中國藥物評價,2012,29(1):41-47.
[2]韓茹,曾志航,陳光亮,等.消渴丸治療2型糖尿病及低血糖反應研究概況[J].中成藥,2013,35(6):1299-1303.編輯/肖慧