999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于文本挖掘技術發(fā)現鼻炎治療規(guī)律

2017-03-22 01:22:22,,
中華醫(yī)學圖書情報雜志 2017年10期
關鍵詞:文本研究

,,

[作者單位]1.上海財經大學信息管理與工程學院,上海 200433;2.上海交通大學醫(yī)學院附屬新華醫(yī)院中醫(yī)科,上海 200092

大氣污染問題日益突出,對人類健康尤其是對呼吸系統(tǒng)的威脅越來越嚴重。鼻炎作為主要的呼吸道疾病之一,其全球發(fā)病率約為10%~25%;我國高發(fā)地區(qū)已達37.9%[1],且呈逐年上升趨勢。鼻炎發(fā)病率高、病程長、容易反復發(fā)作且難治愈,引起的鼻塞、頭痛、記憶力衰退、食欲不振、失眠、易疲倦等給患者工作、學習和生活都帶來了巨大影響。

隨著信息技術的高速發(fā)展,網絡數據資源呈爆炸式增長。網絡中存在大量的文本數據,傳統(tǒng)的信息檢索技術不能滿足用戶需求。文本挖掘作為數據挖掘的一個分支,從非結構化或者半結構化的文本中檢索信息,并將提取的知識呈現給用戶。近年來,文本挖掘技術在醫(yī)療健康領域的運用逐漸成為研究熱點。

本文基于在線醫(yī)療網站的醫(yī)患互動信息和中國知網的文獻信息,采用文本挖掘技術,發(fā)現鼻炎及其并發(fā)癥的常用中西藥、非藥物治療規(guī)律。

1 文獻綜述

文本挖掘技術能抽取分散在文本數據中未被發(fā)現的、有價值的、能被用戶理解的知識,隨著自然語言處理技術的進步,近年發(fā)展迅速。國外基于文本挖掘技術的醫(yī)學疾病研究應用廣泛,但由于漢字分詞、數據來源的限制,現階段國內并沒有普遍的研究與應用。

1.1 文本挖掘在醫(yī)學研究中的應用

隨著醫(yī)療信息文獻數據庫的建立和完善,目前很多國內學者青睞基于文獻數據利用文本挖掘技術研究某種中藥成分(如玉屏風散[2]、青風藤[3]等)的用藥規(guī)律,研究某種病(如慢性腎臟疾病[4]、乙型肝炎[5]等)的中醫(yī)治療用藥規(guī)律,以及對中藥的病證方藥相應規(guī)律[6]等的研究。由于中醫(yī)藥自身注重藥材、藥方的特點,學者基于文本挖掘技術對中醫(yī)藥的研究較多,西醫(yī)方面的文章較少。在數據來源上,多來自中國生物醫(yī)學文獻數據庫(CBM),來自網絡的數據源則較少使用,也未與臨床數據相結合。在國外,有許多基于網絡和社會媒體數據相關的研究,如進行疾病監(jiān)測和生物事件的探測[7],提取藥物不良反應信息[8],探索自我披露健康信息支持公共健康監(jiān)測和醫(yī)療保健[9],監(jiān)控濫用處方藥[10]等。

1.2 當前文本挖掘研究鼻炎的方式

國內相關文獻中并無實質的基于文本挖掘的鼻炎治療研究,目前研究主要采用三種方式。第一種是以文本數據作為數據來源做數據挖掘,把文本數據轉成數值數據來處理。蘇奎國等[11]以《中醫(yī)方劑大辭典精選本》作為方劑基本信息來源采集文本,結合《中華醫(yī)典》《方劑學》做文本篩選,挖出治療變應性鼻炎的方劑信息;韓東岳等[12]在PubMed、Embase、中國生物醫(yī)學文獻數據庫、中國知網數據庫、萬方數據庫和維普全文期刊數據庫中檢索采集關鍵詞為鼻炎、過敏性、變應性、穴位敷貼的文獻,通過閱讀文獻的題目、關鍵詞和摘要篩選文獻,結合《經絡腧穴學》和《中藥學》做數據清理后把數據錄入Excel做詞頻統(tǒng)計,運用SPSS軟件進行分層聚類挖掘出穴位貼敷治療鼻炎的選、配穴規(guī)律和用藥規(guī)律。第二種是采用文獻計量學的方法進行研究。如劉妮波等[13]對《中國學術期刊網絡出版總庫》中關于鼻炎相關的醫(yī)學科技論文進行分析,分別從載文量、高頻作者、研究機構和關鍵詞等方面進行深度挖掘;王鵬等[14]檢索CNKI 2006—2010年間的針灸治療鼻炎研究的全部文獻,采用文獻計量學方法進行統(tǒng)計分析。第三是基于現成文本分析軟件進行分析。如宋立家等[15]收集CNKI中運用中醫(yī)藥方劑治療變應性鼻炎的文獻,篩選并建立方劑數據庫,運用中醫(yī)傳承輔助平臺軟件挖掘其中的用藥規(guī)律。

2 方法與數據

2.1 方法

主要使用文本挖掘方法,分為文本采集、文本預處理、文本分析、知識獲取和相關性分析5個過程。

文本采集:從中國知網導出相關文獻,從在線醫(yī)療網站上抓取醫(yī)患互動論壇的問答帖。

文本預處理:將文本轉化成文本挖掘工具可以處理的形式,去掉不需要的部分,主要包括文本分詞和文本清洗。文本分詞的準確性和質量好壞對后繼工作有很大影響,分詞僅針對中文,需要導入專業(yè)研究相關的詞典以提高分詞質量;文本清洗是把分詞后的文本去除對研究無意義的停用詞,如標點符號、連詞、助詞、語氣詞等,避免干擾后續(xù)文本挖掘,另外也要考慮同義詞和近義詞的合并。

文本分析:用詞頻統(tǒng)計、特征提取等方法,找出一些特征以便分析使用。

知識獲取:結合專業(yè)知識對整理分析后的文本進行解釋,獲取有用的知識。

相關性分析:從一個同類或不同類的文檔集合中尋找某些關鍵詞之間的相關性,根據某兩個或多個詞同時出現的頻率找出相關系數。相關系數主要通過詞頻統(tǒng)計來計算,例如包含氯雷他定的文本數有100個,同時包含粉塵螨的文本有50個,二者相關系數為0.5=50/100。本文用相關性分析方法分析鼻炎常見并發(fā)癥的思路步驟是:篩選出含有鼻炎的某個常見并發(fā)癥的文本,在這些文本中查找癥狀或藥物名詞進行合并和抓取原詞;統(tǒng)計詞頻和計算相關系數。

同時,使用文獻研究法梳理文本挖掘在醫(yī)學中的研究現狀,綜述當前文本挖掘研究鼻炎的方式,并對比驗證本文的一些研究結論。

2.2 數據

2.2.1 文本數據采集

綜上所述,在初中英語教學中,做好教學目標設計尤為重要,教師應該從明確教學目標設計依據、加強自身目標設計意識、掌握正確的目標設計方法與策略等方面有效設計好課堂教學目標,有效保證課堂教學質量,提升學生綜合素質與能力。

文本來源于中國知網CNKI、好大夫在線網(http://www.haodf.com)和尋醫(yī)問藥網(http://www.xywy.com)。中國知網的內容以數據庫形式進行有序管理,有明確的來源、出處,內容可信度很高,可以作為學術研究、科學決策的依據;好大夫在線網和尋醫(yī)問藥網是我國當前醫(yī)療信息較為完備,用戶較多的醫(yī)患互動平臺。

選用八爪魚采集器獲取醫(yī)患互動文本。分別在好大夫在線網站和尋醫(yī)問藥網鼻炎專題“患者咨詢”下提取文本,每條文本內容包括發(fā)帖時間、性別、年齡、標題、病人描述、醫(yī)生回答;在中國知網中以主題詞“鼻炎”為搜索條件搜索到1950年2月至2016年2月間的相關文獻,導出題名、關鍵詞、摘要;最終醫(yī)患互動平臺采集到文本37 809條,中國知網采集到文本19 318條,共計57 127條文本數據(已去重)。

將相關文獻的文本數據拆分為title,keyword,summary 3個數據集,合并兩個醫(yī)患互動論壇數據,然后拆分病人咨詢文本數據和醫(yī)生診斷文本數據,得到patient_desc和doctor_diag數據集。

2.2.2 文本數據處理

新詞典的安裝及特殊新詞的手動添加是兩項很重要的工作。下載搜狗細胞詞庫,使用深藍詞庫轉換工具2.0版本,將.scel的搜狗細胞詞庫格式轉換成.txt格式。文本處理中特征詞的定義將決定最后分詞質量的好壞。由于事先沒有一個相對完整的特征詞,這里主要對采集文本進行觀察,在網絡上搜集相關信息,然后針對藥品、非藥物治療手段定義特征詞(例如藥品的特征詞如噴霧、噴劑、顆粒、沖劑、他定、西替、咪唑、滴鼻液、鼻炎水、膠囊、片等,非藥物的特征詞有激素、針灸、清洗、治法、清潔、清除、充血劑、鹽水、洗鼻、冷水、慢跑、鍛煉等),并把這些特征詞加入到自定義詞典中。

Keyword數據集中的文本是由一個個詞語組成,不需要分詞,直接對keyword數據集做文本清洗;title、summary、patient_desc和doctor_diag中的文本均為句子,需要分別進行分詞處理。將之前提取的keyword關鍵詞也加入到詞典中,然后基于詞典使用Rwordseg包進行分詞處理和文本清洗。

3 結果

3.1 詞頻統(tǒng)計

詞頻統(tǒng)計分別見表1-表3,圖1-圖3。從表1-表3,圖1-圖3可見根據頻次由多到少治療鼻炎相關的西藥依次是氯雷他定、粉塵螨、布地奈德、西替利嗪、輔舒良等,根據頻次多少治療鼻炎用的中藥依次是玉屏風散或顆粒、蒼耳子等。 在鼻炎的非藥物治療手段的關鍵詞中,“針灸”的詞頻最高,然后依次是糖皮質激素、生理鹽水、脫敏療法、激素、免疫療法、減充血劑、針刺、按摩等,中西醫(yī)結合療法詞頻也較高。鼻炎并發(fā)癥發(fā)病較高的依次是鼻竇炎、氣管炎、咽炎、中耳炎、肺炎等。

表1 鼻炎的治療藥物及詞頻

表2 鼻炎的非藥物治療方法及詞頻

表3 鼻炎的并發(fā)癥及其詞頻

圖1 鼻炎的藥物治療方法詞云

圖2 鼻炎的非藥物治療方法詞云

圖3 鼻炎的并發(fā)癥詞云

3.2 相關分析

基于詞頻統(tǒng)計的分析,以采集到的原始文本(病人描述+醫(yī)生描述)為單位,選擇鼻炎最常見三種并發(fā)癥(鼻竇炎、氣管炎、咽炎)為對象,分析某個并發(fā)癥的癥狀和治療用藥特點。各并發(fā)癥狀及相關用藥見表4-表9。癥狀表示的是鼻炎并發(fā)某種并發(fā)癥的癥狀。如表4中,鼻粘膜問題是鼻炎并發(fā)鼻竇炎的表現癥狀,目前基于我們的數據樣本看,與其他癥狀相比,鼻炎并發(fā)鼻竇炎的相關度高,是表現得比較多的癥狀;與鼻炎并發(fā)鼻竇炎相關的用藥,蒼耳子的使用沒有通竅鼻炎片多,并發(fā)癥的相關程度排在第二。

表4 鼻炎并發(fā)鼻竇炎相關癥狀

表5 鼻炎并發(fā)鼻竇炎相關用藥

表6 鼻炎并發(fā)氣管炎相關癥狀

表7 鼻炎并發(fā)氣管炎相關用藥

表8 鼻炎并發(fā)咽炎相關癥狀

表9 鼻炎并發(fā)咽炎相關用藥

4 討論

4.1 鼻炎及其并發(fā)癥的中西藥物和非藥物療法

研究發(fā)現,中藥蒼耳子被普遍應用于鼻炎的治療,對緩解鼻塞、鼻炎、抑制變態(tài)反應具有一定的療效,但蒼耳子具有一定毒性,超過劑量或長期使用可致神經系統(tǒng)及肝腎損害,需要在醫(yī)生指導下謹慎、小劑量使用。

中藥方劑玉屏風由黃芪、白術、防風組成,具有益氣固表抗過敏的功效,大量臨床研究證實“玉屏風顆粒”或“玉屏風散”治療鼻炎療效確切,是治療鼻炎的重要中成藥之一。

中醫(yī)外治療法被廣泛應用于鼻炎臨床。如針灸通過辨證取穴,可應用于過敏性鼻炎的急性期和緩解期,有良好療效[16];穴位敷貼通過中藥藥物或者遠紅外磁熱材料,刺激相應穴位,療效好、無針刺痛苦,是代替?zhèn)鹘y(tǒng)針灸的外治方法,經臨床證明療效顯著;鐘娟等[17]確認了針刺、艾灸、推拿、拔罐、刺血療法、穴位埋線、耳穴壓丸等鼻炎的非藥物治療的有效性。但我們的數據里,拔罐、刺血、埋線等療法的頻次較低或未出現,尚待進一步探究。

糖皮質激素主要用于急性感染、自身免疫性和過敏性疾病,可以明顯緩解哮喘、鼻炎的氣道炎癥。

利用生理鹽水沖洗鼻腔可以獲得較好療效,趙秀華[18]和劉杰等[19]等認為生理鹽水沖洗對小兒鼻炎更加有效。

隨著醫(yī)學的進步,免疫療法和脫敏療法逐漸成為研究的熱點,通過調節(jié)免疫進而間接治療鼻炎,從詞頻上來看,這個治療思路更容易被患者接受。

鼻炎的并發(fā)癥較多,依次為鼻竇炎、氣管炎、咽炎、中耳炎、肺炎等,前三個并發(fā)癥均有咳嗽、流涕、鼻出血等癥狀,除共有癥狀外,經詞頻統(tǒng)計,鼻炎并發(fā)鼻竇炎還有嗅覺減退、呼吸困難等癥狀。鼻炎并發(fā)咽炎可伴有下鼻甲肥大、扁桃體肥大等。通過區(qū)分鼻炎并發(fā)癥,可指導臨床精準用藥。

文本挖掘發(fā)現治療鼻炎并發(fā)鼻竇炎藥物有:鼻炎片、蒼耳子、糖皮質激素、布地奈德等。由于鼻炎與鼻竇炎常常相伴發(fā)生,同為鼻腔內黏膜炎癥,僅僅是發(fā)病部位不同,因此鼻炎并發(fā)鼻竇炎的相關藥品與鼻炎的藥品一致。

鼻炎并發(fā)氣管炎的治療藥物為磺胺類藥物、糖皮質激素、鵝不食草等,鼻炎并發(fā)咽炎藥物有咽喉噴劑、地氯雷他定、抗組胺藥等。

4.2 本研究的創(chuàng)新性

目前中醫(yī)藥人研究治療鼻炎的用藥規(guī)律時基本上都是基于文獻數據庫。雖然文獻數據更具有權威性,但已被人為處理過。

國外的研究成果證明,網絡數據在醫(yī)學某方面應用的有效性,直接從網上抓取的數據更新及時,具有客觀性、先進性以及臨床價值。因此,本文在研究方法和數據源選擇方面進行了新的嘗試,驗證網絡數據源的可用性和運用文本挖掘技術的可行性。

4.3 本研究的局限性

本文存在以下4個方面的局限性。

4.3.1 醫(yī)生的回答權威性不足

文本數據源中2/3來自醫(yī)患互動論壇的醫(yī)患問答。盡管回答問題的醫(yī)生都是在全國各地醫(yī)院持證問診的醫(yī)生,但是無法與患者面對面診斷,對疾病或患者信息了解得不夠全面,可能導致醫(yī)生的回答權威性不足。

4.3.2 文本挖掘分詞的準確性和有效性有待提高

研究課題涉及了大量醫(yī)學方面的專業(yè)知識。由于經驗不足,在文本挖掘的分詞過程中對專業(yè)字典的構造不夠理想,會影響分詞的準確性和有效性,使得個別干擾詞匯出現。

4.3.3 特征詞的定義存在主觀性

文本處理中特征詞的定義基于觀察和分析,具有主觀性,定義好壞會影響分詞的質量,進而影響研究結果。以后要研究更為科學合理的特征詞提取方法,減少主觀隨意性,避免遺漏。

4.3.4 文本數據量有限

文本數據量不夠大,不能夠完全覆蓋龐大的鼻炎患者群體,詞頻統(tǒng)計未必能精準地反映出相關信息,得到結論可能會有偏差。

5 結語

治療,特別是中醫(yī)治療,多強調單個臨床試驗的療效情況。挖掘技術能從大量散在的臨床試驗中,把握共性的規(guī)律,為今后指導臨床用藥或標準化臨床治療提供參考。本文嘗試基于網絡數據和文獻數據用文本挖掘方法來研究鼻炎問題,只是對新數據源、新方法的初步探索,希望拋磚引玉,引發(fā)更多的思考和研究。

猜你喜歡
文本研究
FMS與YBT相關性的實證研究
2020年國內翻譯研究述評
遼代千人邑研究述論
初中群文閱讀的文本選擇及組織
甘肅教育(2020年8期)2020-06-11 06:10:02
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
在808DA上文本顯示的改善
EMA伺服控制系統(tǒng)研究
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
新版C-NCAP側面碰撞假人損傷研究
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
主站蜘蛛池模板: 日韩二区三区无| 亚洲三级a| 亚洲欧美成人在线视频| 欧洲欧美人成免费全部视频| 国产激情在线视频| 麻豆国产在线观看一区二区| 国产视频欧美| 日韩在线永久免费播放| 91伊人国产| 波多野结衣中文字幕一区二区| 又爽又大又黄a级毛片在线视频 | 国产杨幂丝袜av在线播放| 国产福利微拍精品一区二区| 小说区 亚洲 自拍 另类| 91欧美亚洲国产五月天| 国产成人h在线观看网站站| 无码区日韩专区免费系列 | 亚洲大学生视频在线播放| 亚洲最大看欧美片网站地址| 国产亚洲精品自在线| 亚洲午夜片| 亚洲欧美h| 1769国产精品免费视频| 婷婷午夜影院| 国产福利一区二区在线观看| 国产福利一区在线| 久久精品这里只有国产中文精品 | 亚洲第一成人在线| 在线亚洲小视频| 免费无码AV片在线观看中文| 欧美日韩国产成人高清视频| 国精品91人妻无码一区二区三区| 久久国产精品电影| 亚洲欧美激情小说另类| 色精品视频| 无码福利日韩神码福利片| 亚洲精品国产自在现线最新| 伊在人亞洲香蕉精品區| 亚洲不卡网| 日韩a在线观看免费观看| 在线精品自拍| 一本大道香蕉中文日本不卡高清二区| 国产美女在线免费观看| 亚洲中文字幕23页在线| 91热爆在线| 国产无遮挡裸体免费视频| 欧美精品亚洲日韩a| 免费在线看黄网址| 狠狠色丁香婷婷| 小蝌蚪亚洲精品国产| 在线观看国产精品一区| 天堂久久久久久中文字幕| 国产极品粉嫩小泬免费看| 欧美亚洲国产视频| 日韩黄色在线| 国产成人无码Av在线播放无广告| 亚洲精品色AV无码看| 欧美国产日韩在线| 大乳丰满人妻中文字幕日本| 女人18毛片一级毛片在线| 天天色综网| AV色爱天堂网| 国产精品v欧美| 中文字幕一区二区视频| 国内精品免费| 日韩不卡高清视频| 四虎综合网| 97国产在线视频| 久久久国产精品无码专区| 伊伊人成亚洲综合人网7777| 国产福利免费视频| 亚洲最猛黑人xxxx黑人猛交| 97超爽成人免费视频在线播放 | 国产成人欧美| 国产精品视频白浆免费视频| 在线国产欧美| 国产精品污视频| 久久精品一卡日本电影| 久无码久无码av无码| 成人亚洲视频| 久草中文网| 91青青视频|