999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于互信息的中醫癥狀推薦系統

2023-11-09 04:34:21李穎王月郝建軍王嘉鋒
自動化與信息工程 2023年5期
關鍵詞:文本癥狀系統

李穎 王月 郝建軍 王嘉鋒

摘要:針對中醫診斷過于依賴醫生經驗的問題,提出一種基于互信息的中醫癥狀推薦系統。首先,對原始病例數據進行中醫癥狀規范化,構建癥狀術語字典,使系統輸入規范的癥狀;然后,通過互信息計算癥狀之間的關聯性;最后,利用歸一化折損累計增益(NDCG)指標驗證癥狀的推薦效果,獲得癥狀的推薦列表。實驗結果表明,該系統能根據一個癥狀或多個癥狀獲得其他相關聯的癥狀,實現中醫癥狀推薦功能。

關鍵詞:中醫;互信息;癥狀推薦;數據挖掘;癥狀術語字典;歸一化折損累計增益

中圖分類號:TP311???????????文獻標志碼:A ???????????文章編號:1674-2605(2023)05-0008-06

DOI:10.3969/j.issn.1674-2605.2023.05.008

Chinese Medicine Symptoms Recommendation System Based on Mutual Information

LI Ying1??WANG Yue2 ?HAO Jianjun3??WANG Jiafeng3

(1.Dongguan Zhongke Institute of Cloud Computing, Dongguan 523000, China

2.Guangdong Electronics Industry Research Institute Co., Ltd., Dongguan 523000, China

3.Guangzhou Huangpu Traditional Chinese Medicine Hospital, Guangzhou 510700, China)

Abstract:?A Chinese medicine symptom recommendation system based on mutual information is proposed to address the issue of excessive reliance on doctor experience in Chinese medicine diagnosis. Firstly, standardize Chinese medicine symptoms on the original case data, construct a symptom terminology dictionary, and enable the system to input standardized symptoms; Then, calculate the correlation between symptoms through mutual information; Finally, use the NDCG indicator to verify the recommendation effect of symptoms and obtain a recommended list of symptoms. The experimental results show that the system can obtain other related symptoms based on one or more symptoms, and achieve the recommendation function of Chinese medicine symptoms.

Keywords:?Chinese medicine; mutual information;?symptoms recommendation; data mining; dictionary of symptom terms; normalized discounted cumulative gain

0??引言

我國中醫學博大精深、歷史悠久,是現代醫療體系重要的組成部分。中醫的診療過程包括四診識別和辨證論治2個階段,即醫生先通過望、聞、問、切,結合診療經驗辨別患者的身體狀況和疾病信息;再總結提取相應的癥狀,得到證候信息,從而做出診斷并

給出治療方案。在癥狀提取過程中,醫生通常根據患者當前癥狀詢問相關聯的癥狀,這個過程非常依賴醫生的個人經驗,經驗較少的醫生難以獲取準確癥狀。近年來,隨著互聯網、人工智能技術的快速發展,相關技術已經應用于中醫領域[1-3],推動了中醫現代化發展的進程[4-5]。結合人工智能與大數據技術進行中醫輔助診斷,推薦與患者當前癥狀相關聯的其他癥狀,具有十分重要的現實意義。

宋海貝等[6]基于層次聚類和卷積神經網絡開發了中醫舌像面像輔助診療系統,可對舌像和面像進行自動診斷和分析,并將結果實時反饋給用戶,達到健康管理的目的。余江維等[7]利用文本挖掘與自動分類技術,通過TF-IDF算法進行中醫證候的自動分類與量化研究,得到不同證型的證候分布,驗證了TF-IDF相對熵量化中醫證候的可行性。任晉宇等[8]利用數據挖掘和度量學習技術挖掘、整理中醫診療經驗知識,建立病案相似度的計算方法,設計并實現了中醫輔助診療推薦系統。

推薦系統是互聯網領域有效的信息過濾方法,可避免信息過載,實現個性化服務。主流的推薦系統一般采用基于信息內容、基于協同過濾、基于知識、混合的推薦方法[9-10]。近年來,已有許多學者將推薦系統的思想應用于中醫癥狀推薦領域。吳信朝等[11]利用癥狀之間的余弦相似度確定患者的推薦癥狀,實現中醫癥狀的推薦功能,解決了人工經驗強耦合的問題,能夠從較多的相似癥狀中,篩選并確定患者的推薦癥狀。曹靜[12]提出基于癥狀關聯網絡的中醫輔助問診提示癥狀推薦算法,通過分析中醫問診數據得到下一步問診提示,提高醫生辨證的準確性。

本文利用互信息技術,分析中醫癥狀的相關性,實現根據患者當前癥狀推薦相關聯癥狀的功能,可輔助醫生診療,提高醫生的工作效率。

1??中醫癥狀推薦系統

基于互信息的中醫癥狀推薦系統主要包括在線癥狀輸入模塊、癥狀提取模塊、癥狀關聯度計算模塊、癥狀推薦模塊4部分,系統框圖如圖1所示。

在線癥狀輸入模塊輸入患者的當前癥狀;癥狀提取模塊構建癥狀病例數據集;癥狀關聯度計算模塊計算與輸入癥狀相關聯的前k個癥狀;癥狀推薦模塊輸出推薦的癥狀。

1.1??癥狀提取

原始病例數據是描述患者信息的自然語言文本,而基于互信息的中醫癥狀推薦系統的數據處理需使用具體的癥狀向量,因此需要對病例數據進行癥狀提取操作。

首先,對原始病例數據進行數據清洗,選取主述及現病史部分文本,通過正則表達式等操作過濾噪聲內容,篩選出包含患者癥狀相關信息的自然語言文本句子。

然后,制定癥狀術語字典。由于中醫癥狀描述方式眾多且尚未有統一的術語字典,同一個癥狀有多種不同的描述方式。為便于后續處理,將中醫癥狀描述規范化,制定癥狀術語字典。如鼻腔分泌物清稀、有鼻水這兩種癥狀描述可以規范化為鼻流清涕。先將描述癥狀的自然語言文本數據轉化為結構化數據,并使數據標注盡可能去模糊化;再結合臨床病例數據與《中醫診斷學》[13]、《中醫癥狀鑒別診斷學》[14]、《常見癥狀鑒別診斷學》[15]中的癥狀術語及解釋,得到癥狀術語字典。

最后,利用癥狀術語字典對病例數據進行癥狀提取,獲得患者的證候信息,構建癥狀病例數據集。病例數據中的癥狀提取方法為:1) 通過規范化的癥狀名及別稱進行字符串匹配,匹配相似度利用萊文斯坦距離(一個字符串轉成另一個字符串所需的最少編輯操作次數)來衡量;2) 計算2個字符串的相似度時,將較長的字符串裁剪成與較短字符串相同長度的多個子字符串,計算各個子字符串與較短字符串的萊文斯坦距離,并以其最小值作為2個字符串的相似度。2個字符串相似度的定義為

若病例數據的自然語言文本與某個癥狀關鍵字的相似度大于設定閾值,則認為該文本中有這個癥狀。通過不斷迭代學習可得到最優閾值,從而準確提取文本對應的癥狀。

1.2??癥狀關聯度計算

基于互信息的中醫癥狀推薦系統的關鍵步驟為癥狀關聯度計算,通過癥狀關聯度可獲得與當前輸入癥狀相關的其他癥狀。本文利用互信息算法來計算癥狀病例數據集的癥狀關聯度,流程如圖2所示。

互信息表示變量XY的關聯程度,關聯程度越高,互信息值越大,計算公式為

首先,以測試集中病例數據主述癥狀為輸入,現病史的癥狀為真實癥狀,利用互信息矩陣計算并選取前k個互信息值高的推薦癥狀;然后,利用測試集中推薦癥狀的歸一化折損累計增益(normalized discounted cumulative gain, NDCG)指標來驗證推薦準確度,并根據NDCG指標來調整算法參數,反復迭代得到最佳參數;最后,合并訓練集和測試集,計算癥狀的互信息矩陣。

NDCG用于評估推薦結果的效果,取值范圍為0~1,值越大推薦效果越好,計算公式為

推薦系統返回一個推薦癥狀列表,每個推薦癥狀都有相關性的評分值。

1.3 ?癥狀推薦

通過癥狀關聯度計算模塊得到癥狀病例數據集的互信息矩陣后,新的在線輸入癥狀可利用該互信息矩陣來計算當前癥狀與數據集中其他癥狀的互信息值,最后選取前k個互信息值高的癥狀作為當前癥狀的推薦癥狀。

2??實驗

2.1 ?實驗數據

本文采用的病例數據來自某醫院的臨床門診病例數據共3?312條。對病例數據中的癥狀規范化處理后,癥狀術語字典包含844種規范癥狀,2?232種別稱。

2.2 ?實驗結果與分析

首先,將原始病例數據中的主述文本和現病史文本進行數據預處理,劃分為包含癥狀信息的單個文本句子;然后,對文本句子進行癥狀提取,本文癥狀提取采用的字符串相似度閾值為0.7;最后,將癥狀提取算法得到的癥狀與真實存在的癥狀進行對比計算,在病歷主訴文本中的準確率為88.32%,在現病史文本中的準確率為83.04%。部分文本癥狀提取結果如表1所示。

本實驗采用的3?312條病例數據包含17?875個癥狀,431種癥狀類別,癥狀間可兩兩組合成9?729對癥狀對,其中出現頻次最高的前10對癥狀對如表2所示。

利用公式(3)計算癥狀對的互信息值,取得分高的前10對癥狀對如表3所示。

由表3可知,出現頻次高的癥狀對的互信息值不一定大,這是因為互信息值的計算不僅取決于癥狀對共同出現的概率,還與每個癥狀單獨出現的概率成反比。如失眠癥狀出現次數較多,導致包含該癥狀的癥狀對的互信息值變小。

為了減少偶然性,將癥狀病例數據集按4∶1隨機劃分為訓練集和測試集。利用訓練集數據計算互信息矩陣,將訓練集中的癥狀兩兩組合,共得到8?723對癥狀對,互信息值最高的前10對癥狀對及互信息值如表4所示。

由表4可知,訓練集中失眠和煩躁癥狀對的互信息值最高,表示訓練集中失眠和煩躁癥狀關聯性相對較高。

根據癥狀對的互信息值,構建癥狀對互信息矩陣。該矩陣是一個431×431的二維數組,每一行每一列為一個癥狀,數值為癥狀對的互信息值。利用互信息矩陣計算訓練集中的推薦癥狀,具體操作為:將訓練集的主述癥狀作為輸入,計算其對應的推薦癥狀列表;如果輸入多于2個癥狀,則將各癥狀單獨輸入后得到的推薦列表對應的癥狀推薦分數相加。測試集隨機抽取5個病例數據的癥狀輸入與推薦癥狀(設置為前10個)及病例數據中真實出現的癥狀結果如表5所示。

由表5可知,推薦的前10個癥狀基本可以涵蓋實際癥狀,僅有個別特殊關聯性較小的癥狀未被推薦,如咳嗽與大便溏的癥狀對在數據集中只有69對,其互信息值較低,前10個推薦癥狀中未給出大便溏的癥狀。

為了進一步研究不同推薦癥狀個數對推薦結果的影響,分別計算測試集中5~50個推薦癥狀的NDCG值及F1分數,結果如表6所示。

由表6可知:隨著推薦癥狀個數增多,推薦結果的NDCG值也不斷增大,說明增加推薦癥狀個數有利于數據集中癥狀關聯性較小的癥狀推薦,可提高頻率較少的特殊關聯癥狀推薦的準確度;當推薦癥狀個數為20時,F1分數最高,說明推薦癥狀個數為20時,推薦效果最好。

根據上述實驗結果,設置推薦癥狀個數為前20個,在癥狀病例數據集內計算癥狀對的互信息值,構建互信息矩陣,推薦相關聯癥狀。實驗采用5組輸入癥狀,最終的推薦效果如表7所示。

由表7可知,采用基于互信息的中醫癥狀推薦系統得到的推薦癥狀基本為輸入癥狀的相關癥狀。

3??結論

本文主要研究從臨床病例數據的癥狀提取基于互信息技術的癥狀推薦的全過程。實驗結果表明,本文提出的基于互信息的中醫癥狀推薦系統可有效推薦當前癥狀的相關聯癥狀,在醫生問診過程中給予提示,減輕醫生因經驗不足而導致的診斷困難。同時該系統應用于醫院病歷系統,有助于醫生快速方便地記錄癥狀信息,提高病歷錄入的效率。后續研究中可不斷補充完善病例數據庫資源,進一步提高系統的穩定性和可靠性。

參考文獻

[1] 李艷,楊國慶,雙嬌月.人工智能在醫療應用中的新進展[J].中國醫藥導報,2021,18(13):43-46.

[2] 陳挺木.一種疫情防控用服務機器人系統的設計與驗證[J].機電工程技術,2022,51(12):241-243.

[3] 劉輝,牛智有.電子鼻技術及其應用研究進展[J].中國測試,?2009,35(3):6-10.

[4] 任相閣,任相穎,李緒輝,等.醫療領域人工智能應用的研究進展[J].世界科學技術-中醫藥現代化,2022,24(2):762-770.

[5] 文杭,黃麗,劉江,等.人工智能技術在中醫臨床診療中的應用研究進展[J].中國醫藥導報,2021,18(8):42-45.

[6] 宋海貝,溫川飆,程小恩.基于AI的中醫舌象面象輔助診療系統構建[J].時珍國醫國藥,2020,31(2):502-505.

[7] 余江維,余泉,張太珍,等.基于TF-IDF相對熵的中醫證候量化研究[J].世界科學技術-中醫藥現代化,2015,17(10):1986-1991.

[8] 任晉宇,白琳,鐘華.中醫輔助診療推薦系統設計與實現[J]. 中國中醫藥圖書情報雜志,2021,45(3):1-5.

[9] XU Hailing, WU Xiao, LI Xiaodong, et al. Comparison study of Internet recommendation system[J]. Journal of Software, 2009, 20(2):350-362.

[10] 鄭誠,徐啟南,章金平.基于互信息的推薦系統方法研究[J]. 微電子學與計算機,2018,35(12):76-79;84.

[11] 吳信朝,阮曉雯,陳遠旭.一種無監督中醫癥狀推薦方法、裝置、設備及介質:CN114743670A[P].2022-07-12.

[12] 曹靜.基于復雜網絡的推薦算法在中醫輔助問診中的應用研究[D].鎮江:江蘇大學,2018.

[13] 李燦東.中醫診斷學[M].北京:中國中醫藥出版社,2016.

[14] 姚乃禮.中醫癥狀鑒別診斷學[M].北京:人民衛生出版社, 2002.

[15] 朱豫川,鄭海軍,馮衛華.常見癥狀鑒別診斷學[M].北京:中醫古籍出版社,2001.

作者簡介:

李穎,女,1986年生,博士研究生,工程師,主要研究方向:知識圖譜和深度學習在中醫藥大數據的融合應用。E-mail: liying@casc.ac.cn

王月,女,1996年生,碩士研究生,工程師,主要研究方向:自然語言處理在中醫領域的應用研究。E-mail: wangyue_hit0616@163.com

郝建軍,男,1955年生,教授,主任中醫師,主要研究方向:臨床內科和中西醫結合的臨床研究。E-mail:?2217064411@qq.com

王嘉鋒,男,1979年生,大學本科,主任中醫師,主要研究方向:中醫內科、醫院管理。E-mail:?670097078@qq.com

猜你喜歡
文本癥狀系統
Don’t Be Addicted To The Internet
Smartflower POP 一體式光伏系統
工業設計(2022年8期)2022-09-09 07:43:20
有癥狀立即治療,別“梗”了再搶救
保健醫苑(2022年1期)2022-08-30 08:39:40
WJ-700無人機系統
ZC系列無人機遙感系統
北京測繪(2020年12期)2020-12-29 01:33:58
可改善咳嗽癥狀的兩款藥膳
在808DA上文本顯示的改善
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
連通與提升系統的最后一塊拼圖 Audiolab 傲立 M-DAC mini
夏季豬高熱病的癥狀與防治
獸醫導刊(2016年6期)2016-05-17 03:50:35
主站蜘蛛池模板: 国产成人乱无码视频| 亚洲欧美日韩天堂| 日本久久久久久免费网络| 91免费国产高清观看| 免费观看欧美性一级| 99国产在线视频| 亚洲性日韩精品一区二区| 999国产精品| 国产成人8x视频一区二区| 99er这里只有精品| 伊人色在线视频| 午夜日韩久久影院| 中文字幕无线码一区| 国产精品无码一二三视频| 国产在线观看99| 亚洲国产看片基地久久1024| 国产精品制服| 国产精品久久久久婷婷五月| 2021无码专区人妻系列日韩| 白丝美女办公室高潮喷水视频| 免费av一区二区三区在线| 尤物视频一区| 日韩视频免费| 国产视频久久久久| 国产91色在线| 欧美日韩资源| 国产高潮流白浆视频| 国产人成乱码视频免费观看| 国产你懂得| 99热国产这里只有精品9九| 伊人久久综在合线亚洲91| 国产一区二区三区夜色| 996免费视频国产在线播放| 欧美性精品不卡在线观看| 72种姿势欧美久久久大黄蕉| 欧美激情福利| 视频在线观看一区二区| 欧美午夜在线视频| 国产第一页屁屁影院| 中文字幕丝袜一区二区| 国产福利影院在线观看| 久久成人国产精品免费软件| 无码专区国产精品一区| 久久男人视频| 久久99国产精品成人欧美| 992Tv视频国产精品| 国产成人欧美| 香蕉99国内自产自拍视频| 久久久久亚洲av成人网人人软件| 国产在线精品人成导航| 精品国产成人国产在线| 青青青草国产| 中文字幕首页系列人妻| hezyo加勒比一区二区三区| 中文字幕在线看| 亚洲第一黄片大全| 欲色天天综合网| 国产成人免费高清AⅤ| 亚洲三级视频在线观看| 色偷偷一区二区三区| 一级全黄毛片| 黄色网站在线观看无码| 欧美午夜理伦三级在线观看| 伊人久久久久久久| 国产第一页亚洲| 黄色污网站在线观看| www.日韩三级| 精品在线免费播放| 日韩精品一区二区深田咏美| 久久www视频| 国产综合欧美| 国产精品尤物铁牛tv | 久久精品最新免费国产成人| 色妞www精品视频一级下载| 日本国产精品| 久草视频中文| 欧美成人影院亚洲综合图| 91娇喘视频| 久久国产V一级毛多内射| 999精品色在线观看| 国产区人妖精品人妖精品视频| 国产一级视频在线观看网站|