999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于標簽預測和奇異值分解的醫生推薦系統的實現

2023-06-21 01:58:58徐志堅易麗瑩
智能計算機與應用 2023年6期
關鍵詞:數據庫信息系統

徐志堅, 易麗瑩

(廣州市第一人民醫院, 廣州 510000)

0 引 言

隨著信息技術的不斷發展,醫療信息系統也得到了快速發展,很多醫院建設了醫生推薦系統,提供推薦醫生的服務工作。 但是目前的大多數系統存在著計算復雜、精度不高等問題,亟需對醫生推薦系統的算法進行優化,本文基于標簽預測和奇異值分解算法,優化設計醫生推薦系統,并進行了性能分析。

1 標簽預測和奇異值分解算法概述

1.1 標簽預測

使用多標簽分類等算法對醫生所擅長治療疾病進行標簽預測,根據醫生的標簽為患者推薦符合需求的醫生。 在對醫生的擅長治療標注時,需要建立特征向量和標簽向量,如醫生有d個標簽,則標簽向量Y的維度數量為d,其中各維度分別表示該醫生所擅長治療的一種疾病[1]。 如果醫生擅長治療一種疾病,則該維度的值為1;如果不擅長,該維度的值為0。

特征向量X包含以下3 種信息:

(1)分類信息。 包括醫生所在醫院、科室、職稱以及其他醫生對其評價等信息,需要對每項信息特征進行編碼。 以科室舉例說明,設科室取值數量為Oi,表示為P維度的向量,每個維度表示一個科室,一個醫生按照其所在科室將向量對應的緯度值定為1。 對于這類特征信息,各向量中只有一項為1,其余各項均為0。 如果分類信息特征數量為P,則特征維度為

(2)數值信息。 包含圖文咨詢平臺數、電話咨詢平臺數、站內關注數等。 對于這些數值信息,按照數值特征的數量表示為q維向量的方式進行處理[2]。

(3)文本信息。 主要是對每位醫生的介紹,對文本信息進行分詞處理,分為r個不同的單詞,則文本信息為r維變量。 如果該醫生的介紹中有向量各維度中的單詞,則該項維度值為單詞出現的次數;如果單詞沒有出現,則維度值為0。

通過以上3 項處理,每位醫生的向量維度數m為:位醫生的特征向量可以用n×m矩陣X表示,X=[x1;x2;…;xn]T;標簽向量用n×d矩陣Y表示,Y=[y1;y2;…;yn]T。

1.2 奇異值分解算法

對于矩陣M,使用奇異值分解算法M=UΣ VT將其分解為3 個矩陣,其中U和V均為正交矩陣,Σ為對角矩陣。 如果將M作為物品的評分矩陣,則Σ VT表示將該物品映射到媒介空間[3]。

純粹的奇異值分解算法中,U、Σ和V分別為矩陣,M為m×n矩陣,秩的數值為。 將Σ中各值取最大的k個數值保留,得到矩陣,此時M的近似值為

對于Σ取k個最大值,實現了兩個目的,一是使向量的維度減少,而且使模型存儲所需空間減少;二是將數值較小的奇異值去除,消除了影響小的因素,只保留了具有最強影響的因素,使推薦效果更加理想[4]。

奇異值分解法不僅能夠預測,而且能夠形成客戶或物品的鄰近點。 使用奇異值分解對客戶- 物品的評分矩陣R分解,分別得到矩陣U和矩陣V,其中矩陣U每行代表客戶的特征向量,能用來計算客戶間的相似度;矩陣V每行代表物品的特征向量,能用來計算物品間的相似度[5]。

2 基于標簽預測和奇異值分解的醫生推薦系統設計思路

醫生推薦系統由信息采集、信息管理和信息推薦三部分組成,系統結構如圖1 所示。 首先,從權威網站上獲取醫療信息數據,其次,對其進行去噪、抽取,將有用信息保存在數據庫,根據患者需要為其進行醫生推薦服務。

圖1 醫生推薦系統結構圖Fig. 1 Structure diagram of doctor recommendation system

2.1 信息采集模塊

醫生推薦系統結構中,信息采集模塊的作用是從網絡上抓取與醫療相關的數據信息,核心是網絡爬蟲系統。 網絡上的醫療信息資源多種多樣,各政府公開網站、醫院官網、專業醫療信息網站等眾多的醫療數據信息。 為了提高數據信息的抓取速度,需要建立分布式網絡爬蟲,使多臺計算機能共同合作。

2.2 信息管理模塊

信息管理模塊是將網絡爬蟲系統從網絡上抓取到的信息和第三方數據進行處理,存入數據庫。 信息管理模塊主要承擔的任務:一是對抓取到的原始數據信息進行去噪處理;二是去除待存數據信息中的重復數據,并進行匹配;三是從需要存儲的數據信息中發掘有價值的信息數據,如從與該醫生進行論文合作的其他醫生的信息中發掘與該醫生專業相關的學術信息。

2.3 信息推薦模塊

信息推薦模塊為患者推薦合適的醫生。 該模塊主要承擔的工作任務:一是對標簽預測模型進行訓練,二是根據訓練模型對數據庫中醫生擅長治療的疾病和對醫生的評價進行標簽預測,三是根據患者的需要為其推薦合適的醫生。

3 基于標簽預測和奇異值分解的醫生推薦系統的實現

3.1 信息采集系統實現

(1)信息搜索策略。 網絡爬蟲在進行內容抓取前,需要前端數據機構提供一個URL 集合,該集合可以基于網絡重要性或其他結構特征選取,也可以人工選擇;網絡爬蟲開始抓取該URL 集合指向的網頁,并通過新的網頁提取新的URL,直至沒有新的網頁需要抓取。 在網絡抓取時,采用廣度優先策略,按照網頁發現先后順序進行抓取。

(2)信息采集實現。 網絡爬蟲由三部分組成:一是爬蟲客戶端,用來接收來自爬蟲服務器的下載要求,并對需要下載的網頁頁面發送HTTP 請求,在響應完成后,將結果反饋給爬蟲服務器;二是爬蟲控制器,用來從服務器接受抓取數據,并在本地進行保存,同時從網頁中提取URL 地址,并將沒有抓取的URL 封裝為HTTP 請求,并將其返回到服務器。 三是爬蟲服務器,從爬蟲控制器接收下載請求,并對相應客戶端進行下載分配,將下載的結果反饋給爬蟲控制器。 爬蟲服務器具有兩種隊列,一是請求隊列,對待下載的HTTP 請求信息進行記錄;二是響應隊列,對獲得響應的信息進行記錄。 網絡爬蟲系統結構如圖2 所示。

圖2 網絡爬蟲系統結構Fig. 2 Network crawler system structure

3.2 信息管理系統實現

信息管理系統的工作:將從各數據源獲取的數據信息通過數據處理模塊進行切分、過濾、校驗和補全等處理,最終將處理后的信息存儲到相互關聯的數據表中,并在后臺對信息進行處理。

(1)數據庫存儲。 數據存儲在數量眾多、相互關聯的信息表中,各信息表之間關系復雜。 數據庫中存儲的醫生信息主要內容由4 部分組成,見表1。

表1 數據庫存儲醫生信息主要內容Tab. 1 The main content of doctor information stored in the database

通過對信息的分析,系統獲取更加深入的信息,如醫生的學術圈子、綜合能力和醫院的專長等信息。

在存儲過程中,實現應用程序與系統之間的聯系。 使用存儲過程能夠使編程的復雜程度降低,因為存儲表數量眾多且關系復雜,對一個存儲表進行修改會對其他存儲表帶來影響,使用存儲過程使程序和數據庫之間的聯系簡化;提升數據的安全性,通過存儲過程中程序和數據庫的交互,使數據庫中的信息不必直接暴露在程序中,減少了惡意程序對信息的破壞;縮短程序和數據庫開發周期,使用存儲過程能夠將程序和數據庫存儲分離,能夠同時對兩者進行開發,縮短開發周期。

(2)數據管理。 系統讀取數據后,對數據進行切分、過濾、校驗和補全等操作后存儲。 在數據錄入時會出現多種名稱代表同一醫院問題,需要人工進行干預,進行數據匹配和清洗;在存儲過程中,需要將每項數據寫入操作日志,對數據的操作進行分析,并將有錯誤的數據及出現錯誤的原因寫入錯誤日志中,管理人員可通過錯誤信息進行特殊處理并將該類信息重新存儲。

(3)自定義模板和插件。 模板為XML 文件,其中包含讀取字段、讀入接口和執行插件等內容,在管理人員錄入新信息時,首先會讀取模板信息,選擇與信息的格式相應的模板即可完成信息錄入工作。 在將信息讀入內存之后,為使信息符合數據庫存儲要求,需使用插件對信息進行處理。 管理人員通過系統的插件接口,編寫插件程序,完成讀入內存后信息的處理工作。

(4)信息后臺處理。 后臺管理可以根據醫院、醫生名字或其他關鍵字搜索,找到符合條件的醫生的基本資料、學術論文發表以及學術圈子信息。 醫生的基本資料包括年齡、工作醫院及科室、擅長治療疾病等信息;學術論文發表能夠展示學術論文發表的趨勢,并對各學術論文詳細介紹。 信息管理系統根據醫生學術論文找出與其合作的其他醫生信息,并對醫生的學術圈子進行總結,對醫生的業務能力進行綜合判斷。

3.3 信息推薦系統

信息推薦系統使用標簽預測和奇異值分解算法,對醫生擅長治療的疾病進行預測,并進行綜合評分和排序。 信息推薦系統主要是由模型訓練、存儲和推薦三部分組成,其主要步驟包括模型訓練和存儲、信息補全和預測、推薦和排序。 信息推薦系統首先使用奇異值分解算法進行標簽預測模型訓練;其次,使用標簽預測模型對醫生信息進行預測和補全;最后,信息推薦系統根據患者的需要進行醫生推薦,并按照推薦值順序顯示。 信息推薦系統結構如圖3所示。

圖3 信息推薦系統結構Fig. 3 Information recommendation system structure

離線進行標簽預測模型訓練和存儲的原因主要是奇異值分解算法所需時間較長,在大量信息需要更新時才進行模型訓練工作;其次,在訓練模型時,需要人為的參與調整。 在模型訓練后以二進制形式存儲,在需要時從文件中進行讀取即可。

4 結束語

本文提出的基于標簽預測和奇異值分解的醫生推薦系統,能夠實現患者在就醫時尋找所需醫生的目的,解決就醫時選擇合適醫生的問題,對于患者和醫生都起到非常重要的作用。 醫生推薦系統是一項持續改進的工程,未來還需要在算法和排序等方面進行更加深入的改進,使其在現實就醫過程中發揮出更大的作用和效果。

猜你喜歡
數據庫信息系統
Smartflower POP 一體式光伏系統
工業設計(2022年8期)2022-09-09 07:43:20
WJ-700無人機系統
ZC系列無人機遙感系統
北京測繪(2020年12期)2020-12-29 01:33:58
連通與提升系統的最后一塊拼圖 Audiolab 傲立 M-DAC mini
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
數據庫
財經(2017年2期)2017-03-10 14:35:35
數據庫
財經(2016年15期)2016-06-03 07:38:02
數據庫
財經(2016年3期)2016-03-07 07:44:46
數據庫
財經(2016年6期)2016-02-24 07:41:51
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
主站蜘蛛池模板: 久久99蜜桃精品久久久久小说| 免费一看一级毛片| 999福利激情视频| 国产剧情国内精品原创| 欧美精品一二三区| 国产亚洲欧美在线中文bt天堂| 三级毛片在线播放| 99re66精品视频在线观看| 性做久久久久久久免费看| 久久a级片| 亚洲黄网视频| a在线亚洲男人的天堂试看| 亚洲国语自产一区第二页| 色哟哟国产精品| 亚亚洲乱码一二三四区| 国产亚洲欧美另类一区二区| 国产成人一区在线播放| 国产在线一二三区| 精品久久777| 在线日韩日本国产亚洲| 色亚洲激情综合精品无码视频| 亚洲区视频在线观看| 综合天天色| 91青青在线视频| 国产精品亚洲综合久久小说| 9啪在线视频| 国产无码网站在线观看| 亚洲天堂网在线视频| 色婷婷久久| 国产男女XX00免费观看| 无码专区国产精品一区| 国产美女在线免费观看| 国产国产人在线成免费视频狼人色| 久久国产高清视频| 国产在线精彩视频二区| 国产乱人伦精品一区二区| 亚洲天堂网视频| 欧美日韩专区| 久久一级电影| 18禁不卡免费网站| 欧美成人第一页| 国产日本一线在线观看免费| 国产无码制服丝袜| 国产亚洲欧美在线视频| 亚洲国产精品成人久久综合影院| 欧美精品v欧洲精品| 亚洲国产精品成人久久综合影院| 久热中文字幕在线观看| 亚洲经典在线中文字幕| a级毛片免费播放| 免费a级毛片18以上观看精品| 制服丝袜一区| 国产精品播放| A级全黄试看30分钟小视频| 日韩欧美国产精品| 国产成人调教在线视频| 亚洲一区免费看| 欧美第九页| 午夜福利视频一区| 九色视频线上播放| 日日拍夜夜操| 亚洲—日韩aV在线| AV不卡无码免费一区二区三区| 一级毛片高清| 99在线免费播放| 久久伊人操| 亚洲AV无码一区二区三区牲色| 国产一区亚洲一区| 亚洲中文字幕无码爆乳| 亚洲h视频在线| 99视频在线看| 在线日本国产成人免费的| 国产一二三区视频| 国产成人精品三级| 亚洲欧美日韩中文字幕在线| 国产伦精品一区二区三区视频优播 | 好紧太爽了视频免费无码| 久久中文电影| 好紧太爽了视频免费无码| 一本久道热中字伊人| 国产视频一区二区在线观看| 午夜福利视频一区|