陸曉野 吳年利


摘要:針對醫務人員煩瑣的電子病歷錄入的問題,研究與設計基于數據挖掘方法的智能語音錄入電子病歷系統,幫助醫務人員從煩瑣的電子病歷錄入工作中解脫出來,推動醫學的創新發展。通過語音識別軟件,將語音輸入的電子病歷信息轉換成文本,再基于病歷挖掘算法從文本中挖掘出關鍵的病歷信息,并對接傳輸到電子病歷系統對應的表單項目,實現智能匹配錄入功能,為醫務人員極大地減輕電子病歷錄入的負擔,促進醫學信息化的發展。
關鍵詞:電子病歷;語音識別技術;數據挖掘;索引目錄
中圖分類號:TP302.1? ? ? 文獻標識碼:A
文章編號:1009-3044(2022)27-0029-04
開放科學(資源服務)標識碼(OSID):
1 引言
2010年2月22日發布的《電子病歷基本規范(試行)》明確指出:電子病歷是指醫務人員在醫療活動過程中,使用醫療機構信息系統生成的文字、符號、圖表、圖形、數據、影像等數字化信息,并能實現存儲、管理、傳輸和重現的醫療記錄,是病歷的一種記錄形式[1]。電子病歷,亦稱為電子健康記錄,指將病患的病例等資料通過相應的儀器設備傳輸至計算機中,并對病患的相關信息進行數據處理[2]。電子病歷作為一種電子信息載體,其主要作用在于將病患診斷信息記錄過程數字化,實現醫務人員對病患信息進行采集、加工、傳輸、服務等,是醫務人員為患者開展臨床診斷及治療的基本資料[3]。
目前,我國電子病歷的應用幾乎覆蓋醫院的各個部門,包括門急診、住院、檢查、檢驗、手術、放射等各個環節,涉及治療、手術、藥品等各科室醫療信息的傳遞與匯總[4]。電子病歷已成為醫院信息化建設的核心內容,能夠減輕醫務人員的工作負擔,規范醫生的診療行為,提高工作效率,并為臨床研究、遠程醫學、全民醫療等提供服務[5]。因此,加快推動我國電子病歷應用的相關研究,是醫學發展的需要,也是構建新型醫療服務體系的需要。
我國大部分醫院所使用的醫院信息管理系統(HIS)為醫務人員提供的電子病歷編輯系統僅僅是一個模板化的編輯器,醫生需要花大量的時間和精力整理病人的主訴、病人家屬的輔助說明、每天的查房情況、結論和醫囑等信息,手動整理病歷信息極大消耗醫務人員寶貴的時間和精力[6]。因此,有效提高病歷信息的輸入速度,省去醫生手動輸入病歷信息的煩瑣過程,是當下亟須研究和探討的問題,將語音識別技術與數據挖掘方法相結合,探討如何實現智能語音錄入電子病歷系統的路徑。
2 語音識別技術應用于電子病歷的研究現狀
將語音識別技術應用于電子病歷系統正逐步成為醫療信息領域研究的熱點,例如計算機輔助醫學聽寫、口述病歷語音識別、電子病歷系統的語音檢索等。在電子病歷系統中,語音識別技術的應用可以有效提高病歷文本錄入速度,省去醫生手動錄入病歷的煩瑣過程,讓醫生能將更多的精力放在為患者制定科學的治療方案上。
張瓊瑤[7]等在門診電子病歷系統中開展智能語音技術的深度應用,搭建智能語音云平臺,構建大規模醫學知識圖譜與語音服務引擎,結果顯示智能語音技術在醫療領域有較好的應用前景,能夠提供便捷、實用高效的應用服務,輔助臨床醫療工作,提高診療效率。張海波[8]等探索語音識別技術在醫院臨床的應用與發展前景,在醫院搭建科大訊飛語音識別私有云,并在醫院所有老年科計算機終端配置訊飛語音輸入客戶端,研究與分析語音識別情況,結果顯示語音識別技術在一定程度上可以提高臨床工作效率,降低工作強度。
徐璐[9]等將語音識別技術應用于口腔科電子病歷系統,基于海量醫學文本數據及醫學音頻數據,開發多模態智能語音口腔電子病歷系統,有效減輕醫生工作強度,提升工作效率,提高病歷書寫質量。丁中正[10]等針對醫務人員書寫病歷文書的難點,建設醫療智能語音識別系統,提升語音識別率,有效提升工作效率,減少醫務人員書寫病歷的時間。徐冬[11]等開展基于語音云的電子病歷研究與實踐,探索研究中文語音識別技術在臨床電子病歷整合與集成的最佳應用實踐,實踐表明,通過語音錄入病歷,平均每百字的病歷錄入時間比原來節省50%;通過后期識別模型持續優化,在識別率達到85%左右時,醫生錄入病歷的時間會節約60%以上。
3 數據挖掘方法應用于電子病歷的研究現狀
數據挖掘,是指從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數據中, 挖掘出隱含在其中人們事先不知道的、但又是潛在有用的信息和知識的過程[12]。數據挖掘方法的文本識別算法是從大量非結構化的數據中提煉出有用的信息和知識的半自動化處理過程[13]。
張海陽[12]等探討人工神經網絡算法在電子病歷中的應用,基于人工神經網絡算法研究導致糖尿病患者過早死亡的獨立風險因素。唐海英[14]等開展基于數據挖掘技術的電子病歷的研究與設計,基于數據挖掘方法對檢查報告、病情、病人的綜合情況、藥物信息進行綜合分析和最佳匹配,幫助病人高效就醫,提高醫生診斷的精準率和效率。李照東[15]等開展基于關聯規則的電子病歷數據挖掘應用研究,以糖尿病及其并發癥相關的電子病歷數據作為研究對象,利用關聯規則算法對相關的病癥和特征進行深入的分析研究,為醫生診斷病情提供建議。
童剛[16]等開展腫瘤電子病歷數據挖掘技術的應用研究,研究腫瘤電子病歷的中文分詞及分類挖掘算法的選取,實驗結果表明C4.5算法更有利于輔助醫生進行腫瘤疾病診斷,提高疾病診斷的精準率。葛臻曉[17]研究電子病歷數據挖掘的急性冠脈綜合征風險評估方法,提出基于對抗網絡的急性冠脈綜合征患者主要不良事件預測方法,為急性冠脈綜合征風險評估的研究提供新的思路和技術手段。陳靜鋒[18]開展基于電子病歷的典型診療模式挖掘方法研究,從電子病歷數據出發,針對患者入院信息,研究典型診斷模式挖掘方法,同時針對患者醫囑信息,研究典型用藥序列、典型用藥時間與融合多視角信息的典型治療模式挖掘方法,促進臨床診療業務流程的標準化。
4 電子病歷系統的應用現狀分析
目前,我國三甲醫院的信息化水平普遍比較高,電子病歷系統已被應用于臨床一線多年,運行比較穩定和成熟,對于不同的臨床應用場景,都有對應的規范化病歷模板,但是每種病歷模板的表單項目繁多,如果一項一項核對錄入,既費時又費力,且容易填錯表單項目。美國醫學會(AMA)的統計數據表明[19],病歷及與之相關的文案書寫占據醫生所有工作時間的15%~20%,對于實習期的醫生這一數字更是高達30%。據調查,目前部分三甲醫院的電子病歷系統已具有語音錄入功能,但是功能比較單一,應用層次較低,面對項目繁多的病歷表單,需要人工一項一項定位光標到相應的項目,才能語音錄入,沒有達到智能化錄入的程度,應用效率不高。
在當前已有的研究和應用中,將語音識別技術應用于電子病歷的相關研究,僅局限于將語音轉換成文本的應用,沒有涉及從文本中挖掘關鍵病歷信息與電子病歷系統對接的研究。在數據挖掘方法應用于電子病歷的研究方面,主要集中在利用數據挖掘方法在電子病歷中挖掘出有價值的信息,沒有關于在語音錄入電子病歷方面應用數據挖掘方法的研究。因此,針對智能化水平欠缺的問題,利用數據挖掘方法的文本識別算法,研究適用于挖掘關鍵病歷信息的病歷挖掘算法,從語音錄入的文本中挖掘出關鍵病歷信息,與電子病歷系統對接,實現智能語音錄入,旨在幫助醫務人員解決煩瑣的病歷錄入問題,提高臨床的智能化水平。該研究與設計基于數據挖掘方法的智能語音錄入電子病歷系統,具有現實的研究意義和研究價值,為相似領域的研究提供參考。
5 系統總體架構
基于數據挖掘智能語音錄入電子病歷系統的總體架構,主要包括如下幾個模塊,各個模塊之間的關系,如圖1所示。
1)語音識別軟件。負責將醫務人員語音輸入的病歷信息轉換成文本的形式,以供病歷挖掘算法從文本中挖掘出關鍵的病歷信息。
2)索引目錄。索引目錄主要包括所有電子病歷模板的表單項目的關鍵詞,每一項表單項目都對應有相應的關鍵詞,關鍵詞通常是某項病人指標的名稱、簡稱、習慣用語等。在索引目錄中,可以查詢到每一個電子病歷模板的每一項表單項目的關鍵詞,索引目錄是表單項目關鍵詞的全集。
3)病歷挖掘算法。利用數據挖掘方法的文本識別算法,并結合當前電子病歷模板的表單項目的索引目錄(即:關鍵詞),有針對性地從文本形式的病歷信息中挖掘出當前電子病歷模板所需要的關鍵病歷信息。
4)電子病歷系統。依托附屬醫院當前正在使用的電子病歷系統,搜集所有的電子病歷模板,了解電子病歷系統信息傳送和存儲的運行機制。
5)中間對接軟件。中間對接軟件在語音識別軟件、病歷挖掘算法、電子病歷系統之間起到中介橋梁的作用,主要負責接收并轉發信息。首先接收來自語音識別軟件的文本病歷信息,并轉發給病歷挖掘算法;然后再接收來自病歷挖掘算法的關鍵病歷信息,并轉發給電子病歷系統。
6)軟件集成。將索引目錄、病歷挖掘算法、語音識別軟件、中間對接軟件進行集成,構成基于數據挖掘方法的智能語音錄入電子病歷系統。
6 系統方案設計
6.1 語音識別軟件
購買語音識別軟件的使用授權,熟悉語音識別軟件包提供的軟件開發調用接口,掌握相應的調用方法。
6.2 索引目錄
根據醫院的組織架構,構建完善的電子病歷模板的表單項目的索引目錄。如圖2所示,整個醫院采用兩級索引目錄進行管理,醫院往下直接到各個科室,各個科室對應一級索引目錄,而每個科室又有多種電子病歷模板,因此每個科室的各種電子病歷模板對應二級索引目錄,使得每個電子病歷模板都有對應的索引目錄,以實現索引目錄全覆蓋醫院的各種電子病歷模板,且方便管理和使用。
根據醫院電子病歷系統中的各種電子病歷模板,整理和匯總各種電子病歷模板所包含的病歷信息項目,即針對每個電子病歷模板,編制對應的二級索引目錄,要求二級索引目錄包含該電子病歷模板所有的表單項目,并按照二級索引目錄進行編號。
每個二級索引目錄是一張包含兩列內容的二維列表,一列是對應電子病歷模板的表單項目名稱,另一列是關于描述表單項目名稱的常用關鍵詞,關鍵詞包括醫學的官方名稱、簡稱、醫務人員的習慣用語等,通過簡稱或習慣用語,也能夠使挖掘出的關鍵病歷信息與電子病歷系統的表單項目實現一一匹配,為醫務人員提供便利。關鍵詞,如:心率、心跳、血氧、血壓、體溫等詞語。
6.3 病歷挖掘算法
根據數據挖掘方法的文本識別算法,研究設計適用于挖掘關鍵病歷信息的病歷挖掘算法。該算法最大的特點在于根據關鍵詞從文本中提取有效的病歷信息,因此該算法也可稱為基于特征信息的文本提取算法,即基于關鍵詞,有針對性地從病歷信息的文本中提取關鍵病歷信息的算法。基于此,要求醫務人員語音錄入電子病歷信息的方式是先說出關鍵詞,再說出對應的病歷信息,比如:“心率80”“血氧96”等。編制有電子病歷模板的二級索引目錄,相當于為該算法提供了電子病歷模板的表單項目的所有關鍵詞,使得該算法的設計與實現更具體、更有針對性。
病歷挖掘算法的工作原理和工作過程如下,醫務人員在錄入電子病歷信息時,先點擊到相應的電子病歷模板的錄入界面,也稱為電子病歷模板的表單界面,進入到錄入界面后,病歷挖掘算法根據對應的二級索引目錄,獲取該表單界面的所有關鍵詞;然后,病歷挖掘算法根據所獲取的關鍵詞從醫務人員語音錄入的病歷信息中提取關鍵的病歷信息;最后,把關鍵詞以及對應的關鍵病歷信息轉發給中間對接軟件,中間對接軟件根據關鍵詞與電子病歷系統的表單項目進行一一匹配對接,把對應的關鍵病歷信息傳輸到相應的表單項目,不需要鼠標煩瑣地一一點擊到每個對應的表單項目,從而實現智能化錄入。
醫務人員在語音錄入電子病歷的同時,檢查表單項目的錄入情況,如有遺漏或者錄入錯誤的表單項目,可以再次語音錄入,以此對表單項目進行補錄或者修正。
6.4 中間對接軟件
中間對接軟件的關鍵技術是將挖掘出的關鍵病歷信息與電子病歷系統的表單項目進行智能匹配對接,主要通過每個電子病歷模板所對應的二級索引目錄的關鍵詞來實現。根據語音識別軟件包提供的軟件開發調用接口、電子病歷系統接收數據的對外接口以及病歷挖掘算法的工作原理,研究設計中間對接軟件。
中間對接軟件主要負責接收數據和轉發數據,起到中介橋梁的作用。首先負責接收來自語音識別軟件的文本信息,并把文本信息轉發給病歷挖掘算法;然后病歷挖掘算法從文本信息中挖掘出關鍵病歷信息并轉回給中間對接軟件;最后中間對接軟件與電子病歷系統對接,將挖掘出的關鍵病歷信息與電子病歷系統的表單項目一一匹配傳輸,實現病歷信息的智能語音錄入功能。
6.5 系統集成與部署
將語音識別軟件、病歷挖掘算法和中間對接軟件進行軟件集成,打包成插件,通過在電子病歷系統中安裝插件的方式,實現軟件的部署,構成基于數據挖掘方法的智能語音錄入電子病歷系統。
6.6 病人隱私問題
該研究設計僅僅是輔助醫務人員快速、高效、智能地完成電子病歷信息的錄入,只停留在轉發病歷信息的層面,并沒有建設專門的數據庫來保存相關的病歷信息。因此,在完成智能錄入病歷信息之后,該研究設計的插件沒有保存病人的信息,不涉及病人隱私泄露的問題,較好規避病人隱私泄露的風險,因此該研究設計是安全的、可行的。
7 結束語
致力于研究與設計基于數據挖掘方法的智能語音錄入電子病歷系統,將語音識別技術與數據挖掘方法應用于電子病歷系統,實現智能化語音錄入電子病歷的功能,提高臨床電子病歷錄入的智能化水平。其中,病歷挖掘算法依賴于電子病歷模板的二級索引目錄(即關鍵詞)來設計與實現,使病歷挖掘算法更有針對性地挖掘關鍵的病歷信息,算法的設計與實現更加容易和具體,準確率更高。后續將繼續優化與改進病歷挖掘算法,進一步提高算法的準確率和穩定性,使得病歷挖掘算法更加適用于智能語音錄入電子病歷系統。
參考文獻:
[1] 朱妍昕,徐維.我國電子病歷定義定位研究[J].醫學信息學雜志,2015,36(6):2-6.
[2] 潘麗.醫院電子病歷管理系統的探討[J].數字技術與應用,2019,37(3):215-216.
[3] 宋華剛.醫院電子病歷管理系統研究[J].電子元器件與信息技術,2020,4(8):130-131,133.
[4] 毛戈,李晶,姚弘毅.基于智慧醫院的電子病歷應用和設計[J].湖北大學學報(自然科學版),2021,43(6):706-712.
[5] Richards R J,Prybutok V R,Ryan S D.Electronic medical records:tools for competitive advantage[J].International Journal of Quality and Service Sciences,2012,4(2):120-136.
[6] 李團輝.基于語音識別的電子病歷輔助編輯系統設計與實現[D].長沙:湖南大學,2017:1-76.
[7] 張瓊瑤,王晟,陳禮團.智能語音技術在門診電子病歷中的應用實踐[J].中國數字醫學,2021,16(8):12-16.
[8] 張海波,周民偉,劉曉輝,等.智能語音識別技術在醫院臨床的探索與應用[J].中國衛生信息管理雜志,2017,14(5):660-663.
[9] 徐璐,趙從樸,朱雯,等.智能語音口腔電子病歷系統的探索與實踐[J].中國衛生信息管理雜志,2022,19(1):121-125.
[10] 丁中正,常翀,曹凱迪,等.醫療智能語音識別系統的建設與應用[J].電子技術與軟件工程,2022(1):188-191.
[11] 徐冬,陶石,劉雨生.基于語音云的電子病歷研究與實踐[J].中國數字醫學,2012,7(3):15-18.
[12] 張海陽,毛健.BP神經網絡的電子病歷數據挖掘研究[J].電腦知識與技術,2018,14(21):224-225.
[13] 鄭麗青,張育嘉,彭劍橋.數據挖掘在支氣管炎電子病歷中的應用研究[J].數字技術與應用,2019,37(5):55-56,58.
[14] 唐海英,王體春,吳婧,等.基于數據挖掘技術的電子病歷的研究與設計[J].現代信息科技,2019,3(8):106-108.
[15] 李照東,吳建林.基于關聯規則的電子病歷數據挖掘應用研究[J].江蘇科技信息,2018,35(8):56-59.
[16] 童剛,姜寧,劉煥.腫瘤電子病歷數據挖掘技術的應用研究[J].計算機技術與發展,2020,30(8):152-156.
[17] 葛臻曉.基于電子病歷數據挖掘的急性冠脈綜合征風險評估方法研究[D].杭州:浙江大學,2020.
[18] 陳靜鋒.基于電子病歷的典型診療模式挖掘方法研究[D].大連:大連理工大學,2019.
[19] 卞德忠.基于關鍵詞自動提取的口述病歷識別系統設計與實現[D].武漢:武漢理工大學,2016:1-90.
【通聯編輯:謝媛媛】