于茵茵 王旭東

摘 要:當前,人工智能與云計算不斷發展,應用日益普及,為語音技術在醫療領域的應用提供了契機。本文分析了智能語音技術發展現狀與關鍵技術,結合醫院口腔門診業務發展情況,以解決門診口腔業務中的信息化問題為導向,探索語音識別技術在口腔門診病歷系統中的應用。
關鍵詞:人工智能;語音識別;云計算;語音知識庫;口腔電子病歷
中圖分類號:TR197.324;TN912.34 文獻標識碼:A 文章編號:1003-5168(2019)23-0036-03
Application of Speech Recognition Technology in Oral
Outpatient Medical Record System
YU Yinyin WANG Xudong
(Henan General Hospital,Zhengzhou Henan 450002)
Abstract: At present, artificial intelligence and cloud computing are developing continuously, and their applications are becoming more and more popular, which provides an opportunity for the application of voice technology in the medical field. This paper analyzed the development status and key technologies of intelligent voice technology, and combined the development of hospital oral clinic business, which aimed to solve the informationization problem in the outpatient oral business and explored the application of speech recognition technology in the oral clinic medical record system.
Keywords: artificial intelligence;speech recognition;cloud computing;speech knowledge base;oral electronic medical record
近幾年來,國家及各省市出臺一系列政策,推動我國醫療人工智能領域快速發展。2017年12月,工業和信息化部印發《促進新一代人工智能產生發展三年行動計劃(2018—2020年)》,對人工智能在三年中的發展重點及目標進行了詳細規劃。2018年7月,河南省衛生信息學會、河南省衛健委統計信息中心發布了《河南省數字化醫院建設指南》,關于人工智能語音功能,要求提供一種方便快捷的輔助錄入方式,醫生通過口述患者病情,系統自動將語音轉成文字,有效地提高病歷書寫效率。
受政策推動與科技發展的影響,云計算、人工智能、大數據等技術廣泛應用于醫療診斷[1]、醫療影像分析、健康評估管理與風險測試、醫院管理、新藥研發、智能語音錄入等醫療領域。
美國臨床信息學專家Clement Mcdonald統計發現,醫生平均每天需要消耗48min在電子病歷書寫上。香港德信研究表明[2],50%以上駐院醫生平均每天用在電子病歷書寫上的時間超過4h。值得一提的是,口腔科醫生的檢查和診療過程不同于內科醫生,在檢查和治療的過程中,其雙手被器械占用。關于病歷中的部分關鍵信息,口腔科醫生往往需要在治療結束后憑借記憶記錄并且反復核對。為了及時、準確記錄口腔患者在就醫過程中的主訴、病史、檢查、診斷和診療過程,提升工作效率,人們要將智能語音技術應用在口腔電子病歷中。
1 智能語音識別技術在國內外醫療領域的應用現狀
在發達國家,智能語音識別在醫療領域已廣泛普及。Nuance公司的語音識別系統為臨床醫生提供語音文件導航服務,醫生利用移動語音識別終端采集信息,通過語音識別、自然語言智能分析技術實現輔助電子系統的輸入;Philips公司通過對麥克風表面的特殊材質處理,構建聲學硬件模塊,實現符合醫療系統的抗病防菌場景要求的實時語音識別;Amazon公司開發語音助手,通過與電子病歷的集成實現高效信息采集;Google公司利用深度學習模式識別技術構建CTC與LAS模型,實現電子健康記錄的語音轉寫。據報道,目前美國72%以上的醫院已經利用語音采集醫療信息,識別率高達99%。
2016年,我國醫療智能語音技術逐步興起并落地實施。科大訊飛公司以語音記錄轉寫及人工智能技術為核心,采用軟、硬件相結合的方式實時記錄就醫過程中醫生與患者的交流過程,即時生成結構化電子病歷;云知聲與飛利浦公司合作,將智能化語音識別引擎與HIS、PACS、CIS等系統對接,實現與醫院信息系統的完美結合;中科匯能采用“醫語通”智能移動語音采集終端,實現多場景語音實時錄入電子病歷中,通過數據分析技術實現智能語音問診、患者類型聚類分析及健康風險預測等;百度將智能語音技術應用于智慧醫療的智能問診環節;阿里健康與浙江大學醫學院附屬第一醫院共建“人工智能實驗室”,通過深度學習實現語音智能識別。
2 關鍵技術
2.1 語音識別處理
語音識別處理是指通過運用語音信息檢測、語音數字化編碼、語音信息特征提取、濾波算法等技術進行樣本信息采集、背景噪音識別、降噪處理[3,4]、語音特征矢量分析,實現自然語言的數字化轉換、識別,其主要以移動的智能語音識別設備為體現形式。
2.2 自主學習語音知識庫的構建
當前,要搭建基于醫療知識庫的智能語音云平臺,以實現精準的智能化語音分析與系統構架信息數據的隱私保護安全。語音庫包括基于基礎自然語音數據、基礎醫學語音數據(如醫療診斷語音庫、醫療手術語音庫、基礎藥品及器械庫語音庫)的靜態語音庫以及基于互聯網技術、機器學習技術的以醫院內部各種專業電子模范化的病歷模板、病程記錄模板、檢查(影像功能檢查)報告模板[5]、數據字典、醫療護理操作流程規模模板、結構化語音數據字典為支撐的自學習動態語音庫。人們要充分利用語音識別與深度網絡學習技術,與醫院HIS、PACS、LIS等信息系統實時對接,實現患者基本信息、醫囑、影像檢查結果的語音采集以及電子病歷與記錄的自動生成,提高語音庫覆蓋率和醫院個性化語音數據識別率。
2.3 系統構架
通過集成標準的SDK控件,部署醫院私有化語音平臺:根據醫院業務量及系統穩定性需求,選擇2臺或以上X64服務器作為語音識別服務器;利用多處理器的分布式負載均衡技術,提高語音識別服務器的工作效率。
終端可支持手機APP(安卓、IOS)、HTML5(支持HTML5的瀏覽器)和電腦PC端(HTML5),便于擴大受眾面。
由于語音識別和轉換對于CPU和系統的硬件I/O需求很大,一般采用Intel Xoen\AMD EPYC中高端處理器,存儲形式既有企業級硬盤組成的Raid5,也有增加SSD作為二級緩存混合磁盤陣列。
2.4 安全性和隱私保護
系統的安全性不容無視,人們要從多個方面入手,確保信息在傳遞、存儲、分析和輸出的過程中不出現泄露、篡改和丟失的問題。
首先,數據采集的原始數據傳遞成功后,終端執行立即清零的數據操作。在傳輸過程中,要采用流加密和傳輸校驗的方式,防止數據流的篡改,同時減少終端的運算量。對于傳輸校驗不一致的數據,做重發操作或拋棄操作處理。
傳輸操作需要采用多次握手認證加心跳會話的方式,保證數據傳輸的驗證不出現安全問題。同時,多次握手驗證采用RSA不對稱加密算法通信,握手成功后產生token和臨時密鑰,用于數據通信會話處理和數據加密。
語音識別的原始數據需要安全存儲在數據中心,由于語音數據進行文本化識別后需要進行大量的分析和查詢,所以存儲一般采用源數據的方式,便于隨時調取數據。為了保證核心數據安全和存儲安全,機房、網絡和硬件設備采取了多重手段:機房要達到醫療機構B級以上標準,配置防火、放斷電等基礎設施;網絡要求配置防火墻、安全網閘,實現內外網可控的隔離,數據庫操作均采用DAL層進行中間件級封裝,BLL層的通信均采用接口形式,接口使用HTTPS SOAP、HTTPS JSON等;采用至少2臺Raid1級別以上的存儲服務器,操作系統的磁盤分區要求支持動態擴展;服務器之間采用操作系統級的冗余處理;大型項目可采用虛擬化方式,構建業務快速動態遷移的冗余模式,使業務不斷停。
3 智能語音識別技術在口腔電子病歷中的應用
3.1 應用需求分析
隨著人民生活水平的提高、健康意識的增強和口腔教育的普及,口腔就診需求不斷提升。統計數據顯示,目前,我國門診接診量達3億人次,患者數量以每年13%~15%的速度增長,而牙醫缺口較大,具有資質的牙醫數量與患者就診需求數量嚴重失衡,牙醫日接診量逐年攀升。以河南省職工醫院近3年來口腔門診就診患者相關數據為例,利用HIS系統數據庫導出并統計河南省職工醫院2016—2018年口腔科門診各年度的就診量、復診率,相關數據信息對比如表1所示。
從表1可以看出,2018年口腔就診的日接診量較2016年增加了將近100%,相應的醫務人員的門診口腔電子病歷的錄入工作量也提升了近100%,口腔科醫師對電子病歷的智能語音錄入需求顯得更為迫切。數據顯示,智能語音技術應用在門診電子病歷中,對比手工錄入病歷,可以節省80%的錄入時間。
3.2 硬件及技術支撐
3.2.1 硬件支持。在為患者檢查、診療的過程中,手術常處于高噪音的工作環境。診療期間,門診口腔醫師的雙手常佩戴醫用手套,還要保持整個診療工作的移動性,操作電腦極為不便,需要配備降噪性能高且支持WIFI的高質錄音設備,同時不斷增加噪音數據的多場景錄制,進行加噪訓練[6],以確保診療過程中語音記錄并轉寫的質量。
3.2.2 口腔病歷技術支撐。口腔門診診療具有特殊性,例如,口腔正畸治療一般要持續2~3年,從初診到治療結束,需要正畸治療的患者可能要經歷幾十次復診,因此智能語音識別與口腔電子病歷的問診過程需要進行專業設計,確保患者既往病歷無需重復問診。口腔診療過程中的專業詞匯、電子病歷模板尤其是電子病歷模板中專業特殊字符的語音識別與語義轉化也是智能識別的一個難點。人們要將智能語音識別技術與門診口腔病歷對接起來,不斷完善和升級語音口腔領域專業詞匯與語音模板元素。另外,要增加不同方言的識別訓練,增加口語中的容錯機制,通過深度機器學習,不斷提高語音識別效率與準確率。
4 結論
智能語音技術在口腔門診電子病歷中的應用,能有效優化醫患問診溝通模式,使醫師在口腔檢查和診療的過程中解放雙手,提高電子病歷記錄的即時性、準確性,使醫師更好地服務臨床診療,將更多的精力用于整個診療過程中的患者溝通、患者病情的了解以及患者病患的有效治療,進而提升患者滿意度,構建真正以患者為中心的就醫新模式。
參考文獻:
[1]蔣璐伊,王賢吉,金春林.人工智能在醫療領域的應用和準入[J].中國衛生政策研究,2018(11):78-82.
[2]張海波,周民偉,劉曉輝,等.智能語音識別技術在醫院臨床的探索與應用[J].中國衛生信息管理雜志,2017(14):660-663.
[3]張曉丹,黃麗霞,張雪英.關于在噪聲環境下語音識別優化研究[J].計算機仿真,2016(33):172-176.
[4]吳馬軍,俞興莉,陳亮.語音降噪算法的實現研究[J].信息通信,2019(1):72-74.
[5]孫國強,趙從樸,朱雯,等.智能語音識別技術在醫院應用中的探索與實踐[J].中國數字醫學,2016(11):35-37.
[6]肖強,周民偉,張海波,等.語音識別技術在電子病歷中應用的難點及對策[J].中國數字醫學,2018(13):55-56.