魏志剛,劉小慶,魏燕飛
(江西省第五人民醫院,江西 南昌 330046)
在互聯網醫院中健康大數據的應用主要表現在在線導診與健康數據監測方面,在實體醫院數據、互聯網數據的基礎上,建立大數據分析計算模型,并與智能設備廠商合作,通過企業的數據分析處理平臺,對智能設備與互聯網數據進行分析,識別患者的需求,為其匹配醫生并提供有效的服務,在健康數據監測的幫助下,為患者提供有針對性的健康解決方案[1]。
通過健康大數據的應用,建立患者電子病歷、健康檔案等數據庫,分析針對慢病患者可能出現的一切危險因素,構建慢病風險評估模型,對危險因素指標進行綜合分析,根據高危人群發病概率的判斷為慢病患者提供幫助,使慢病患者能夠進行自我評估、改善生活方式等,并通過大數據分析技術與設備的使用,對慢病患者的數據進行獲取、跟蹤等,預警慢病患者發病的風險與可能性,開展個性化治療。
健康大數據在輔助診療方面主要表現在智能診斷與疾病預測,在醫院數據知識庫構建的基礎上,與相關的電子病歷、健康檔案數據等相結合,積極引入數據挖掘技術,分析數據中心檢查結果、疾病癥狀與用藥信息的聯系,構建預測疾病系統,對患者進行有效的疾病預測,在醫療數據、圖片與準假標注樣本數據的基礎上,采取技術識別與處理醫學影像。
我國使用的大數據平臺主要是在Hadoop技術的基礎上構建,如圖1所示,包括數據應用層、數據分析層、編程模型層、數據存儲層、數據傳輸層、數據來源層。大數據平臺相關技術主要包括大數據處理技術、存儲技術、分析技術等,可通過批處理技術處理靜態數據,利用流處理技術處理實時數據,混合式處理技術可同時處理兩方面數據,存儲技術是通過分布式文件系統、關系型與非關系型數據庫運行,數據分析技術對數據進行挖掘,再利用語義分析計算模型對數據進行分析與處理[2]。在互聯網醫院中可在大數據平臺上開展在線診療等活動,有利于提升互聯網與實體醫院的診療水平。

圖1 大數據平臺架構
傳統數據庫在傳輸數據的過程中,數據移動次數較多,需經過數據采集、集中存儲、組織數據、取出并分析數據等環節,針對小數據量時易于接受,但當前健康大數據量較多,且互聯網醫院需求較多,因此數據移動成本較高。
傳統數據庫在解決主題變化時需將整個流程進行修改,再重新加載數據,但在此過程中,計算數據與時間成本較高,比較適合數據質量高、主題變化少的數據分析模式,當面臨互聯網醫院中的健康大數據分析時,反應能力不足,且健康大數據應用主題變化較大,數據呈現多樣性。
傳統數據庫的硬件設備對存儲分析環節的要求較高,隨著健康大數據量與設備成本的增長,其分布式存儲計算架構可采用大量高性能的計算機分布式存儲計算集群,成本較低。
通過大數據平臺中數據交換平臺能夠實現數據采集工作,并結合“江西省人口健康信息平臺”“江西省預約掛號平臺”“江西省檢驗檢查平臺”,接入方式較為多元化,按照系統的交換需求與特征進行選擇,數據采集主要分為文檔與中間庫兩種。第一,基于文檔的數據采集主要是按照節點規范格式進行,調用Web Service將交換文檔進行上傳,大數據平臺再對文檔格式、信息等進行審核與反饋,此方式具備實時的數據采集特征,可擴展性較強,維護成本低,但若采集數據內容較多,將會為交換服務器帶來影響。上傳方式主要分為接入節點上傳文檔、上傳文檔庫中數據與數據轉換文檔格式上傳,包括PDF、XML等任何格式的文檔。第二,基于中間庫的數據采集是將中間庫作為介入節點的交換環節,其安全性、數據傳輸效率與實時性較強,工作量較少,流程簡單。
數據整合主要包括數據預處理與存儲兩種操作。第一,數據預處理是對健康大數據的元數據進行分析與預處理操作。首先要進行數據清洗,對缺失的數據值與噪聲數據進行填充與處理。其次利用數據集成整合多個數據源,對其進行抽取緩存、轉換與分析等,完成相對應的數據集成轉換工作,另外利用數據規約,在壓縮數據集的同時保持數據完整性,主要包括數量規約、數據壓縮與維規約三類;最后進行數據變化,利用數據規范化、數據聚集、屬性構造與離散化等形式,消除原始數據在類型與格式方面的差異性。第二,數據存儲,傳統數據庫的存儲模式不足,因此采取底層文件系統、HDFS接口與外部調用,能夠有效存儲數據集。在數據清洗的過程中,主要針對檢查與檢驗項目,分析其患者,在此過程中要將類似結構進行區分,明確檢查檢驗項目。
數據分析環節主要包括數據分析與數據計算,在分析過程中采取查詢醫療數據集SQL方式與挖掘分析醫療數據集方式,如Pig分析方式與分類挖掘等。數據計算主要是采取分布式計算方式計算健康大數據,提升計算效率。在數據分析過程中主要以治療方案為例,通過互聯網醫院系統整合患者醫療數據,建立治療分析與患者診斷、檢查等方面的統計模型,指導醫生根據此決定治療方案,將患者特征輸入模型中,與數據進行比對與分析,如圖2所示。具體數據分析過程包括患者分類與確定治療方案,在患者分類環節可通過層次聚類分析法分類,主要分為大部分治療、前期治療、后期治療均在本醫院進行與其他類別,再根據K均值聚類法進行聚類,比較利差平方和,根據患者不同特征制定治療方案。在此過程中,數據分析應用能夠利用數據挖掘方法有效分析健康發數據在互聯網醫院中數據的規律,起到輔助治療的作用。通過IDMapping、數據清洗,標簽建模等大數據技術,為患者建立一份完整的電子病歷健康檔案,解決患者描述不清病史,醫師無法準確掌握患者病情的情況。

圖2 治療方案選擇數據分析模型
數據應用主要通過人機交互接口對數據分析結果進行應用,例如,互聯網醫院中可通過數據分析的可視化結果查閱數據的統計分析結果,醫生可通過輸入患者數據方式對比最優治療方案的分析結果,選擇符合患者需求方案。以上通過對患者診斷、用藥、檢驗檢查等數據,結合物聯網監測跟蹤患者情況,進行大數據分析,實現智能干預,加大患者依從性的AI慢病管理。
互聯網醫院的具體業務流程設計患者、醫生、醫院等多方參與,形成完整的診療過程。首先患者可通過互聯網醫院平臺、App等方式進行注冊并登錄,填寫基本信息進行掛號或者預約掛號,掛號時要填寫就診人的姓名、身份證、具體病情等內容,支付成功后等待醫生進行問診,可采取文字、語音、圖片等方式與醫生溝通,還可為醫生發送檢查結果,溝通后患者可根據醫生給出的診斷建議評價醫院服務的滿意度。醫生在問診后要建立患者健康檔案,通過ID-Mapping、數據清洗、標簽建模等技術建立健康檔案,并通過AI導診的方式為患者智能化分配醫生,對就診全過程進行監測。醫生還需寫處方,主要內容為檢驗檢查、診斷信息、醫囑等,問診后發送給患者,患者可根據處方購買藥品,或者到實體醫院進行檢查等。就診過程中的記錄、視頻錄像以及電子處方都會被保存,形成云病歷,保存在醫院中,以便在下次就診時協助醫生進行診治。
互聯網醫院系統架構分為五個層次。第一層為基礎服務層,可通過網絡與計算機設施集成醫院系統軟件,建設網絡系統與多媒體設備等,可為互聯網醫院的數據采集、處理、存儲與挖掘奠定基礎,通過多源異構數據的集成與融合開發新型數據庫系統,存儲健康數據。第二層為數據服務層,將健康數據分為線上與線下數據,通過數據交換實現數據共享,利用Hadoop并行計算模式,堅持“先分后和”的原則,對海量數據進行計算與處理,收集醫療數據后對其進行預處理、存儲與挖掘,在互聯網醫院實踐過程中應用數據,提升醫療的精準性,實現結構化存儲的數據管理服務,對線上數據進行分類,可利用檢查數據庫模式開展,進行數據的結構化存儲,實現醫療資源的共享。第三層為公共服務層,通過建設基礎層實現對業務數據服務、數據管理服務等服務的組件化,整合與管理相關應用組建,充分發揮功能模塊的作用。第四層為業務應用層,將互聯網醫院系統分為圖文資源、視頻問診、電子處方等多個應用體系,還可根據實體醫院管理模式設置實體醫院中的檢驗流程、建檔流程等應用體系。第五層為展現層,通過醫院官方設置互聯網醫院App、微信等方式,為患者提供多元化的醫療服務。
在健康大數據背景下,可通過互聯網醫院對實體醫院的醫療業務與患者進行分流,進而提升醫療能力。在我院實踐互聯網醫院后,已經開通了多門科室的線上問診,并成立互聯網醫院診間,實現對互聯網醫院的規范運營管理,引導患者進行就診,并加強培訓醫生的力度,在重點科室中實現一對一線上問診,線上問診人數呈增長趨勢。
綜上所述,通過對患者就診全過程監測,對健康數據進行專業化處理,助力醫院管理及運營決策。為了滿足社會的發展,通過互聯網優化醫院的就醫與診療流程,實現資源的合理配置,提升醫院的服務質量,利用大數據技術改善患者的就診體驗,為患者提供更便捷的醫療服務。■