◆王煥力
(中國科學技術大學附屬第一醫院信息中心安徽 230000)
《關于加快推進人口健康信息化建設的指導意見》明確要求充分利用物聯網、云計算、大數據等新技術,提升居民健康信息化應用水平[1]。在“互聯網+醫療健康”發展中,第三方支付和互聯網醫院等信息化建設帶來醫療支付交易碎片化、數據大量化、結算賬戶分散化等問題。集團醫院分院區財務各自為政,存在問題被進一步放大,現有財務信息系統已經不能滿足集團醫院經營管理需要[2]。利用大數據技術建立醫療支付統一平臺,集團財務對分院區統籌管理,做好各院區的財務對賬,資金劃撥,提高財務數據透明度、加強財務監管和運行監督、保證資金安全。同時利用大數據研究方法,對醫院財務運行數據做分析、挖掘和利用,有效地服務于集團醫院的經營管理和財務決策,促進醫院發展。
數據作為醫療支付大數據平臺的基礎,為獲取到優質數據,平臺采用了針對性方法進行處理如下:
(1)大量(Volume)的醫療支付數據。平臺對醫院收入數據要求統一編碼規范[3],提供標準的銀行支付、移動支付、醫保支付、資金批量代付等接口,將多個分院區的門診、急診、體檢、住院、餐飲、小賣部、停車繳費等各種場景的支付數據全部納入平臺。對于支出數據,平臺對接院內資金管理系統、銀企直連系統、稽核系統等,最終實現多個分院區的資金收入與支出進行集中和統一管理。
(2)種類和來源多樣(Variety)的醫療支付數據。數據按結構可分為結構化和非結構化方式,其中結構化數據包含充值交易、掛號交易、銀企直連、醫保結算等業務。非結構化數據包括藥品供應商提供的紙質結算單掃描件、銀行現金存款單掃描件等,這些種類和來源多樣的醫療支付數據可使用分布式部署數據庫、陣列式存儲、數據切分、Cassandra(非結構化的非關系型數據庫)等方式進行保存。
(3)真實準確(Veracity)的醫療支付數據。支付成功的訂單記錄交易檢索號或流水號;支付異常訂單可采用自動補償機制或事務方式進行處理,保證交易原子性[4],杜絕單邊賬發生。平臺使用多方對賬模式(包含HIS方、支付渠道方、業務系統方等),平賬后將多院區歸集資金分賬數據發送至資金清算平臺,確保支付數據真實準確。
醫院業務系統數量和種類繁多,例如為患者提供服務的線上就醫系統、互聯網醫院系統、醫院綜合運營管理系統等,這些系統產生大量的數據需清洗后才能使用,處理方式如下:
(1)對數據進行結構化處理。原系統票據數據類型和種類的較多,大部分為紙質結算單、紙質對賬單等,這種非結構化的數據基本需人工處理,無法實現電子化留存,無法用于后期大數據的應用。近幾年深度學習技術的發展,單據識別(Invoice Optical Character Recognition)技術已經逐步普及,通過OCR技術將非結構化數據轉為結構化數據處理,后期快速大數據特征提取及應用。
(2)對數據進行標準化處理。由于各支付渠道無法統一接口規范,導致賬單格式和內容各不相同,部分醫保類型甚至缺少對賬用的明細賬單,平臺無法對這類未清洗的數據進行使用[5]。非標準化數據通過數據文件層、數據提取設置層、數據校驗入庫層后可轉為標準化數據。數據文件層使用系統接口抓取或手工上傳文件的形式獲取到非標數據;數據提取設置層通過可視化頁面,設置數據提取規則,比如可以設置金額+就診號+日期+隨機數四者聯合作為唯一索引;數據校驗入庫層對錯誤的數據進行篩查,如收款交易為負數的數據不能入庫。
以往各分院區財務依據業務場景逐個對結算銀行進行對賬,集團再進行匯總合并核對分院的賬,基礎對賬工作耗時且錯誤率高。通過醫療支付大數據平臺統一支付接口,集團財務無須手動核對分院區賬務,實現結算賬戶的統一管理,跨院區的單邊賬和退費的集中處理。平臺獲取到各分院所有的支付數據后,可實現諸如預交金模式的資金稽核管理,通過患者分院區預交金使用明細規則出具日清分核查報表。
醫療支付大數據平臺涵蓋醫院全場景的收入與支出,數據經過結構化處理與正確性驗證,可直接用于各種維度的統計與分析,解決以往集團對分院區財務資金無法實時應用分析的痛點。
通過支付大數據分析實現財務的精細化管理,例如:
(1)平臺支付數據經標準化入庫后輸出財務標準運營指標,按年計算醫保回款率(實際年度醫保到賬總額/年度醫保支付凈額)。
(2)使用K均值聚類算法(k-means)發現患者在支付環節花費較長時間的共性原因,比如集中在某個科室且支付方式為自助機支付,那么可推測是該科室的自助機擺放位置或者數量需要調整,最終提升患者支付體驗。
(3)還可以根據過往數據做出一些預測,例如根據以往同期商保支付數據預測當期商保預估支付的金額后,醫院可以與商保中心溝通預支預付款,減少資金墊付[6]。
通過機器學習方法對大數據平臺數據進行挖掘,利用預測指導模型對集團財務部門實現指導和決策,具體步驟如下:
(1)確認需要預測的問題和指標。通過大數據預測特定患者存在支付困難,讓醫院管理團隊及早發現并協助患者解決支付問題,用于減少壞賬的發生和增加資金沉淀[7]。
(2)通過對數據特征碼的特征提取和選擇評估,可以獲得一批可以用來預期要解決問題的特征。例如對于存在支付困難度的患者,特征碼可以是支付時間、年齡、支付渠道、支付方式、支付金額、支付地點、是否車禍患者等屬性,同時特征碼也可以是需要經過一定統計計算的量,例如住院合計支付過的人數、住院預交金透支次數等,甚至還可以是一些較復雜的算法得到的結果,例如通過 KNN (knearest neighbors algorithm)算法得到的是否省外患者、是否繳費積極患者。
(3)提取正確的特征后,通過模型建立從特征到目標之間的關系。針對預測型的問題,單個的模型又通常叫作預測器,例如車禍患者的住院繳費單是由多人支付完成,按照醫院經驗這類人群容易出現因糾紛而造成壞賬的情況。現階段平臺以醫院經驗模型為主,因為機器學習尤其是監督型學習,需要大量的結果反饋,在解決很多實際問題的時候,大量的反饋需要投入過多人力資源且有可能對患者造成打擾。未來諸如神經網絡(常用的如后向神經網絡)、線性分類器(如LR)、支持向量機(SVM)、線性回歸等算法模型同樣可用于模型到目標的關系中。
(4)不管是根據醫院經驗創建的經驗模型,還是機器學習的算法模型,單一模型的預測結果往往不盡人意,例如上文車禍患者如果有多人支付的經驗模型,只對車禍患者有效。但是如果將成百上千個模型融合起來,就可以取得覆蓋更全、準確度更好的預測效果。模型需要大量的訓練,訓練需要結果反饋,結果反饋包含正確結果反饋與錯誤結果反饋,錯誤結果反饋,在實際應用中相對比較容易,比如要和每一個模型預測結果為有支付困難的患者溝通確認,成本較高,還有可能打擾到預測錯誤的患者,但未預測到的錯誤結果(如產生了壞賬)更容易發現,因此平臺采用AdaBoosting算法方法來融合模型。經過平臺不斷調整模型和醫院對模型預測結果的及時反饋,模型訓練一段時間后可以得到比較穩定的預測結果。也因此醫療支付大數據平臺的建設與應用,不光需要信息科技專業的人員,還需要具備豐富實踐經驗的醫院其他部門的協助,才能取到好的效果。
綜上所述,通過醫療支付大數據的探索和應用,解決醫療信息化建設過程中產生的交易碎片化、數據大量化、結算賬戶分散化等問題。集中并規范了收支數據,從而為集團和分院區提供標準、準確、精細化的財務指標,有效監控了集團院區的經濟活動,達到精細化管理的目的,為防范和控制財務風險、提高經濟效益和社會效益做出了突出貢獻。通過對醫療支付大數據應用平臺的數據進行挖掘與分析,優化就醫過程的支付體驗[8],利用機器學習預測模型預測患者未來支付能力,有效提升醫院回款速度同時降低了醫院的壞賬率,有效地服務于醫院的經營管理和財務決策。