李柯
(首都醫科大學附屬北京世紀壇醫院, 北京 100038)
根據衛生部發布《衛生部關于發展醫院質量監督評估工作的通知》[1-2]的要求,醫院必須每天在指定時間段內自動連續不斷地上傳醫療信息,這項工作成為醫院鑒定的基本條件。雖然醫院有專門的編碼員,為病人提供一套完整的國際疾病分類(International Classification of Diseases,ICD)編碼,但3A級大型醫院的臨床醫生必須自己對所有住院病人的診斷進行編碼。此外,醫院的發病率情況也不完整,使得醫院的入院數據不能很好地代表醫院排水區社區的疾病負擔[3]。
文獻[4]提出了一種基于依賴解析的語義分析技術,可以自動將臨床藥品電子單編碼分配給復雜的病歷,但存在信息提交不及時、信息不準確的問題。文獻[5]對新發疾病和疑難病例的編碼環節進行分析,然而對NHI試點前12個月的審查結果表明,ICD系統在公共部門的實施情況并不令人滿意,需要加強。
本研究采用PDCA循環法來提高藥品電子單的編碼效率,并通過調研來自2020年上海市一家3A綜合醫院的出院藥品電子單信息,構建PDCA循環模型,如圖1所示。

圖1 PDCA循環模型
根據PDCA管理規則,結合醫院中患者比醫生人數更多的實際情況,對2020年3月至2020年8月出院的14 097例住院藥品電子單中的704例進行了隨機抽樣檢查,其中173例藥品電子單編碼錯誤,錯誤率為24.57%。信息部門編碼人員討論并分析編碼錯誤的原因,并計算錯誤原因的構成比,最終得出由主要和次要診斷選擇錯誤以及藥品電子單內容的疏忽引起的錯誤占所有錯誤原因的88%[6-7]。
根據等級評價要求并結合醫院的實際情況制定藥品電子單管理制度,采用藥品電子單歸檔率作為藥品電子單質量監測的重要指標,報告和分析顯示在藥品電子單質量的公共欄中,公告的內容應針對編碼效率低的信息技術部門,根據人員和藥品電子單數量而定,對達到標準的信息技術部門表示贊賞,并敦促滯后的部門[8]。
某信息技術部門的一名藥品電子單編碼人員連續兩個月在編碼效率排名倒數第一。針對這種情況,藥品電子單管理部門首先將排名結果告知該人,然后四處摸索以簽署改善保證書。藥品電子單管理部門在部門檢查時專門檢查該人的藥品電子單,敦促技術人員在限定時間內提高出院藥品電子單編碼效率。
前一個月的藥品電子單編碼效率情況在下個月收集和排名,將排名結果張貼在藥品電子單編碼效率宣傳欄中,并分別發表在醫學質量簡要報告和3A力爭特刊上。評估結果在醫院的年度報告中閱讀質量分析會議,部門負責人例行會議和藥品電子單管理委員會季度會議以PPT的形式進行,以提高對部門負責人對藥品電子單會議的重要性的認識,發揮監督作用。
本研究中的計算機輔助藥品電子單編碼框架如圖2所示。

圖2 計算機輔助藥品電子單編碼框架
CAC系統框架的建立包括兩個階段,即創建一個基于藥品電子單和WordNet的網絡來解釋藥品電子單代碼的語義,然后根據診斷信息的輸入提出一個算法來獲得具有分數的藥品電子單代碼候選。此外,針對圖2中藥品電子單提出的CodeNet網絡結構,該網絡結構保留了WordNet中藥品電子單實體和同義詞集之間的語義信息。CodeNet方案提供了快速檢索疾病相關文本輸入與藥品電子單編碼實體之間語義關系的方法。當藥品電子單應用程序接口(Application Programming Interface,API)無法獲得正確的代碼時,CodeNet也有助于替代代碼檢索。CodeNet的構建過程如下。
首先,將CodeNet的節點導入一個表示為GCN且通過重新組織藥品電子單死亡率和發病率統計表;其次,將藥品電子單實體分為三種類型,即根實體、章碼實體和索引項實體;第三,派生自WordNet的詞和義實體也被表示為CodeNet的實體,同時每個單詞實體引用一個表示為(標識符,名稱)的單詞;最后,CodeNet中的圖形包含根、章、代碼實體、索引項實體和單詞。
3)鉆孔過程中,一般采用套管定位,鉆孔直徑采用φ42mm,每根導管長度2m,鉆進2m后用導管螺栓連接繼續鉆進。
來自藥品電子單和WordNet的實體之間的關系在CodeNet中指定。對于藥品電子單實體,只存在一種類型的關系,藥品電子單的樹形結構中的代碼關系的示例如圖3所示。

圖3 使用藥品電子單和WordNet的CodeNet結構
在圖3中,“1A00”和“1A01”的代碼標識表示一種代碼標識符“B2-1A0”。表示藥品電子單代碼(G1)之間的現有網絡的圖如式(1):
G1=(entityj→entityi)ti,tj∈T
(1)
式中,T為一組藥品電子單代碼名,entity為實體類型,i為同義詞集的標識符,j為除i以外的任何一個syn的標識符,G1為藥品電子單代碼之間的一組關系來組織的。WordNet同義詞集由同義詞集或其他正確的近義詞集組成:
syn(i)=({wx},r{i,j}),x∈N+
(2)
式中,wx為WordNet中的第x個單詞,r(i,j)為WordNet中定義的兩個syn之間的同義關系。CodeNet的網絡結構是式(1)中的G1,而(2)中WordNet的語法集GCN定義為
GCN=(e,HAS,s),?e∈G1,?s∈GWN
(3)
式中,e為藥品電子單實體的代碼名的一組字,s為藥品電子單實體的代碼名的語義詞,HAS為e和s之間的一種關系類型。CodeNet將藥品電子單與WordNet相結合,利用藥品電子單中的醫學知識和WordNet中的語義提供了一種新的結構,方便了醫學編碼。從藥品電子單的表格列表構建CodeNet的步驟如算法1所示。

算法1:構建藥品電子單CodeNetInput:Tabular list TL, Item List IL, Post-coordination list PLOutput:Network of Electronic medical record GILetitems ← {inclusion, exclusion, coded elsewhere}Let pc ← a set of postcoordination relationsfor ?entityiin TLlevel ← depthiwhile depthj>level doif depthj=level+ 1 thenentityj→ entityi, (entityi, entityj) → GIentityi→ idi∈IL, entityj →idj∈ILentityi→ pci∈PL,entityj→pcj∈PLelsei ← j, level ← level + 1, go to level←depthiend ifend whileend forreturn GI
利用CodeNet結構,本研究提出了一種基于從藥品電子單中提取的術語序列的帶分數候選代碼的自動提取方法。具體步驟如下。
步驟1:輸入的藥品電子單文本要編碼的代碼被拆分為一組有序的單詞集{wi|1≤i≤N},其中N是文本中的詞干單詞數。在搜索CodeNet時,每個單詞集wi出現的頻率在文本中是fi,通過一組{wi,fi}獲得初始層(L0)。
步驟2:單詞層L1是通過創建單詞實體形成的,w由fi/fmax計算得到,wi在檢索到的單詞實體中,單詞實體pj由Max(text_sim (wi,wj))計算得到,其中text_sim (wi,wj)為CodeNet 中輸入詞wi和詞實體wj之間的文本相似度。
步驟3:對于感應層L2實體{e,s},在CodeNet中有關sm的pk由Max(pj)和sim(input,sn)計算得出,其中sim(input,sn)是input和sn同義詞組之間的估計的語義相似度值。圖4說明了L0~L2層之間的權重計算。

圖4 L0~L2之間的權重計算
對于代碼層L3,從CodeNet獲取每個e的索引詞實體列表{c},索引詞實體的文本描述為{windex},由Max(pk)來計算最大(sim(input,tz))wm。圖5顯示了L2和候選代碼輸出之間的權重計算。

圖5 L2與候選代碼輸出之間的權重計算
步驟4:最后得到基于藥品電子單和CodeNet的包含四層(L0、L1、L2和L3)的候選代碼網絡,根據最終索引項wm的
數值,得出候選代碼列表{c},該列表滿足條件:
{c}={c|c∈L3,pc≤θ}
(4)
式中,θ為候選代碼閾值。高度合適的藥品電子單候選代碼應該在列表中具有最大的pc,編碼人員選擇最佳編碼解釋相應的診斷結果。
本研究采用上海市某家(下面表示將以代號F)3A級醫院的分娩嬰兒藥品電子單信息作為實驗數據,關于F醫院病人藥品電子單鑒定評估表如表1所示。

表1 O醫院病人藥品電子單鑒定評估表
為了體現本研究方法的優勢,分別調研采用傳統基于手動編碼的PDCA循環法A時段(2020年1月至2020年6月)與采用基于CAC系統的PDCA循環法B時段(2020年7月至2020年12月)兩個時間段中藥品電子單報告中的編碼錯誤,并通過以下評估標準分析了2種方法對編碼效率的影響對比,得到皮爾森卡方檢驗值P如表2所示。

表2 皮爾森卡方檢驗成果對比表
在表2中,A時段出院患者42 486人,信息報告中發現158錯誤,錯誤率0.372%;B時段的出院患者為45 188人,信息報告中發現129個錯誤,錯誤率為0.285%。進一步對表2結果進行分析,某些項目的錯誤率已大大降低。對錯誤項和每個項的錯誤發生頻率進行計數,結果表明采用基于CAC系統的PDCA循環法的編碼錯誤率明顯降低。通過分析A時段和B時段藥品電子單各項目的錯誤數,得到如圖6、圖7的柱狀圖。

圖6 A時段藥品電子單編碼錯誤數

圖7 B時段藥品電子單編碼錯誤數
通過圖6、圖7可以看出,與A時段的信息報告中的錯誤相比,B時段的信息報告中的錯誤數量減少了29個,總體錯誤率顯著降低。實施基于CAC系統的PDCA循環法后,2020上半年信息報告中的主要錯誤得到了明顯改善,有效地提高了藥品電子單編碼的質量。綜合以上實驗結果,反映了醫療記錄的編寫醫院不規范,藥品電子單不正確,不完整造成效率低的原因如下。
(1) 一些醫務人員在業務培訓期間學習不足,一些在職編碼員沒有強烈的責任心和高度的思想意識。
(2) 審核員不會仔細檢查藥品電子單。手術操作代碼,主要診斷代碼和藥品費用的錯誤反映出醫院編碼員編寫不規范。
(3) 藥品電子單系統中某些疾病的代碼與數據報告系統中疾病代碼的標準版本中的代碼不對應,疾病庫沒有得到及時維護和更新,審核員沒有仔細檢查藥品電子單。為此,需要對醫院人員的管理工作進一步的加強。
針對多家醫院藥品信息報告編寫的質量和效率存在嚴重缺陷問題,本研究采用PDCA循環法來進行管理藥品電子單編碼,提出了一種基于WordNet和藥品電子單應用編程接口(API)的計算機輔助編碼框架,幫助編碼人員為特定病歷選擇最合適的藥品電子單代碼,并引入藥品電子單候選代碼的自動提取方法,從技術角度減少藥品電子單編碼錯誤率,提高藥品電子單編碼效率。相對于采用傳統PDCA循環法,實施基于CAC系統的PDCA循環法后,藥品電子單的主要錯誤得到了明顯改善,有效地提高了藥品電子單編碼的質量。