王興強(qiáng) 孟 娜*
隨著醫(yī)療信息化技術(shù)的發(fā)展,醫(yī)院信息系統(tǒng)(hospital information system,HIS)中患者診療數(shù)據(jù)的質(zhì)量和完整性越來(lái)越重要。患者主索引數(shù)據(jù)的大量冗余,導(dǎo)致以患者主索引數(shù)據(jù)為索引的診療數(shù)據(jù)的低可用性。目前,患者主索引數(shù)據(jù)的管理主要有患者主索引指數(shù)(enterprise master patient index,EMPI)系統(tǒng)[1-4]和醫(yī)院信息集成平臺(tái)[5]兩種解決方案,其均為獨(dú)立的系統(tǒng),主索引數(shù)據(jù)能夠在HIS、實(shí)驗(yàn)室信息系統(tǒng)(laboratory information system,LIS)以及影像歸檔及傳輸系統(tǒng)(picture archiving and communication systems,PACS)等多系統(tǒng)間交互,但實(shí)現(xiàn)復(fù)雜,且成本高。而指紋識(shí)別、人臉識(shí)別、虹膜識(shí)別及靜脈識(shí)別等方式均可確定身份的唯一性,可以與患者主索引進(jìn)行綁定用于識(shí)別和支付,但難以對(duì)當(dāng)前大量患者主索引數(shù)據(jù)進(jìn)行有效管理。為此,本研究提出了一種基于HIS本身的患者主索引數(shù)據(jù)的管理方法。
患者主索引數(shù)據(jù)產(chǎn)生于住院和門(mén)診就診兩個(gè)環(huán)節(jié)。住院需要登記患者的姓名、性別、出生日期、身份證號(hào)、地址、聯(lián)系人及電話等信息,要求信息完整而準(zhǔn)確。住院登記患者信息通過(guò)患者手工登記或者從門(mén)診醫(yī)生站開(kāi)具的住院?jiǎn)沃刑崛 iL(zhǎng)期以來(lái)門(mén)診患者信息登記都是采用手工登記的方式進(jìn)行登記錄入,其錯(cuò)誤率和信息不完整率較高,在當(dāng)前的HIS中已保存了大量的患者主索引數(shù)據(jù)[6-7]。
近年來(lái),隨著信息化技術(shù)的發(fā)展出現(xiàn)了讀取患者身份證、社保卡及銀行卡等身份憑證在自助機(jī)或人工窗口辦理的方式,其準(zhǔn)確率較高,但重復(fù)登記辦理的情況比較多,尤其是很多醫(yī)院都采用了門(mén)診醫(yī)卡通系統(tǒng),患者若將就診卡丟失或遺忘時(shí)會(huì)重新辦理,從而造成患者信息重復(fù)登記的情況[8-9]。
患者主索引信息中含有身份證號(hào)、社保卡號(hào)及護(hù)照號(hào)等唯一身份識(shí)別(identification card,ID)確認(rèn)其身份,但HIS中存在大量一個(gè)ID信息多條主索引的情況;而對(duì)于主索引信息中不含有效ID信息的則很難確認(rèn)其身份的唯一性,尤其是歷史數(shù)據(jù)中的患者主索引信息不完整,直接導(dǎo)致了以不完整主索引數(shù)據(jù)為索引的診療數(shù)據(jù)的低利用率,在很大程度上造成醫(yī)療資源的浪費(fèi)并延誤患者的診療進(jìn)程。
患者主索引關(guān)鍵詞數(shù)據(jù)包括姓名、性別、出生日期、民族、身份證號(hào)、地址及聯(lián)系人等,按其不同屬性,可分為3類:①具有ID唯一性屬性的身份證號(hào)、社保卡號(hào)及護(hù)照號(hào)等關(guān)鍵詞, 患者主索引數(shù)據(jù)一般來(lái)源為住院患者登記或門(mén)診患者通過(guò)讀取有效身份憑證的方式登記,通過(guò)有效的ID可確定患者本人;②具有排他性屬性的性別、民族及姓氏等關(guān)鍵詞,患者信息只會(huì)出現(xiàn)信息登記的對(duì)或錯(cuò),而不會(huì)出現(xiàn)相似等不確定的情況;③具有強(qiáng)相似性屬性的名字、出生日期、地址及聯(lián)系人等關(guān)鍵詞,在進(jìn)行患者信息登記時(shí),患者姓名通過(guò)口述或患者手工登記人工錄入時(shí),存在錄入成形似的字或者諧音字等情況,患者出生日期,存在只登記錄入到年份或月份信息的情況,患者聯(lián)系地址登記不全,存在只登記錄入到區(qū)縣,沒(méi)有到街道門(mén)牌的情況。這些關(guān)鍵詞對(duì)于判定多條患者主索引記錄是否屬于同一患者時(shí)具有不確定性。
在患者主索引數(shù)據(jù)中,患者ID是確定患者唯一性的標(biāo)識(shí),多條患者主索引記錄即多個(gè)患者ID標(biāo)識(shí)多位患者,但目前大量存在同一患者有多條患者主索引、多個(gè)患者ID的情況[10-13]。為解決上述問(wèn)題,采用一種患者主索引數(shù)據(jù)管理方法,通過(guò)創(chuàng)建患者身份主索引表,計(jì)算主索引相似度來(lái)實(shí)現(xiàn)。
患者身份主索引表,是指能夠確立患者身份唯一性的索引表,是患者主索引數(shù)據(jù)的索引表,由身份ID和患者ID為主鍵,從而確定患者身份的唯一性,將患者主索引中的患者ID數(shù)據(jù)存入該表中。通過(guò)ID信息查詢?cè)摫恚梢缘贸鲈摶颊咴?jīng)使用過(guò)的患者ID,從而得出該患者的歷史診療數(shù)據(jù)。ID信息可以是身份證號(hào)、社保卡號(hào)和護(hù)照號(hào),也可生成一個(gè)系統(tǒng)中唯一序號(hào)作為ID信息。
患者主索引相似度計(jì)算,是指將當(dāng)前主索引數(shù)據(jù)中的關(guān)鍵詞數(shù)據(jù)與其他主索引數(shù)據(jù)中的相應(yīng)關(guān)鍵詞數(shù)據(jù)進(jìn)行相似性計(jì)算。第一類具有身份唯一性屬性的關(guān)鍵詞不參與計(jì)算,第二類具有排他性屬性的關(guān)鍵詞和第3類具有強(qiáng)相似性屬性的關(guān)鍵詞參與計(jì)算。
第二類具有排他性屬性的關(guān)鍵詞wi相似性系數(shù)計(jì)算為公式1:

式中Ek,i為第k條主索引數(shù)據(jù)中第二類具有排他性屬性的關(guān)鍵詞wi的相似性系數(shù),w0,i為當(dāng)前主索引數(shù)據(jù)中的關(guān)鍵詞wi的值,wk,i為第k條主索引數(shù)據(jù)中的關(guān)鍵詞wi的值;i的取值范圍為0<i<m,m為第二類具有排他性屬性的關(guān)鍵詞的數(shù)量(見(jiàn)表1)。

表1 患者排他性關(guān)鍵詞相似性計(jì)算
第三類具有強(qiáng)相似性屬性的關(guān)鍵詞wj相似性系數(shù)計(jì)算,采用關(guān)鍵詞字符串匹配后長(zhǎng)度比加權(quán)的方式,其計(jì)算為公式2:

式中Sk,j為第k條主索引數(shù)據(jù)中第三類具有強(qiáng)相似性屬性的關(guān)鍵詞wj的相似性系數(shù),w0,j為當(dāng)前主索引數(shù)據(jù)中的關(guān)鍵詞wj的值,wk,j為第k條主索引數(shù)據(jù)中的關(guān)鍵詞wj的值,match()為字符串匹配函數(shù),len()為取字符串長(zhǎng)度函數(shù),cj為第三類具有強(qiáng)相似性屬性的關(guān)鍵詞wj的加權(quán)系數(shù);j的取值范圍為0<j<n,n為第三類具有強(qiáng)相似性屬性的關(guān)鍵詞的數(shù)量。
當(dāng)前主索引數(shù)據(jù)與第k條主索引數(shù)據(jù)相似度Vk的計(jì)算為公式3:

對(duì)患者主索引數(shù)據(jù)進(jìn)行唯一性管理,需要以患者來(lái)院就診為觸發(fā)點(diǎn),通過(guò)患者信息與HIS數(shù)據(jù)庫(kù)中患者主索引表的數(shù)據(jù)進(jìn)行相似性計(jì)算實(shí)現(xiàn),并經(jīng)患者確認(rèn)為本人數(shù)據(jù),患者主索引數(shù)據(jù)清洗流程如圖1所示。

圖1 患者主索引數(shù)據(jù)清洗流程圖
患者主索引數(shù)據(jù)的管理步驟為:①患者就診,獲取患者ID;②根據(jù)患者ID,檢索HIS數(shù)據(jù)庫(kù)的患者主索引表中當(dāng)前患者主索引信息,患者ID為患者主索引表中的主鍵,具有唯一性,檢索結(jié)果不為空;③判斷當(dāng)前患者主索引信息中是否具有唯一ID,如果沒(méi)有則跳到步驟“⑦”,否則如果唯一ID不為身份證號(hào)則跳到步驟“⑤”,否則如果唯一ID為有效的一代或二代身份證,則跳到步驟“④”進(jìn)行分析處理;④如當(dāng)前患者身份證號(hào)為15位一代身份證號(hào)碼,則轉(zhuǎn)換成18位二代身份證號(hào)碼,如當(dāng)前患者身份證號(hào)為18位二代身份證號(hào)碼,則轉(zhuǎn)換成15位一代身份證號(hào)碼。將患者一、二代身份證號(hào)互轉(zhuǎn),便于獲取該患者的歷史主索引信息;⑤按照當(dāng)前獲取的所有唯一ID檢索患者主索引表中的患者ID;⑥將當(dāng)前患者唯一ID和檢索的患者ID,添加保存至患者身份主索引表中,該表是能夠確立患者身份唯一性的索引表,是患者主索引數(shù)據(jù)的索引表,主鍵由唯一ID和患者ID共同構(gòu)成主鍵;⑦檢索患者主索引表中的第二類具有排他性屬性的關(guān)鍵詞和第三類具有強(qiáng)相似性屬性的關(guān)鍵詞;⑧根據(jù)相似度計(jì)算公式計(jì)算當(dāng)前患者主索引數(shù)據(jù)與其他主索引數(shù)據(jù)相似度V,剔除相似度小于預(yù)定閥值V0的數(shù)據(jù),并按照相似度V由大到小的順序?qū)χ魉饕斜砼判颍虎峋驮\患者確認(rèn)排序的主索引列表中本人的信息;⑩將經(jīng)過(guò)就診患者確認(rèn)過(guò)的患者ID添加保存至患者身份主索引表中,結(jié)束。患者身份主索引表結(jié)構(gòu)見(jiàn)表2。

表2 患者身份主索引表結(jié)構(gòu)
在HIS中,可根據(jù)患者身份主索引數(shù)據(jù),在門(mén)診或住院的醫(yī)生站、護(hù)士站或其他程序中,通過(guò)患者當(dāng)前使用的患者ID檢索患者身份主索引表,獲取該患者的唯一身份ID,再通過(guò)唯一身份ID檢索獲取該患者所有使用過(guò)的患者ID,從而得到該患者任意時(shí)間軸上的歷史診療數(shù)據(jù)。
在患者正常就診的過(guò)程中,根據(jù)患者當(dāng)前主索引信息中的關(guān)鍵詞,自動(dòng)計(jì)算并過(guò)濾出與患者當(dāng)前主索引信息高相似度的患者主索引列表,經(jīng)過(guò)患者確認(rèn)保存至患者身份主索引表中,實(shí)現(xiàn)患者主索引歷史數(shù)據(jù)的有效管理。患者就診過(guò)程中根據(jù)患者唯一身份ID,可得出該患者曾經(jīng)使用過(guò)的患者ID,從而得到該患者的歷史診療數(shù)據(jù),提高患者歷史診療數(shù)據(jù)的可用性,為醫(yī)生提供更加完善的患者歷史診療數(shù)據(jù),提高患者就診效率,縮短患者就診流程。