向明華,向國華
1.泰興市人民醫院,江蘇 泰興 225400;2.中國電信股份有限公司泰興分公司,江蘇 泰興 225400
基于OCR技術的醫療檔案管理系統研究與構建
向明華1,向國華2
1.泰興市人民醫院,江蘇 泰興 225400;2.中國電信股份有限公司泰興分公司,江蘇 泰興 225400
基于醫院信息系統,利用OCR技術開發了醫療檔案管理系統。系統主要由管理模塊、OCR處理模塊、檔案管理模塊、郵件管理模塊組成。本文詳細介紹了系統的開發過程和使用情況。
醫院信息系統;醫療檔案管理系統;光學字符識別;便攜式文檔格式
隨著計算機技術和網絡技術的快速發展,使得醫療檔案管理數字化、信息化已成必然趨勢[1-2]。病歷資料是在診療過程中形成的客觀病歷材料和主觀病歷材料,對將來醫療機構舉證也起到舉足輕重的作用。電子醫療檔案是由病歷資料轉化而來,電子醫療檔案采用的便攜式文檔格式(PDF)不但能夠真實、準確和客觀地反映原始病歷材料,而且PDF醫療檔案只可查閱,不可涂改,保證了病歷資料的客觀性和科學性[3-4]。筆者利用醫院現有的醫院信息系統(HIS)、影像歸檔和通信系統(PACS),構建了基于光學字符識別(OCR)技術的PDF醫療檔案管理系統,實現了信息共享和全文檢索,提高了醫療檔案文件管理的效率。
1.1 結構設計
醫療檔案管理系統結構設計主要包括系統管理模塊、OCR處理模塊、檔案管理模塊、郵件管理模塊等,見圖1。
1.2 功能設計
(1)系統管理模塊。該模塊負責系統的部門信息維護、人員信息維護、角色維護和模塊維護,工作流程,見圖2。
(2)OCR處理模塊。經OCR處理的PDF醫療文件不依靠第三方數據庫技術,直接進行內容抽取和索引,對被索引的文件內容可以進行高效全文檢索。該模塊具有圖像輸入、預處理(包括二值化、圖像去噪、傾斜矯正)、版面分析、字符切割、字符識別和版面恢復等功能,用于對掃描儀或相關軟件生成的PDF醫療檔案文件進行處理,以便在Web系統中檢索[5-7]。字符識別的關鍵是OCR分辨率的設置,一般來說,文稿字體大,則OCR分辨率設置小些,如2、3號字的文章段,推薦使用200 dpi;反之則大些,如7、8號字的文章段,推薦使用600 dpi。掃描時適當地調整好亮度和對比度值,使掃描文件黑白分明;在醫療檔案管理系統中不得存儲可編輯數據,如txt、doc及xls等格式文件。
(3)使用權限設置。為保證系統安全,本系統共分兩種用戶:一種為系統管理員,主要負責人員信息維護、角色維護、模塊管理;另一種為部門人員(部門人員分多種用戶),部門人員登錄系統后,可以修改登錄密碼、查詢其他人員的基礎信息,收發郵件等。系統可以根據不同權限的用戶顯示不同的功能模塊,系統管理員才具有創建醫療檔案、借閱醫療檔案等管理權利[8]。
2.1 數據庫的創建
系統使用SQL Server2000數據庫管理系統,數據表在創建完成之后生成SQL腳本文件,在查詢分析器中直接運行來創建表結構、數據表的SQL腳本語句[9]。
2.1.1 目錄結構
此系統實現的目錄結構比較清晰,src目錄下存放項目中所用到的java源文件,test目錄下存放java測試類源文件,即本系統所采用的Junit測試文件,doc目錄下存放項目開發所用到的說明文檔[10-11]。
2.1.2 數據表的創建
(1)用戶信息表SM_USER。此表包括了所有登錄系統用戶的信息。
(2)模塊信息表SM_MODEL。此表中記錄了系統模塊信息,可以根據用戶的權限動態顯示相應的模塊,本表采用表字段自關聯實現菜單的顯示功能,即子菜單通過父ID查找實現菜單的關聯功能。
(3)部門信息表SM_DEPARTMENT。部門信息表用以記錄部門信息相關的內容,從而實現對部門的檢索及分類,通過部門名稱就可以對部門相關信息進行查詢。
2.2 界面設計及實現代碼
2.2.1 界面設計
在本地瀏覽器中輸入http://r-co,即可進入PDF醫療檔案信息管理的登錄界面。在此界面單擊導航欄中的“系統模塊管理”鏈接,打開模塊管理查詢界面,就可以實現修改、添加等維護系統操作[12-13]。
2.2.2 代碼實現
由于每個模塊的代碼具有相似性,且代碼量較大,這里簡要介紹人員維護頁面流程。
(1)Spring配置文件。action-servlet.xm l主要用來通過Spring配置Jsp頁面與action的映射信息。
(2)控制層action。該層為Java源代碼,主要負責收集從JSP傳來的數據并調用Spring業務代碼,本例中負責控制層的java源代碼為SmUserController.java。
(3)業務層service。Service層主要負責業務的處理并調用Dao層的數據,并將從Dao層獲取的數據回傳給action層,service層分為service層接口的定義和接口的實現類。
(4)Dao層。Dao層主要用來與底層的數據庫交互,Dao層分為Dao層接口的定義和接口的實現。
(5)JSP顯示層smUsersFrame.jsp。smUserFrame.jsp頁面采用框架結構設計。
基于OCR技術的PDF醫療檔案管理系統的研究和構建,使得檔案管理系統可對全文進行檢索,大大提高了醫療檔案管理效率和檢索率。另外,該系統可預留與辦公自動化系統交換數據的接口,以實現與辦公自動化系統的無縫連接。
[1]戴晟暉,常春英.Dreamweaver8實例與操作[M].北京:航空工業出版社,2010.
[2]李興華.JavaW eb開發實戰經典基礎篇[M].北京:清華大學出版社,2010.
[3](美)Brian P.Hogan.HTM L5和CSS3實例教程[M].北京:人民郵電出版社,2012.
[4](美)N icholas C.Zakas.JavaScript高級程序設計[M].3版.北京:人民郵電出版社,2012.
[5]岳峰,李鵬,張玉祥.跟ORACLE工程師學JAVA軟件項目開發[M].北京:科學出版社,2010.
[6]Christian Bauer,Gavin King.Java Persistence w ith H ibernate[M].USA:Manning Publications Co.,2009.
[7](美)斯格科.Jakarta Struts Cookbook[M].北京:清華大學出版社,2007.
[8]李興華,王月清.Java W eb開發實戰經典[M].北京:清華大學出版社,2010.
[9]陳亞輝,繆勇.Struts2+Spring+Hibernate框架技術與項目實戰[M].北京:清華大學出版社,2012.
[10]孫曉非,馮冠,張銀鶴,等.XM L基礎教程與實驗指導[M].北京:清華電腦學堂,2008.
[11](美)Adobe公司.Adobe Acrobat X中文版經典教程[M].北京:人民郵電出版社,2012.
[12]陳金雄,劉寶妹,鐘俊華.基于云計算的軍人電子健康檔案平臺架構的設計與實現[J].中國醫療設備,2014,29(2):53-55.
[13]黃吳健,帥仁俊.電子健康檔案的加密研究[J].計算機工程與設計,12(10):3833-3837.
Study and Construction of an OCR-Based M edical Record Adm inistration System
XIANG Ming-hua1, XIANG Guo-hua2
1.The People’s Hospital of Taixing, Taixing Jiangsu 225400, China;2. China Telecom Beijing Branch, Taixing Jiangsu 225400, China
Based on the hospital information system, the medical record administration system was developed by using OCR technology. The system mainly consisted of the management module, OCR processing module, fi le management module and e-mail management module. This paper introduced the development process and the use of the system in detail.
hospital information system;medical record adm inistration system;optical character recognition;portable document format
TP311.52
A
10.3969/j.issn.1674-1633.2015.10.031
1674-1633(2015)10-0106-02
2015-04-01
2015-08-10
本文作者:向明華,高級工程師。
作者郵箱:225400@126.com