莊紹燕,蘇新明,陳文亮
1.解放軍180醫院 信息科,福建 泉州362000;2.解放軍91醫院 信息科,河南 焦作454150
醫院信息系統的數據文件、索引文件、LOB型數據分離方法
莊紹燕1,蘇新明2,陳文亮1
1.解放軍180醫院 信息科,福建 泉州362000;2.解放軍91醫院 信息科,河南 焦作454150
針對醫院信息系統(HIS)數據庫傳統管理模式的弊端, 結合Oracle數據庫管理特性,將數據、數據索引、大二進制數據對象分離,并連續存儲于系統不同數據文件中,提高了數據庫對象分層存儲的清晰度和安全性,同時也提升了數據并行訪問的速度。
醫院信息系統;Oracle數據;數據索引;大二進制數據
我院編制床位1400張,規模上屬于中等的三級甲等綜合醫院,醫院信息系統(HIS)已上線14年,屬國內第一批全院范圍大規模實現醫療數字化的醫院,并已實現“數字化一級達標醫院”,醫院數據庫容量現已達570GB,預計在未來2年將跨入TB級別。龐大的數據文件對醫院的高速存儲空間的使用造成很大的壓力,既要保證數據庫訪問的快速性,又要保證數據庫的安全性,這對數據庫管理員提出了新的挑戰[1-2]。為此,我們分析了傳統醫院信息系統(HIS)數據庫管理模式存在的問題,提出了改進方案,取得了較好的效果,現報告如下,供同行參考。
醫院以往對HIS數據的管理模式是以業務種類劃分界限,為每一種業務都創建一個表空間,并在操作系統上創建若干個數據文件。隨著信息數據的迅速增長,這種不斷地增加數據文件的管理模式缺點突顯:
(1)醫療業務數據物理存儲于數據文件中,所以數據文件中既有數據段、索引段、也有大二進制數據段、大二進制索引段。當每增加1行數據時,相應的數據文件數據、索引數據、大二進制段數據、大二進制索引段數據均增加1行數據。而這些數據分處于不同的扇區中,造成數據文件的混亂,見圖1。在進行數據查詢時,如果采用機械硬盤的話,對不連續的磁道和扇區讀的時間延遲大,對數據查找有很大的影響。

圖1 數據段在數據文件中的存儲方式
(2) 數據備份任務繁重。各種數據分布在同一數據庫文件的不同扇區,數據庫備份時,其不連續的扇區相比連續的扇區的讀寫消耗更多的時間,從而影響備份速度。
(3) 數據文件、索引文件、大二進制數據存儲于同一數據庫,但數據文件日增長量大,需要預留較大的數據文件增長空間。一般情況下,HIS數據庫容量的70%(甚至可能更低)為真正的數據存儲區域;另外30%則為增長預留空間。數據庫管理員為了不讓文件存儲空間不足造成數據庫宕機,一般會預留更多預增長空間。而空間的增長和備份速度是相悖的,長期以來,數據庫管理員的安全備份壓力越來越大。
(4)HIS發生災難性故障時,采用文件級別恢復,如果沒有恢復重點對象,從龐大數據文件中恢復數據無疑是大海撈針。
通過上面的分析,我們對HIS數據庫的管理模式做了如下改進[3-5]:
(1)創建全庫專屬索引表空間,將各個表空間的業務數據和索引數據分離。業務表空間只存儲業務數據,索引表空間存儲索引。這樣,高效的索引可以提高數據庫訪問的速度,連續的索引段和數據段也可以提高數據庫訪問效率。同時,在災難發生時,索引數據文件是可丟棄的第一選擇。
(2)創建專門存儲LOB數據的表空間。將含有CLOB、BLOB的對象分離至LOB表空間中。該表空間可以創建多個20~30 GB的數據文件,該類型的數據一般訪問不會非常頻繁,且對數據實時性要求不高。
(3)創建零散業務表空間(5~10 GB),用于存放醫院人力資源管理數據、感控數據等年業務量預增長量<1 GB的零散業務數據。
(4)做數據和索引的遷移,特別是重新生成索引。許多醫院從HIS數據庫使用以來(10年以上),大部分表格的索引基本沒有重新生成過,而數據庫宿主服務器和存儲(一般4年更換)卻經歷過至少3次以上遷移。
(5)將數據文件和索引的數據文件存放在固態硬盤;將大二進制數據文件存放于機械硬盤。這種存儲方法既提高數據存儲效率又節約成本。
(6)重新編譯所有視圖、存儲過程。
以我院HIS數據庫為例,介紹實施過程:
(1)創建tsp_index表空間,此表空間關聯4個30 GB的數據文件。數據文件為APINDEX01、APINDEX02、APINDEX03、APINDEX04。 其中最后1個表空間增長大小為每次128 MB。實現程序語句如下:
Create tablespacetsp_indexdatafile ‘D: orclapindex04.dbf’size307290M autoextend on next 128m;
(2)創建tsp_lob表空間,此表空間關聯6個30 GB的數據文件,數據文件為APLOB01、APLOB02……APLOB06。其中最后1個表空間增長大小為每次128 MB。實現程序語句如下:
Create tablespace tsp_lob_data datafile ‘d: orclap_lob_ data06.dbf’ size307290M autoextend on next 128m;
(3)將索引表空間的讀寫權限賦予所有用戶。實現程序語句如下:
alteruser usernamequota unlimited ontsp_index;
(4)依次將體檢、心電、檢驗、病歷等業務中的表格做遷移。實現程序語句如下:
Alter table table_name move tablespace new_tablespace;
(5)碰到含有blob表格,需要做數據遷移后,再遷移索引。實現程序語句如下:
Alter table table_name move tablespace new_tablespace lob(lob_column)store as (tablespace new_tablespace);
(6)利用業務空檔,對數據庫中比較大的索引進行刪除,刪除完畢后,重建索引至TSP_INDEX表空間。實現程序語句如下:
Alterindex index_name rebuild tablespace new_tablespace;
經過以上的調整,雖然數據庫表空間和數據文件數量增多,但是數據文件空間總大小減小了;經過重新生成的數據和索引文件,使數據的段連續性增強,客戶端連接服務器操作時,能明顯感覺到運行速度得到質的提升[6-7]。
醫療信息已進入大數據時代,數據庫管理員依托硬件服務器性能及穩定性來實現HIS數據庫服務穩定性的時代必將終結。根據醫療業務特性及發展趨勢,及時調整數據庫管理策略是數據庫管理員在運維管理上新的思路。
[1] 郝昱文,盧沙林,楊宇,等.醫院信息智能統計分析系統設計與實現[J].中國醫療設備,2013,28(2):31-32.
[2] 周毅,鄒賽德,劉燕.可交互性標準框架的評估何選擇[J].中國數字醫學,2007,2(6):24-26.
[3] Darl Kuhn,sam R.Alapati,Bill Padifield.Expert Indexing in Oracle Database 11g[M].北京:人民郵電出版社,2012:29-87.
[4] Jonathan Lewis.Oracle Core[M].北京:人民郵電出版社, 2013:62-91.
[5] sam R.Alapati,Darl Kuhn,BillPadfield.Oracle Database 11g Performance[M].北京:人民郵電出版社,2013:103-141.
[6] 賈代平,吳麗娟.Oracle 數據存儲與訪問技術[M].北京:電子工業出版社,2013:17-103.
[7] 胡歌.Oracle數據庫安全性分析研究[J].信息安全與技術, 2012,(4):32-33.
Methodology for Segregation of Data, Indexes and LOB in the HIS
ZHUANG Shao-yan1, SU Xin-ming2, CHEN Wen-liang1
1.Department of Information, The 180thHospital of PLA, Quanzhou Fujian 362000, China; 2. Department of Information, The 91stHospital of PLA, Jiaozuo Henan 454150, China
In view of the shortcomings of conventional management for the HIS (Hospital Information System) database, the methodology for Oracle database management was deployed so as to make the data, indexes and LOBs (Binary Large Object) segregated and constantly stored in respective fi les. This practice has contributed to hierarchical storage management of the database in a more secure and intuitive way and made the dataparallelly accesse data faster speed.
hospital information system; Oracle data; data indexes; binary large objects
TP333
A
10.3969/j.issn.1674-1633.2015.03.024
1674-1633(2015)03-0081-02
2014-09-17
作者郵箱:3817118@qq.com