龔海,錢大雁,陳國強,許強
1.江陰市人民醫院,江蘇 江陰 214400;2.江陰市衛生局,江蘇 江陰 214400
基于云存儲技術的區域PACS初探
龔海1,錢大雁2,陳國強1,許強1
1.江陰市人民醫院,江蘇 江陰 214400;2.江陰市衛生局,江蘇 江陰 214400
本文介紹了云存儲的概念,分析了傳統存儲系統的不足,并詳細闡述了基于云存儲技術的區域圖片存檔及通信系統(Picture Archiving and Communication System,PACS)的特點、基本流程及其實現方式,該系統使得網絡中不同類型的存儲設備可通過應用軟件協同工作,有效地提高了醫療服務質量。
云存儲技術;區域PACS;Hash法;管理服務器;存儲服務器;數據庫
我國在 2009 年 4 月啟動的新一輪醫療體制改革中,提出要建立實用共享的醫療衛生信息系統,以極力整合醫療資源。信息化的一個重要內容就是要加速發展以居民健康檔案為基礎的區域衛生信息化平臺。區域衛生信息化系統具有數據量大、存儲周期長、實時性強、利用率高等特點,需要借助全新的技術平臺來實現。云存儲技術的出現,為區域醫療信息化建設帶來了曙光。本文闡述了云存儲技術的發展優勢和潛在能力,分析了新的技術環境下醫院區域圖片存檔及通信系統(Picture Archiving and Communication System,PACS)的建設需求,介紹了基于云存儲技術的PACS 的基本流程及實現方式,為醫學圖像的獲取、顯示、存儲、傳送和有效管理等問題提供了新的解決途徑。
醫學資源,特別是醫學影像數據存檔的集中存儲系統存在無法滿足高訪問量的問題,云存儲的出現為該問題的解決提供了新的方案。云存儲是在云計算概念上延伸和發展出來的,對 PACS 的實現非常重要。云存儲是指通過集群應用、網格技術或分布式文件系統,將網絡中不同類型的存儲設備通過應用軟件集合起來,共同對外提供數據存儲和業務訪問功能的技術。云存儲系統是一個以數據存儲和管理為核心的云計算系統:當需要對大量數據進行存儲和管理時,云計算系統就需要配置大量的存儲設備,那么云計算系統就轉變成了云存儲系統[1-4]。
傳統存儲系統由三部分組成:服務器、數據庫、存儲陣列。收到數據文件時,系統先將文件存儲的位置信息錄入數據庫,然后再將文件存儲到陣列中;讀取數據文件時,系統先從數據庫讀取文件位置,然后根據指定位置讀取數據文件。傳統存儲系統框架,見圖1。這種存儲系統存在以下缺點:
(1)隨著數據的增加,數據庫內容也相應增加,則訪問數據庫的速度也就越慢,數據文件的讀寫速度就越慢。
(2)系統的運行依賴個體設備性能,而隨著用戶的訪問量的增大,個體設備性能將無法滿足相應需求。
(3)使用高配置的個體設備不利于系統的持續性能升級和數據量的擴容。

圖1 傳統存儲系統框架
3.1 特點
基于云存儲技術的區域 PACS 不使用高性能的單體設備和數據庫,而采用統一的普通 X86架構的存儲服務器作為 數 據 的 載 體, 應 用 Hash 法 來 構 建 索 引 庫 和 文 件 庫[5-7]。接收到數據文件時,由管理服務器通過 Hash 策略將數據分散保存到各個存儲服務器上[8],然后將存儲服務器的位置信息記錄在管理服務器索引庫中;當客戶端讀取數據文件時,首先從索引庫中讀取存儲服務器位置信息,然后通過客戶端直接到存儲服務器中獲取數據。基于云存儲技術的區域 PACS 框架,見圖 2。該系統相對傳統存儲主要有以下優點:
(1)通過 Hash 法構建的索引庫和文件庫可以將數據均衡分散保存到各個存儲服務器中,使得數據的讀寫速度與數據量的大小無關。
(2)數據分散存儲使用戶的訪問也可以分散到各臺服務器,這樣就可以保證各服務器的處理相對均衡,使用普通的服務器就可以達到高效處理的目的。
(3)統一的服務器架構可以方便的實現系統性能和數據量的升級,系統需要進行擴容的時候只需在原有基礎上追加服務器,無需調整原有環境。
(4)使用普通服務器可以大大降低數據中心的硬件成本。

圖2 基于云存儲技術的區域PACS框架
3.2 工作流程
(1)存儲流程。當管理服務收到需要存儲的數據文件時,采取 Hash 法將數據文件存儲任務分配給各存儲服務器,同時管理服務器記錄存儲服務器的索引信息,流程框架見圖3。

圖3 存儲流程框架
(2)讀取流程。當客戶端讀取數據文件時,首先從索引庫中讀取存儲服務器位置信息,然后由客戶端直接到存儲服務器中獲取相關數據,具體框架見圖4。

圖4 讀取流程框架
3.3 分級存儲摸式的實現
(1)為了保證系統的正常運行,存儲服務器需要具有高效管理海量文件數據的能力,還要具備快速索引文件的能力。為了實現存儲服務器的高效管理及快速索引,應用Hash 法來實現樹形結構的文件、目錄的分散分級存儲摸式,具體框架見圖5。該存儲模式將圖像以檢查目錄為單位進行組織并進行分類,能夠保證在文件數量快速增加時,訪問速度不受任何影響。

圖5 分級存儲摸式框架
(2)將圖像以檢查目錄為單位進行組織并進行分類,并不能解決文件服務器海量數據存儲的問題。每天從設備上發送過來的數據巨大,不光是圖像數量多,檢查量也很大。如果將所有的檢查目錄放在同一級目錄下,隨著存放的數據量越來越多,檢查目錄有可能達到上百萬個或更多。這樣再強的操作系統也將無法對數據進行管理,更談不上高效存儲與索引了,較好的方法是用樹形結構將他們分散到各級子目錄中,將各級子目錄的數據控制在一定數量內(一般各種操作系統每一級目錄管理的文件或目錄數量最好<1000 個)。
對于醫學數據目錄的分級管理,多數情況下使用的方法有 :① 根據文件寫入服務器的時間來進行分組,如以年為單位作為1級目錄,年下面以月為單位作為2級目錄,月下面再以天為單位作為3級目錄,3級目錄下進行數據存儲檢查 ;② 在文件服務器上建立一個累加器,根據分級目錄存儲數據的大小進行控制。如果某一級存儲目錄數據超過了累加器控制范圍,系統會自動新建一個新目錄來存儲新的檢查數據。
分散存儲問題解決了,但是如何將這些數據重新讀取出來呢?由于使用以上方法創建的目錄都是根據文件服務器產生的信息為基礎生成的,外界無法知道數據存儲的位置,所以在保存數據的時候需要用數據庫來記錄文件索引。該方法可以解決文件服務器的基本問題,但是效果并不好,首先,文件索引信息和數據庫捆綁的很緊,如果數據需要遷移或者修改時,要同時對索引庫和數據庫進行修改;其次,由于數據的查找完全依賴數據庫的索引性能,當數據量越來越巨大的時候數據庫的索引性能將成為文件服務器性能的瓶頸。

圖6 文件讀寫操作具體流程
為了解決以上問題,我們摒棄上述方法,不使用數據庫來記錄索引信息,而是采用文件本身引入的唯一標識來計算 Hash 值,賦予每級目錄具體的語意特性。當系統接收到圖像文件時,先進行數據解析,然后根據解析信息對圖像文件進行分組、保存,同時通知后臺對文件進行處理;當客戶端需要讀取圖像文件時,服務器根據用戶的圖像請求確認圖像文件的檢查目錄,然后根據目錄結構生成信息列表,接著通過服務網絡發送圖像文件到用戶端。文件讀寫操作具體流程,見圖6。
云存儲技術可解決 PACS實際應用中產生的存儲管理和并發訪問的技術瓶頸。基于云存儲技術的區域 PACS具有明顯的優勢 :① 具有強大的圖像后處理功能 ;② 簡便快速,改變了傳統的病人檢查后須花大量時間等待醫生通過膠片進行診斷的局面 ;③ 解決了醫院必須購買昂貴的大型計算機和高端存儲系統來管理和存儲海量醫學影像文件的困擾。基于云存儲技術的區域 PACS的應用,可有效改善醫療服務質量,推動我國區域衛生信息化平臺的發展[9-12]。
[1] 尹雪蓉,尹今揚.云計算模式的醫療信息管理平臺構想[J].中國醫療設備,2012,27(6):74-76,129.
[2] 周迎,曾凡,黃昊.淺談云計算在醫療衛生信息化建設中的應用前景[J].中國醫學教育技術,2010,24(4):350-353.
[3] 潘鳳明,張燁.醫療衛生云計算化應用管理[J].上海電機學院學報,2011,14(1):67-70.
[4] 陳云忠,曹定舟,許源.淺析基于云計算的區域衛生信息系統的構建[J].中國醫療設備,2011,26(9):57-60.
[5] 胡新平,張志美,董建成.基于云計算理念與技術的醫療信息化[J].醫學信息學雜志,2010,(3):6-9.
[6] 童曉渝,吳鋼,張云勇.后電信時代-產業生態變革與商業模式轉型[M].北京:人民郵電出版社.
[7] 王鵬,黃華峰,曹珂.云計算:中國未來的IT戰略[M].北京:人民郵電出版社.
[8] 朱近之,方興.智慧的云計算[M].北京:電子工業出版社.
[9] 楊宏橋,吳飛,甘仞初.構建區域協同醫療信息系統的設計方案研究[J].醫療衛生裝備,2008,29(5):50-52.
[10] 全宇,佡劍非,郭啟勇.構建區域協同醫療平臺的探討[J].中國醫院管理,2009,(6):54-56.
[11] 張承江.醫學數據倉庫與數據挖掘[M].北京:中國中醫藥出版社.
[12] 李包羅,李皆歡.中國區域醫療衛生信息化和云計算[J].中國數字醫學,2011,6(5):19-23.
Brief Analysis of Regional PACS Based on Cloud Storage Technology
GONG Hai1, QIAN Da-yan2, CHEN Guo-qiang1, XU Qiang1
1.The People's Hospital of Jiangyin, Jiangyin Jiangsu 214400, China; 2.Health Bureau of Jiangyin, Jiangyin Jiangsu 214400, China
This paper introduces the concept of cloud storage, analyzes the deficiencies of traditional storage system, and describes the characteristics, basic procedure and implementation method of regional PACS based on cloud storage technology in detail. Different storage devices can work collaboratively through application software with the application of regional PACS, which has improved the quality of medical service effectively.
cloud storage technology; regional PACS; Hash algorithm; management server; storage server; database
TP393.03
A
10.3969/j.issn.1674-1633.2013.11.024
1674-1633(2013)11-0070-03
2013-10-15
作者郵箱:13915237388@139.com