陳皇宇
?
云計算環境下的海量醫用信息檢索系統設計
陳皇宇
(南京軍區南京總醫院,南京210000)
針對傳統海量醫用信息檢索系統的檢索準確率低、檢索時間開銷較大,對大規模醫用信息的實時檢索性能不好等問題,提出一種云計算環境下的海量醫用信息檢索方法。構建醫用信息檢索系統的總體設計構架,設計基于模糊C均值聚類的醫用信息檢索數據庫訪問算法,構建醫用信息數據庫關聯指向性特征,通過程序加載模塊加載到系統的數據信息處理模塊。在嵌入式Linux環境下設計海量醫用信息檢索系統的軟件,采用交叉編譯方式進行程序加載和信息檢索控制,在云計算環境下實現信息編譯和數據存儲,完成海量醫用信息檢索系統的集成設計和系統調試。實驗結果表明,采用該檢索系統能大大提高海量醫用信息的檢索準確率,數據的召回率較高、信息檢索的時間開銷較小、實時檢索性能好。
云計算環境;海量數據;醫用信息;檢索系統
隨著醫院信息管理系統化的快速發展,醫院的醫用信息管理更加智能化和集成化,醫用信息管理涉及到病歷管理、藥品管理、醫療設備管理、醫院的資源管理、醫生管理等。醫用信息管理的種類較多,系統復雜度較高,對醫院的醫用信息管理是一項系統化工程。在云計算高度發展的今天,采用云計算信息處理方法進行海量醫用信息管理,能提高醫用信息管理的效率和計算速度,云計算環境下海量醫用信息檢索的軟件開發設計是保障醫院穩定和醫療機構穩定運行的關鍵,對海量醫用信息檢索系統的設計在促進醫療機構信息化發展方面具有重要意義。
云計算環境下的海量醫用信息檢索以嵌入式操作系統為基礎,通過系統移植可以實現ARM,PowerPC等多種硬件平臺的兼容運行[1,2],對海量醫用信息檢索系統的開發設計主要分為硬件設計和軟件設計兩大部分。本文在前期的硬件設計的基礎上,在云計算環境下,重點對系統的軟件模塊進行開發設計。傳統方法中,對海量醫用信息檢索的設計方法主要采用堆棧協議控制方法[3]、GPRS通信結構的數據庫訪問和檢索方法[4]、基于決策樹模型的醫用信息檢索方法等[5],上述方法通過構建海量醫用信息的本地數據庫,采用Excel和Access 技術實現醫用信息數據的智能化信息管理,在促進醫用信息的集成智能訪問和信息管理調度方面發揮了一定的作用。另外,采用Android嵌入式系統進行海量醫用數據信息檢索設計[6],具有便攜性能佳和人機交互性強的優點,但是上述方法存在的共同缺點是難以實現海量規模的醫用信息數據管理,需要在云計算環境下,對海量醫用信息進行大規模檢索和智能調度,提高醫療信息管理的集成智能控制能力。對此,本文提出一種云計算環境下的海量醫用信息檢索系統設計方法。首先進行醫用信息檢索系統的總體設計描述和功能模塊化分析,設計基于模糊C均值聚類的醫用信息檢索數據庫訪問算法,然后在嵌入式Linux環境下進行海量醫用信息檢索系統的軟件設計,系統設計包括用戶界面模塊、醫用信息處理模塊、可視化模塊和上位機網絡通信模塊等。采用交叉編譯方式進行程序加載和信息檢索控制,在云計算環境下實現信息編譯和數據存儲,最后完成海量醫用信息檢索系統的集成設計和系統調試,得出有效性結論。
1.1 系統的總體設計構架
傳統的醫用信息檢索系統大多數采用集中串行式檢索,造成信息檢索系統的覆蓋面有限,只能完成某一個領域的信息檢索。云計算作將單個的服務器連成了一個云,每個服務器都成為云中一個個節點。從而形成了一個檢索成本低、信息資源利用率高、檢索速度快的信息檢索系統。云計算采用一種名為云存儲的存儲方式,將網絡中各種存儲設備集合起來協同工作。云存儲不同于以前的存儲方式,其已由數據中心集管理。以前的數據通常存存置在數據信息提供者自己的服務器中,而云存儲提供商使用數據中心,向用戶提供數據存儲服務。
根據上述設計原理,構建醫用信息檢索系統的總體結構框圖如圖1所示。

圖1 云計算環境下海量醫用信息檢索系統總體設計結構框圖
首先分析海量醫用信息檢索總體設計構架并進行功能模塊組件分析和介紹。在云計算環境下,海量醫用信息檢索建立在通用計算機平臺上,為了滿足系統的兼容性,信息檢索系統安裝在Linux系統或者Windows系統上均可。在嵌入式Linux的內核結構中進行信息檢索系統的軟件開發和設計,進行海量醫用數據信息檢索的進程管理和文件配置[7]。在人機交互模塊,采用微機控制方法進行數據調度和信息輸出,結合嵌入式操作平臺,在云計算環境下進行醫用信息的實時調度和存取。
在海量醫用信息檢索設計中,通過CAN發送信息檢索的數據庫訪問和資源檢索調度程序,檢索系統的Linux內核由幾個重要的子系統組成,分別是醫用信息檢索的進程管理、寄存器的內存管理、檢索任務的文件系統、醫療設備管理、網絡系統管理等。檢索的進程管理主要完成醫用信息檢索任務的創建、中止和系統通信的任務,實現多線程管理和任務調度[8-10]。在kernel內核中通過創建Linux內核源碼實現對檢索系統終端的人機交互,在檢索系統的操作界面,系統使用Qt/Embedded作為GUI進行人機交互界面設計。根據上述總體設計,進行系統軟件開發。
1.2 構建醫用信息數據庫關聯指向性特征
基于云計算的醫用信息檢索系統中,采用的是分布式并行計算方式,即同一時間利用多個處理器來執行計算,提高了運算速度,能對大規模的海量數據進行運算處理。當用戶提出查詢要求,并將提問式提交給檢索代理,檢索代理將檢索提問式發送給了存在于云中的各個服務器,并對各個節點上的存儲服務器中的數據信息進行分析排序.得出相關度排在前列的服務器.并對這些存儲服務器進行并行分布式檢索,將檢索結果重新整合按相關度進行排序后傳到用戶檢索界面呈現在用戶面前.大大提高了檢索能力和檢索度。
為了實現對醫用信息檢索,核心是進行醫用信息的數據庫訪問調度,本文提出一種基于模糊C均值聚類的醫用信息檢索數據庫訪問算法。假設醫用信息數據庫的三層集成分布式存儲結構的數學模型,可表示為式(1)。

(2)

其中,單個檢索節點的約束參量輸入,為式(4):
(4)

(6)
(7)

(9)
通過模糊C均值聚類,對藥品信息、人員信息、財務信息和器械信息等進行準確檢索和召回的自相關函數,為式(10)。

其中,N為采樣的數據樣本數。
通過模糊C均值聚類,對醫用信息在數據庫中分布特征進行關聯指向性特征提取,構建醫用信息數據庫關聯指向性特征,分別為式(11)、(12)。

(12)
2.1 嵌入式Linux環境下數據處理
在上述進行云計算環境下海量醫用信息檢索系統的總體結構設計和提取醫用信息數據庫關聯指向性特征基礎上,在嵌入式Linux環境下進行系統的VXI總線數據采集和模塊化設計,利用Busybox的安裝腳本進行海量醫用信息檢索系統的工程管理應用程序開發,在程序開發之前,進行根文件系統配置,根文件系統配置過程描述,如圖2所示。

圖2 根文件系統配置過程
在嵌入式Linux環境下建立系統的開發環境,設計的子模塊主要包括用戶界面模塊、醫用信息處理模塊、可視化模塊和上位機網絡通信模塊等,調用VISA庫函數將海量醫用信息檢索SCPI命令寫入CPI驅動儀器,信息檢索系統的VXI總線數據采集模塊調用VISA庫函數vistatus=viWrite(instr, “MMEMory:TUNITx:OPEN”, 15, &retMMEMory:SESSion將命令寫入HP E1652E的通信寄存器單元,使用多個傳輸單元聯結一個或多個線程完成信息檢索,采用MVB總線控制技術使得數據的操作順序能實時地保存到命令子系統集中。在云計算環境下,構建實時數據記錄和流盤會話操作系統,建立VXI總線數據處理模塊,得到Linux開發環境下的系統配置和編譯過程描述為:
Busybox Settings --->
transfer data from a local bus VME bus to a specified session ---> [*]Data from SCSI disk /usr//使用VME總線數據傳輸的操作
VME address space (Busybox Target Data transmission port) --->//VME地址空間
(/home/Documents/nfs) start position address//從某個地址空間起始位置的偏移量
tar xvzf arm920t-eabi.tgz//輸入對=HP E1433A采集通道、觸發、數據傳輸端口的初始值。
假設TriggerSlope為正向觸發,調用函數設置hpe1432_setTriggerLevel,
在流盤序列中,通過VME總線或局部總線傳輸海量醫用信息數據,采用VXI總線數據處理技術進行海量醫用信息數據采集,通過上述構建的開發環境,設定SIC_IWR寄存執行數據庫訪問和信息調度,采用Make menuconfig 進行海量醫用信息檢索內核的配置,實現對信息檢索過程的進程管理。
2.2 軟件集成設計實現
海量醫用信息檢索系統的模塊化開發建立在云計算環境和嵌入式Linux環境下,利用132MB/s的PCI總線帶寬構建人機交互模塊和網絡通信模塊,初始化系統參考時鐘、觸發總線,在所需的信息檢索文件和可執行文件中建立根目錄在PXI機箱內執行文件系統配置和數據庫訪問程序的編譯,編譯代碼為:
class Bus data acquisition : public vpApp
{
public : HP E1562E () {}; //構造醫用信息檢索的可執行數據訪問函數
~myApp() {}; //系統配置
:initialize Documents (“Recognition using PXI” )// 采用PXI的系統10MHz時鐘
void Sampling frequency setting (Custom Internal time signal customization::Key key, int mod) //myApp類數據采集
private : //局部總線和觸發總線自定義變量
以Linux2.6.32內核為平臺,通過網線、232串口構建人機交互模塊,在/lib目錄下提供人機交互的內核,存儲器初始化模塊中采用多線程設計,生成一個rootfs.yaffs文件,設計海量醫用信息檢索系統的Linux設備驅動程序,在系統fliesystem的lib中建立海量醫用信息檢索系統的檢索中斷時鐘,中斷時鐘描述為:
#define File link_DYNAMIC 255 //中斷字設計
#define struct inode *inode "pwm"http://海量醫用信息檢索輸出文件名
int ret source install-qt ();
ret = s3c2440_adc_open() (&ADSP-BF537);// 添加一個CAN收發器
初始化靜態變量(static variables)和簡單的類(single classes),利用CAN總線聯網功能,在Windows 窗口下直接運行主程序,用匯編語言開發醫用信息處理模塊的控制程序,在上位機網絡通信模塊中,通過內核初始化和外設初始化設計,設定SIC_IWR寄存器進行醫用信息檢索輸出寄存,設定系統時鐘和內核時鐘的分頻數,為使編譯出來的可執行代碼能在ARM上運行,在海量醫用信息檢索系統的接口終端設定PLL_LOCKCNT寄存器,使用命令:
tarLinux PLL_LOCKCNTarm920t-eabi. SPORT0_TCLKDIV
配置串口0發送數據的時鐘頻率,運行命令:
#SPORT0_TFSDIV.Bashrc
編輯配置文件.Bashrc文件,串口發送時鐘后,產生幀同步脈沖,執行命令編譯:
export SPORT0_TCR2:/opt/#make ITFS /armarch/ CAN_ID0(8)/boot/bin
保存退出后,重新登錄系統,采用DMA0_IRQ_STATUS寄存器進行程序加載,構建海量醫用信息檢索系統的網絡通信模塊和接口模塊設計,采用交叉編譯方式進行程序加載和信息檢索控制,完成海量醫用信息檢索系統的集成設計。軟件實現過程,如圖3所示。

圖3 軟件實現流程
對本文設計的云計算環境下海量醫用信息檢索系統調試建立在Visual DSP++4.5環境下,VisualDSP++有一個集成開發環境IDDE,能有效實現對數據信息檢索系統的調試。實驗的硬件環境為:處理器Intel(R)Core(TM)2 Duo CPU 2.94GHz,內存:8.00GB。醫用信息數據庫訪問中對數據采樣的歸一化初始頻率Hz,終止頻率Hz,在信息檢索系統中數據傳輸的比特率為0.59 Bps/s,根據上述仿真環境和參數設定,進行系統調試和仿真實驗分析。系統調試中,使用數據召回率和信息檢索的時間開銷作為測試指標,在A/D采樣數據緩沖區完成海量醫用信息檢索系統控制信號的采集,在人機交互模塊實現數據的存儲與管理和系統調試波形的顯示,為了對比算法性能,采用本文設計方法和傳統方法,得到海量醫用信息檢索的數據召回率和計算開銷對比結果,如圖4和圖5所示。

圖4 數據召回性能對比
圖5 時間開銷對比
分析上述仿真結果得出,采用本文設計的醫用信息檢索系統,計算開銷較小,數據召回率較高,說明本文方法進行信息檢索在準確度和實時性方面具有優越性。
本文進行了云計算環境下的海量醫用信息檢索系統設計,提出一種基于模糊C均值聚類的醫用信息檢索數據庫訪問算法,并進行系統軟件開發設計。首先進行醫用信息檢索系統的總體設計描述,在嵌入式Linux環境下進行的海量醫用信息檢索系統的軟件設計,實現系統的軟件集成設計和組件模塊開發,系統調試和實驗結果表明,采用該檢索系統能提高對海量醫用信息的準確檢索能力,數據的召回率較高,在信息檢索在準確度和實時性方面優于傳統方法,展示了較高的應用價值。
[1] 楊照峰,王啟明,呂海蓮.基于任務延遲的云計算資源調度算法研究[J].計算機測量與控制,2014,22(2):499-502.
[2] 匡桂娟,曾國蓀.一種基于時分復用的云資源管理方法[J].同濟大學學報(自然科學版),2014,42(5):782-789.
[3] 林冬茂,薛德黔.一種基于無監督免疫優化分層的網絡入侵檢測算法[J].計算機科學,2013,40(3): 180-182.
[4] 周小娟.一種輕量級大數據分析系統的實現[J].電子設計工程,2016,24(8):40-43.
[5] 陸興華,吳恩燊 .基于安卓客戶端的智能家居電力控制優化設計[J].電力與能源,2015,35(5): 692-695.
[6] Mahboubi H, Moezzi K, Aghdam A G, et al. Distributed Deployment Algorithms for Improved Coverage in a Network of Wireless Mobile Sensors[J]. IEEE Transactions on Industrial Informatics, 2014, 10(1): 163-174.
[7] 謝洪安, 李棟, 蘇旸, 等. 基于聚類分析的可信網絡管理模型[J]. 計算機應用, 2016, 36(9): 2447-2451.
[8] GUBBI J, BUYYA R, MARUSIC S, et al. Internet of Things (IoT): a vision, architectural elements, and future directions [J]. Future Generation Computer Systems, 2013, 29(7): 1645-1660.
[9] 賀小云, 陳立新, 裴昌幸,等. 一種實用的多數據庫量子信息檢索協議[J]. 電子科技, 2015, 28(4):1-3.
[10] 王莉軍. 海量數據下的文本信息檢索算法仿真分析[J]. 計算機仿真, 2016, 33(4):55-60.
Design of Retrieval System for Massive Medical Information under the Cloud Environment
Chen Huangyu
(Nanjing General Hospital of Nanjing Military Region, PLA Nanjing, Nanjing 210002, China)
The traditional medical information retrieval systems exist many problems such as the accuracy is very low, the retrieving time cost is high. A new retrieval system for massive medical information is presented under cloud environment to solve these problems. The overall design framework is given. The design is based on fuzzy algorithm of C mean clustering, and the data processing module is loaded through program loading module. It uses the cross compiler to control program loading and information detection. The data compiling and storage are completed under the cloud environment. At last the system is integrated and adjusted. The experiment results show that the system improves greatly the retrieving accuracy under massive medical information environment with a low time cost and good detecting performance.
Cloud computing environment; Massive data; Medical information; Retrieval system
1007-757X(2016)12-0037-04
TP391
A
陳皇宇(1984-),女,漢族,海安,本科,技師,研究方向:病案管理,醫療信息管理,南京 210000
(2016.09.19)