鄭 健
(哈爾濱醫科大學附屬第一醫院 信息中心,哈爾濱 150000)
基于模糊處理的醫療信息數據存儲系統的設計
鄭 健
(哈爾濱醫科大學附屬第一醫院 信息中心,哈爾濱 150000)
為了提高醫療技術水平,加快醫務人員對醫療信息數據的分析,使醫療信息數據運行更加順暢,減少數據存儲所占空間,需要對醫療信息數據存儲系統進行設計;當前的醫療信息數據存儲系統對醫療信息數據進行存儲時,利用FPGA構建系統硬件,以硬件為基礎將醫療信息數據存儲,但在存儲過程中,沒有將冗余數據清除,導致存儲空間易滿,容量變小,存在正常醫療信息數據無處安放的問題;為此,提出一種基于模糊處理的醫療信息數據存儲系統設計方法;該方法首先對醫療信息數據的來源進行統計,根據數據來源實現醫療數據的硬件構造,然后利用醫療信息數據中特征相似數據間的中介點實現數據聚類,完成對醫療信息數據的聚類存儲,最后采用高斯混合模型對冗余醫療數據進行特征分析,以分析結果為基礎,利用分數階Fourier變換對冗余醫療信息數據進行刪除操作,由此完成了基于模糊處理的醫療信息數據存儲;實驗結果證明,所提方法增加數據存儲空間容量,減少對冗余數據的存儲,加快醫療信息數據的存儲速度,提高數據存儲精度,為該領域研究發展提供強有力的依據。
模糊處理;醫療信息數據;存儲系統設計
目前,隨著互聯網水平和科學技術的發展,醫療信息數據在醫療屆的應用范圍廣泛,例如對醫院門診、骨科、內科、眼科等部門都有良好的輔助作用[1]。醫療信息數據不僅從側面提高醫院醫療水平,而且便于醫務人員從中發現醫療方面的不足和漏洞,并及時改正。隨著當前醫療信息數據逐漸增加,醫療信息數據的存儲受到了社會各界的高度重視和廣泛研究[2-3]。因為醫療信息數據具有復雜性較強、靈活度較高、數量較大,讀取時間較長等特性,所以需要對其存儲系統進行設計[4]。大多數的數據存儲系統對醫療信息數據進行存儲時,無法對其進行低損耗、低誤差、高精度、高效率地存儲,導致醫療信息數據存儲過程中,經常出現惡意數據泛濫、醫療數據來路不明、存儲用時較長的問題[5]。在這種情況下,如何提高醫療信息數據存儲速度,增加數據存儲的穩定性成為了當前急需解決的問題。基于模糊處理的醫療信息數據存儲系統設計方法,對醫療信息數據進行安全可靠地存儲,是解決上述問題的有效途徑[6]。此問題受到了醫療數據存儲系統研究人員的鉆研,同時也研究出了很多優秀的方法[7]。
文獻[8]提出了一種基于FPGA的醫療信息數據存儲系統設計方法。該方法首先利用Hadoop平臺,將醫療信息數據分割成大小相同的數據塊,然后通過多副本的形式將數據塊分布存儲在不同存儲系統位置,最后采用FPGA實現數據存儲系統更好的容錯機制,從而完成醫療信息數據持久化存儲。該方法下的醫療信息數據存儲更為持久,但是存在存儲時間較長的問題。文獻[9]提出了一種基于CC2530的醫療信息數據存儲系統設計方法。該方法首先利用數據采集模塊對醫療信息數據進行大規模的采集,然后將采集的數據經過濾波放大后,采用CC2530單機片實現數據傳輸,最后依據MicroSD卡的植入完成對醫療信息數據的存儲。該方法雖然用時較短,但是存在存儲效率偏差大的問題。文獻[10]提出了一種基于C51的醫療信息數據存儲系統設計方法。該方法首先利用FPGA作為存儲系統的控制芯片,然后以數據存儲芯片NANDFlash作為醫療信息數據的存儲媒介,采用A/D芯片對各種醫療信息數據進行轉換,最后將所有被轉換的醫療信息數據統一存儲至數據庫中。該方法下的數據存儲精度較高,但是過程過于繁瑣。
針對上述產生的問題,提出一種基于模糊處理的醫療信息數據存儲系統設計方法。該方法首先對醫療信息數據的來源做出了分析,以分析的結果為依據對醫療信息數據存儲系統的硬件進行構造,然后以硬件構造為基礎,利用MPI對醫療信息數據進行聚類,聚類過程中采用相似數據間的中介點將相似數據連接,從而實現數據的聚類存儲,最后依據對冗余醫療信息數據特征的分析,將冗余醫療信息數據刪除,實現了醫療信息數據的有序存儲,完成本文所提方法下的數據存儲系統設計。仿真實驗證明,所提方法可以低成本、高精度地對醫療信息數據進行存儲。
1.1 醫療信息數據存儲系統設計
由于醫療信息數據中本身存在惡意數據,而在醫療信息數據存儲過程中,惡意數據的來源很模糊,所以需要利用醫療信息數據來源模塊對其進行具體化的分類,分類操作有利于醫療信息數據的高效存儲。圖1為醫療信息數據來源結構示意圖。

圖1 醫療信息數據來源結構
通過圖1可以看出,醫療信息數據來源大致分為六塊:骨科信息數據、眼科信息數據、口腔科信息數據、內科信息數據、外科信息數據及其他醫療信息數據。當醫療信息數據進行存儲時,如果出現惡意數據,醫務人員通過數據來源模塊可以清晰地分辨出惡意數據來源,并及時做出處理。圖2是醫療信息數據存儲系統的構造。

圖2 醫療信息數據存儲系統設計
圖2中醫療信息數據存儲系統分為醫療信息數據聚類存儲和醫療冗余信息數據查詢,也就是按照冗余信息數據的特征辨別冗余數據存在,如若發現冗余數據便對其進行刪除操作,有利于節省醫療信息數據存儲系統的存儲空間。
1.2 醫療信息數據聚類存儲
以2.1中的各項信息數據為基礎,利用MPI對醫療信息數據進行聚類存儲,聚類存儲過程中依據醫療信息數據中特征相似數據間的中介點實現數據聚類,由此完成對醫療信息數據的聚類存儲。
假設,醫療信息數據網是M={E,K},式中,E代表醫療信息數據節點集合,K代表數據節點之間邊的集合。醫療信息數據節點代表數據存儲系統中的元素,數據節點之間的邊代表元素間的聯系。若將整個醫療信息數據庫當作由若干個社團構成,也就是由若干個特征相同的數據類構成,則社團內部的數據節點連接的比較緊湊,社團之間數據節點的連接較為稀疏。
假設x和y分別代表醫療信息數據網M中的兩個頂點,βx代表頂點的結構,F是E中的一個子集,且該子集不為空,α和δ分別代表醫療信息數據中的聚類對象,O代表滿足α和δ聚類的條件。則醫療信息數據網M中的頂點結構相似度為:

(1)
其中,κ(x,y)代表頂點x和頂點y間的相似度。如果醫療信息數據節點與該數據鄰居的頂點結構相似,則得到兩者的關系式為:
(2)
其中,Gα(x)代表與頂點x相似度大于等于α的鄰居數據集合。假設一個醫療信息數據節點有很多相似度大于等于α的鄰居數據節點,則該數據節點是社團核心節點,則核心節點的表達方式為:

(3)
其中,COREα,δ(x)代表醫療信息數據節點是數據對象α和δ核心節點的值。通過核心節點值對醫療信息數據進行聚類,聚類過程中利用特征相似數據間的中介點實現數據聚類,其公式可表示為:
HUBα,δ(x)?
(4)
其中,HUBα,δ(x)代表醫療信息數據中特征相似數據間的中介點值,式中,x不屬于任何團體,假設E中的醫療信息數據節點至少分布在兩個或者兩個以上的團體時,HUBα,δ(x)可以當做醫療信息數據聚類的中介點,本文不對醫療信息數據節點分布在兩個以下團體的情況做研究。由該中介點完成對醫療信息數據的聚類,將聚類后的數據有序的存儲至醫療信息數據庫中。
1.3 冗余醫療信息數據的查詢與刪除
要完成冗余醫療信息數據刪除,首先要對其進行查詢,冗余信息數據的特征分析可以使查詢效果更佳。本文利用高斯混合模型對冗余醫療數據進行特征分析,具體過程如下。
假設,將冗余醫療信息數據特征區間定義為:
lg(i,j,f)={D(i,j)/(216/f)}
(5)
其中,i代表冗余醫療信息數據特征數目,j代表冗余醫療信息數據特征區間數目,f代表對冗余醫療信息數據進行查詢時的控制參數,單位為h,實驗證明當此參數控制在0.07~0.08時,數據存儲效率最高。D代表刪除冗余醫療數據中一常數單位。
為了使冗余數據查詢結果更清晰,根據冗余醫療信息數據的特征區間,對冗余醫療信息數據特征集進行計算:
lgvv(i,j)=lgv(i,j)*sσf
(6)
其中,lgvv代表冗余醫療信息數據特征集閾值,lgv代表冗余醫療信息數據特征子集,s代表基于模糊處理存儲的濾波函數,sσf代表冗余醫療信息數據的特征核,由上式得到冗余醫療信息數據的特征配置為:
pi(f)=qi(f)+ki(f)
(7)
其中,p代表冗余醫療信息數據的特征配置,q代表冗余數據查詢質量,k代表冗余醫療信息數據的特征配置系數,以冗余醫療信息數據特征配置為基礎,假設冗余數據刪除過程中,刪除干擾值z(f)為0時,則以此配置為中心,得到冗余數據特征的展開結果:
(8)
其中,a代表冗余數據特征的展開值,由式(8)可知冗余醫療信息數據特征展開結果為驗證醫療信息數據庫內的醫療信息數據,是否為冗余數據的驗證指標,通過對醫療信息數據特征展開結果的壓縮處理,獲得冗余數據壓縮特征編碼。為了避免習慣性對冗余醫療信息數據刪除的影響,對該特征編碼進行量化分解,其計算方式為:
(9)
其中,Rn代表數據特征編碼量化分解值,利用量化分解的結果完成對冗余醫療信息數據的分析,當Rn≥1時,則正在進行驗證的醫療信息數據為冗余數據,直接刪除;當Rn<1時,則正在進行驗證的醫療信息數據不是冗余數據,可直接進行存儲,由冗余醫療信息數據的特征分析過程完成冗余數據的查詢。
以上述結果為依據,采用分數階Fourier變換對冗余醫療信息數據進行刪除操作。具體過程如下。
設置冗余醫療信息數據的訓練樣本集S=[S1,S2,…,Si,…,SC]Y,在基于模糊處理的醫療信息數據存儲環境中,為了保障醫療信息數據正常存儲的可靠性,必須得到存儲系統中冗余醫療信息數據流的離散分數階Fourier逆變換值,該值的表示方式為:
b=N-φ×S
(10)

(11)
其中,ι代表醫院客戶端點的醫療信息數據寬帶,η代表冗余醫療信息數據重構時延,以上述結果為依據,利用分數階Fourier變換法得到冗余醫療信息數據流刪除函數:
Uk=[uk1,uk2,…,ukj,…uki]
(12)
其中,Uk代表冗余醫療信息數據流刪除函數,u代表冗余醫療信息數據流刪除函數中的函數子集,綜上分析,采用3階累積量切片,將醫療信息數據劃分為若干個塊,根據冗余醫療信息數據特征的分析,對每個數據塊中的冗余數據進行徹底刪除。
為了證明基于模糊處理的醫療信息數據存儲系統設計方法的可實踐性,需要進行一次仿真實驗。在Linux的環境下搭建醫療信息數據存儲實驗仿真平臺。實驗數據取自于北京解放軍醫院總部的醫療信息數據存儲系統,利用本文所提方法對實驗數據進行存儲,由此觀察其整體有效性。表1為在數量相同的醫療信息數據下,文獻[8]所提方法、文獻[9]所提方法和文獻[10]所提方法與本文所提方法,醫療信息數據存儲時間(s)的對比。

表1 不同方法下數據存儲時間的對比
通過對表1的分析,文獻[8]、文獻[9]、文獻[10]所提方法與本文所提方法,在醫療信息數據量相同的情況下,本文所提方法存儲所用時間遠遠低于文獻所提方法,相比較之下,文獻[10]所提方法與本文所提方法存儲時間相差最大,這主要是因為利用本文方法進行數據存儲時,對冗余醫療信息數據進行了刪除操作,節省了存儲時間,提高了存儲精度,證明了本文所提方法的可行性較強。表2是文獻[8]所提方法與本文所提方法,冗余醫療信息數據刪除時間(s)的對比。
分析表2可知,本文所提方法在冗余醫療信息數據刪除方面明顯優于文獻[8]所提方法,冗余醫療信息數據的刪除,直接影響到數據的存儲效率和時間,刪除的越快,表示存儲系統的整體性能越好,本文所提方法在刪除冗余醫療信息數據時,先利用高斯混合模型對冗余數據特征進行了透徹的分析,然后采用分數階Fourier變換對冗余醫療信息數據進行刪除,此步驟加快了數據存儲速度。圖3為冗余醫療信息數據查詢的控制參數f取值范圍對數據存儲效率(%)的影響。

表2 不同方法下冗余醫療信息數據刪除時間對比

圖3 冗余數據查詢的控制參數對存儲效率的影響
從圖3中可以看出,冗余醫療信息數據查詢的控制參數f取值范圍對醫療信息數據的存儲效率有很大影響,當冗余數據查詢控制參數在0.05~0.06時,醫療信息數據存儲效率曲線雖然比較平穩,但存儲效率并不高,在80%以下,與之相比當冗余數據查詢控制參數在0.07~0.08時,數據存儲效率明顯升高,基本處于97%~98%,該數據進一步證明了本文所提方法具有良好的可行性和可靠性。圖4是文獻[8]、文獻[9]、文獻[10]所提方法與本文所提方法數據聚類時間(s)對比。

圖4 不同方法下數據聚類時間對比
由圖4可知,文獻[8]、文獻[9]、文獻[10]所提方法與本文所提方法在數據聚類時間上,都是隨著數據量的增加而持續增長的,在相同數據量聚類時,本文所提方法所用時間明顯較短,因為基于模糊處理的醫療信息數據存儲系統設計方法中,利用了MPI對醫療信息數據進行聚類存儲,節省了數據聚類時間,提高了醫療信息數據存儲精度,為數據存儲領域的后續發展指明了方向。
仿真實驗證明,所提方法可以安全可靠地對醫療信息數據進行存儲,減少了醫療信息數據存儲時間,提高了醫務人員對醫療信息數據漏洞的分析能力,降低冗余數據對醫療信息數據存儲系統的干擾,為醫療界的發展提供可靠依據,對數據存儲系統設計領域有重要的借鑒意義。
采用當前方法對醫療信息數據進行存儲時,無法對其進行高精度、低誤差、穩定可靠地存儲,存在數據存儲空間易滿,存儲系統運行有延遲,數據存儲效率低等問題。本文提出一種基于模糊處理的醫療信息數據存儲系統設計方法。并通過實驗仿真證明,所提方法可以高效率地對醫療信息數據進行存儲,可行性較強,對醫務人員醫術的提高起到了輔助作用,為該領域的深造鉆研提供支撐,成為該領域發展的重要旗幟。
[1]張 琳,譚 軍,白明澤.基于MongoDB的蛋白質組學大數據存儲系統設計[J].計算機應用,2016,36(S1):232-236.
[2]陳亭玉,錢 慧.嵌入無損編碼的海量視頻數據存儲系統設計[J].電視技術,2016,40(4):52-55.
[3]姜 德,馬游春,王悅凱,等.高速數據同步存儲系統設計[J].電子器件,2016,39(6):1421-1424.
[4]姜學東,孫海民.大數據存儲中的優化架構結構的設計與實現[J].現代電子技術,2016,39(24):66-70.
[5]王善明,嚴迎建,郭朋飛,等.基于國產SOC的數據加密存儲系統設計[J].電子技術應用,2015,41(11):34-37.
[6]任瑩暉,紀會敏,杜 勇,等.切削刀具綜合管理系統的數據采集和存儲設計研究[J].計算機應用研究,2016,33(10):3031-3035.
[7]劉博偉,黃瑞章.基于HBase的金融時序數據存儲系統[J].中國科技論文,2016,11(20):2387-2392.
[8]雷德龍,郭殿升,陳崇成,等.基于MongoDB的矢量空間數據云存儲與處理系統[J].地球信息科學學報,2014,16(4):507-516.
[9]李金猛.基于FPGA的數據采集存儲系統的設計與實現[J].電子設計工程,2016,24(13):85-87.
[10]胡曉峰,張亮紅,劉文怡,等.VC多線程流水線在數據存儲系統中的設計與實現[J].電子器件,2016,39(4):964-967.
Based on Fuzzy Processing of Medical Information Data Storage System Design
Zheng Jian
(First Affiliated Hospital of Harbin Medical University Information Centre,Harbin 150000,China)
In order to improve the level of medical technology, speed up the medical staff of medical information data analysis, the medical information data run more smoothly, reduce the data storage of space, need for medical information data storage system design. The current medical information data storage system of medical information data for storage, use FPGA to build the system hardware, on the basis of the hardware to medical information data storage, but in the process of storage, there is no clear the redundant data, leading to storage space is full, smaller capacity, has the problem of the normal medical information data is placed. For this, put forward a kind of medical information data storage system based on fuzzy processing design method. This method first source of health information data statistics, according to the data source to realize the hardware structure of medical data, then use mediation between the characteristics of medical information data in the similar data points for data clustering, clustering of medical information data storage, and finally by using the gaussian mixture model to analyzing characteristics of medical data redundancy, on the basis of the analysis results, using fractional Fourier transform to delete redundant medical information data, thus complete the medical information data storage based on fuzzy processing. The experimental results show that the proposed method increases the data storage capacity, reduces the redundant data storage, to speed up the medical information data storage, improved the precision of data storage, the research in the field development provides a strong basis.
blurred; medical information data; storage system design;
2017-04-11;
2017-04-21。
鄭 健(1988-),男,黑龍江哈爾濱人,初級工程師,主要從事網絡安全方向的研究。
1671-4598(2017)07-0298-04
10.16526/j.cnki.11-4762/tp.2017.07.074
TP333
A