趙媛媛, 雷建鋒, 王戰京
(首都醫科大學 中心實驗室, 北京 100069)
在臨床診療及教學科研中,使用醫學影像設備會獲得大量影像資料。根據不同的成像目的及選用的掃描序列,獲取的影像資料分為靜態圖像(如磁共振的T1、T2成像)或動態圖像(如心臟MRI成像、放射性藥物在體內動態分布的PET掃描、超聲心動圖等)。醫學圖像存儲和傳輸標準(Digital Imaging and Communications in Medicine,DICOM)是被醫療界廣泛接受、部署最為廣泛的醫療信息標準之一。醫學影像的靜態圖像通常保存為多幅單幀DICOM圖像文件,而動態圖像則保存為一個由連續多幀組成DICOM圖像文件。
隨著互聯網技術的飛速發展,通過網絡快速交流這些影像資料,滿足醫生及科研工作者遠程瀏覽影像、信息共享的需求,已經成為一種必然趨勢。但在通過互聯網實現DICOM圖像文件信息共享時會遇到以下3個問題:
(1) DICOM格式圖像無法直接在通用瀏覽器或看圖軟件中打開,而需要使用專用的影像工作站或安裝專用瀏覽軟件;如果醫生或科研工作者需要在醫院、實驗室等以外的場所觀看影像極為不便;
(2) 一次檢查產生的圖像文件,尤其是動態圖像,其容量達到幾百MB甚至幾千MB,在平均帶寬為10 Mbit/s的固網條件下,傳輸一個100 MB的文件也需要80 s左右,在移動網絡環境下更是數倍于以上的傳輸時間,在目前大多數網絡條件下無法實現在互聯網上的快速傳輸;
(3) 由于影像文件大,對提供在線瀏覽的Web服務器要求較高,需要配備大容量、高速度的存儲設備,增加了硬件購置和部署的成本。
為了解決大體積、連續多幀DICOM動態影像數據文件的遠程共享和在線瀏覽問題,開發了Web交互式瀏覽系統。本研究的實驗數據取自首都醫科大學中心實驗室。
DICOM是美國放射學會和美國電器制造商協會組織制定的一個統一標準,是目前醫療影像設備輸出數據共同遵從的圖像存儲格式和傳輸協議標準,該標準涵蓋了醫學數字圖像的采集、歸檔、通信、顯示及查詢等內容。
DICOM3.0是目前廣泛采用的版本,它最大的特點在于明確而詳細地提出了信息模型的概念。在一個DICOM圖像文件中可以包含一幀或多幀圖像。DICOM文件格式包含DICOM文件頭、成像相關信息及圖像像素數據等3部分內容[1]。其中DICOM3.0標準的第五部分定義了文件的數據結構[2],即所有DICOM圖像文件都是由引言(preamble),文件標識(DICM)和數據集(data set)構成;數據集由多個數據元素(data element)組成;而每個數據元素則由標簽(Tag)、數據描述(VR)、數據長度(VL)和數據域(Value)組成[3],如圖1所示。其中標簽作為數據元素的標識符,定義了數據元素由一組數字組成,如(0010,0010)為病人姓名[4-5]。對于本文需要實現的系統,重點需要解析的是DICOM文件中圖像格式的元數據標簽及圖像數據。

圖1 DICOM文件結構
動態圖像也稱為時變圖像,是時間連續的多幀圖像,反映目標隨著時間發生的連續、動態變化過程。通過互聯網進行遠程瀏覽時,醫生或研究人員往往希望看到連續播放的畫面,以觀看目標的動態變化。這就要求圖像加載速度快,并且能夠根據需要調整畫面播放速度,能夠對指定單幀圖像進行放大觀看,從而有利于診療和醫學科學研究。為滿足上述需求,本系統首先解析DICOM文件,然后采用視頻壓縮編碼、流媒體傳輸、HTML5等數字媒體和互聯網技術進行了系統設計和開發。
對于一個含有多幀連續圖像的DICOM動態影像文件,其圖像數據幀提取方法如下:
(1) 解析DICOM文件中的相關圖像標簽,讀取圖像的如下關鍵元數據信息:
(0028,0002):像素采樣,灰度圖均1,彩色圖為3;
(0028,0008):多幀圖像序列的總幀數;
(0028,0010):圖像高度;
(0028,0011):圖像寬度;
(0028,0100):像素位深度;
(0028,0101):像素的存儲位數;
(0028,0101):像素存儲的高位位置。
對于同一個序列中的所有圖像而言,上述標簽值都是相同的,只需要提取一次即可。
(2) 查找像素數據存儲的起始標識(7FE0, 0010)并定位,判斷圖像數據是否壓縮。
如果是無壓縮圖像,根據圖像分辨率,并結合每個像素的存儲位數計算出每幀圖像的大小,并依次讀取每一幀。
如果是壓縮圖像,每兩幀之間會有(FFFE,E000)的分隔符。需要指出的是,雖然目前部分設備在生成多幀DICOM圖像時已經進行了壓縮處理,但采取的方式都是對每一幀圖像采用jpeg方式獨立壓縮的,并未利用視頻壓縮中的幀間壓縮原理。這種壓縮方法只能將文件壓縮到原始文件的1/3左右,對于網絡傳輸來說文件依然太大。因此,以分隔符為界依次讀取每一幀圖像數據,并將每幀單獨壓縮的圖像解壓縮得到原始圖像數據,以進行后續處理。
經過以上兩步處理,將每一幀圖像以幀為單位從原始文件中提取出來。為了后續的顯示和處理,將所有幀的圖像按照時間戳順序依次保存為獨立文件。
在上述過程中,對圖像進行了歸一化處理[6]。因為不同設備生成DICOM圖像的像素點的位深度可能不同,如8 bit、10 bit或12 bit,位深度值越高,能表示的灰度越多,獲取的圖像細節也越多。但人眼對灰度分辨能力有限[7],并且灰度階越高,對顯示設備的要求也越高,對于超過256級灰度階的顯示,一般只有醫療影像專用的顯示設備才能支持。綜合考慮,本系統將灰度歸一化到[0—255]。將得到的歸一化像素值保存為PNG和YUV兩種格式。PNG是無損壓縮圖像格式,用于觀看原始圖像;而YUV則用于視頻壓縮處理,產生可以供用戶端點播的流媒體視頻文件。以上處理過程如圖2所示。
從DICOM文件提取出來的多幀YUV圖像文件是未經壓縮的數據,數據文件很大,例如一個分辨率為512像素×512像素、16位長度存儲的300幀冠脈造影文件,其數據量約為150 MB。如果對每一幀進行單獨壓縮編碼,其大小只能降為原來的1/3左右。因為這些按時間戳順序保存圖像之間有極大的事件相關性,非常適合采用視頻壓縮編碼算法對其進行壓縮[8]。

圖2 圖像數據幀提取流程圖
在視頻壓縮編碼算法的選擇上,目前常用的有H.254和H.265。其中H.265為正在興起的視頻壓縮算法,是壓縮比最高的標準算法,但是目前大多數瀏覽器軟件尚未全面實現對該算法的支持。而H.264算法已經得到了IE、Firefox、Safari、Opera等主流瀏覽器的直接支持;Chrome瀏覽器雖然不能直接支持,但是可以通過簡單的JavaScript程序實現支持。因為H.264也具有很高的壓縮比[9],因此本系統選用H.264算法進行圖像壓縮。為了盡可能保證壓縮后的每一幀畫面失真度最低,系統采用固定量化參數的方法,H.264的量化參數范圍為0~51,本文選取21,可以確保極低的失真度,用肉眼很難分辨其與原始圖像的差別[10]。
采用H.264算法對YUV數據進行壓縮后,可以達到25倍的壓縮比,即壓縮后的視頻文件在存儲和傳輸時所需帶寬降低為原來的1/25。圖3為一幅原始YUV圖像壓縮前后的圖像,用肉眼很難分辨出它們的差別。

圖3 原始圖像與壓縮圖像比較
本文采用峰值信噪比和結構相似性兩個參數計算失真度,并進行失真度的量化[11]。
2.3.1 峰值信噪比(PSNR)
該方法是一種全參考的圖像質量評價指標,是評價圖像壓縮前后失真度的客觀標準,其計算公式為
其中,MSE(mean square error)表示當前圖像X和參考圖像Y的均方誤差,H、W分別為圖像的高度和寬度,n為像素灰階數。PSNR的單位是dB,數值越大則失真越小,低于30 dB失真就很明顯,其典型比值一般為30~40 dB[12],超過40 dB可以認為失真很小,肉眼很難分辨解碼重建后的圖像與原始圖像之間的差異。
2.3.2 結構相似性(SSIM)
該指標也是一種全參考的圖像質量評價指標。與PSNR方法不同,它分別從亮度、對比度、結構3方面度量解碼重建后的圖像與原始圖像之間的相似性。計算公式如下:
SSIM(X,Y)=l(X,Y)·c(X,Y)·s(X,Y)
其中:
上述公式中μX、μY分別表示圖像X和Y的均值,σX、σY分別表示圖像X和Y的方差,σXY表示圖像X和Y的協方差,C1、C2、C3為常數。為了避免分母為0的情況,通常取C1=(K1×L)2, (C2=K2×L)2,C3=C2/2;一般地,K1=0.01,K2=0.03,L=255。
SSIM取值范圍為[0,1],值越大表示圖像失真越小,當SSIM=1時,表示這兩個圖像完全一致[13]。
2.3.3 PSNR與SSIM比較
在25倍壓縮比時,對4個動態DICOM圖像序列(分別取自小動物磁共振成像儀的心臟動態成像序列、小動物PET/CT/SPECT的放射性藥物在體內動態分布、小動物超聲心動序列、小動物超聲造影序列)進行圖像壓縮后再解碼,并計算每個序列解碼后圖像與原始圖像的PSNR和SSIM,其結果如表1所示。

表1 動態DICOM序列的PSNR及SSIM
PSNR計算了圖像之間像素灰度值的誤差值,但沒有考慮圖像結構信息之間的關系,對于圖像中有噪聲影響的情況評價較好。SSIM能夠反映提取的圖像感興趣區域中結構信息的差異,比較亮度和對比度對圖像質量的影響。從表1可以看出,壓縮引起的圖像變化很小,這與主觀判斷結果相一致。因此,經過壓縮的圖像可以作為生成視頻的圖像文件。
為了讓生成的視頻文件能夠邊下載、邊播放,而不是下載后才能觀看,需要對視頻文件進行流化處理、生成流媒體,以節約等待時間,提高工作效率和用戶體驗。
流媒體有多種格式,常見的有FLV、HLS和MP4格式。這3種格式的原理類似,播放時均無需下載整個視頻文件,而是一邊下載一邊播放[14]。本文選擇的主要依據是流媒體的格式對不同瀏覽器的適配性。
(1) FLV格式。由Adobe公司推出,需要在瀏覽器上安裝Flash插件才能播放。這一格式正逐漸被移動終端所使用的iOS和Android系統所替代。
(2) HLS格式。由美國蘋果公司推出的流媒體播放格式,對iOS系統和Android 4.4以上的系統都有很好的支持,但是在PC瀏覽器上并未得到廣泛的支持。
(3) MP4格式。是國際標準化組織(ISO)推出的標準流媒體播放格式,目前已經得到了幾乎所有PC和移動終端瀏覽器的支持,是適用性最好的一種流媒體格式。
經比較,本系統采用MP4格式對壓縮視頻進行流化處理,滿足用戶在線瀏覽的需求。
在某些情況下,圖像用于疾病診斷或需要針對圖像進行處理的時候,還需要能看到并獲取某些關鍵幀的原始圖像。在上述提取數據幀的過程中,已將動態影像的每一幀原始圖像都轉換為PNG格式文件,并給其標上幀的順序號。當在瀏覽器中觀看動態影像時,如需要觀看某一幀的原始圖像,可以暫停播放動態影像,點擊獲取原始圖像的按鈕,請求從服務器獲取對應的PNG圖像,瀏覽器將自動加載并顯示該圖像。
基于上述原理和處理流程,設計了一個交互式的多幀連續DICOM動態圖像瀏覽系統。該系統的基本結構如圖4所示。

圖4 交互式瀏覽系統結構
服務器端的主要任務是完成對原始DICOM文件的處理,在Web服務器上發布,以及響應客戶端的請求。服務器端主要包含以下組件:
(1) Web服務器:用于接收來自用戶端的請求并響應,如DICOM原始文件的上傳、流媒體文件點播、獲取PNG圖像等;
(2) 圖像處理服務器:用于對DICOM圖像進行處理,包括圖像數據幀提取、視頻壓縮、視頻文件流化處理等;
(3) 數據庫:用于保存所有的圖像數據,包括原始DICOM圖像,經過壓縮和流化處理后的MP4文件和單幀PNG文件。
服務器端處理流程如圖5所示。

圖5 服務器端的處理流程
用戶端可以使用標準瀏覽器訪問服務器,并通過部署在Web服務器上的網頁程序響應用戶的操作請求。當使用者點擊播放時,將正常播放動態影像,點擊暫停按鈕則畫面暫停;如果需要逐幀觀看影像,可以點擊步進或后退按鈕;如果需要觀看當前視頻畫面對應的未經壓縮圖像,可以點擊原圖按鈕,這時將在界面右側顯示未經壓縮的PNG圖像。
建立的基于DICOM標準的動態醫學圖像快速交互式瀏覽系統[15],使用戶不用額外添置設備和安裝軟件,即可使用普通計算機、平板電腦或手機在互聯網上
跨平臺、流暢地瀏覽動態DICOM影像,并可根據需要選擇并獲取原始DICOM圖像,解決了DICOM大文件傳輸慢、瀏覽等待時間長、需要專用終端瀏覽等問題;也可用于多幅單幀靜態DICOM圖像的遠程快速瀏覽。系統可用于遠程醫療、遠程會診、醫學影像的廣域共享以及遠程影像教學和研究[16-17]。
參考文獻(References)
[1] DICOM Standards Committee. Digital Imaging and Communications in Medicine (DICOM) Part 3: Information Object Definitions[S].USA: National Electrical Manufacturers Association,2017:161-164.
[2] DICOM Standards Committee. Digital Imaging and Communications in Medicine (DICOM) Part 5:Data Structures and Encoding[S].USA: National Electrical Manufacturers Association,2017:31-59.
[3] 許劍鋒,黃立勤,林強.DICOM全方向M型心動圖系統DICOM圖像解析方法研究[J].現代電子技術,2011,34(8):111-114.
[4] 費曉璐.醫學影像DICOM格式測試方法探討[J].中國醫學影像技術,2012,28(1):160-163.
[5] 趙媛媛,張進祿,陳大興,等.基于Matlab GUI的DICOM文件頭信息處理[J].中國醫學影像雜志,2012,28(11):2075-2078.
[6] 何洪林,劉英,李凱揚.多制式影像DICOM格式轉換的研究[J].醫療設備信息,2005,20(4):11-13.
[7] 于天河,戴景民.結合人眼視覺特性的紅外圖像增強新技術[J].紅外與激光工程,2008,37(6):951-954.
[8] 王晨希,王權,任海萍.DICOM醫學圖像壓縮技術的實現[J].中國醫療器械雜志,2013,37(3):178-181.
[9] 楊洋.基于MVC的立體視頻編解碼及播放系統的設計與實現[D].武漢:華中科技大學,2013.
[10] 褚江,陳強,楊曦晨.全參考圖像質量評價綜述[J].計算機應用研究,2014,31(1):13-22.
[11] 畢厚杰,王健.新一代視頻壓縮編碼標準:H.264/AVC[M].2版.北京:人民郵電出版,2009.
[12] 趙春蕾,戴明,孫麗娜,等.H.264/AVC碼率控制中初始量化參數的估計[J].光學精密工程,2014,22(9):2553-2564.
[13] 劉錦帆,徐浩煜,梁興東,等.基于HVS結構相似度的極化SAR圖像質量評價方法[J].國外電子測量技術,2015,34(11):19-26.
[14] 齊俊杰.流媒體技術入門與提高[M].2版.北京:國防工業出版社,2009.
[15] 梁仕昌.在線流媒體視頻播放系統設計及實現[D].廣州:華南理工大學,2016.
[16] 龔正.DICOM圖像實時獲取及遠程傳輸技術研究[D].南京:南京航空航天大學,2016.
[17] 聶澤花,尚珍.基于Web醫學影像的DICOM圖像應用[J].醫學信息學雜志,2016,37(12):42-46.