摘 要:在基于H.264的空間分辨率轉碼中,原有的宏塊類型不再適用,從而需要重新選擇。提出了一種快速的宏塊類型選擇方案,適用于基于H.264的任意比例因子的空間分辨率轉碼。由于任意比例因子的空間分辨率轉碼中,待編碼幀中的宏塊無法與已編碼幀的宏塊邊界對齊,提出了影射塊和覆蓋塊的概念,根據縮放因子的大小,在基于塊統計和基于像素統計之間作出調整,從而在保證壓縮性能的同時,盡可能地降低了運算復雜度。在幀間模式選擇部分,對SKIP類型的選擇進行了分析,提出SKIP類型的選擇與已編碼幀中SKIP類型的比例有關,并給出了解決方法。最后針對各種測試序列,并組合了多個圖像縮放因子,進行了大量的實驗。在幀內模式選擇部分,與全搜索法相比,在保證PSNR損失不超過0.1 dB的前提下,方法的速度能提高約3.5倍;在幀間模式選擇部分,與全搜索法相比,在保證PSNR損失不超過1.0 dB的前提下,本方法的速度能提高約30倍。
關鍵詞:視頻轉碼; H.264; 宏塊類型; 空間分辨率
中圖分類號:TP391.14文獻標志碼:A
文章編號:1001-3695(2010)06-2359-05
doi:10.3969/j.issn.10013695.2010.06.104
Fast macroblock mode decision for arbitrary downsizing videotranscoder based on H.264
WANG Yu1, ZHANG Caiming1,2
(1.School of Computer Science Technology, Shandong Economic University, Jinan 250014,China; 2.School of Computer Science Technology, Shandong University, Jinan 250014, China)
Abstract:In spatial resolution transcoder based on H.264, the preencoded macroblock modes are not suitable anymore. This paper proposed a fast macroblock mode decision method in arbitrary downsizing video transcoder based on H.264.In spatial resolution transcoder with arbitrary factor, the responding area in preencoded frames for macroblocks to be reencoded was not aligned with the boundary of macroblock. It proposed the concepts of mapping block and covering block. To reduce the computation complexity, method based on blocks or based on pixels was adopted according to different downsizing factor. In interprediction mode decision part, analyzed SKIP mode specially. The percentage of SKIP mode in preencoded frame was considered in the proposed scheme to decide SKIP mode in frame to be reencoded. It compared the PSNR performance and computation complexity of proposed method with the full search algorithm by extensive experiments. For the intraframe mode decision part, the proposal achieves about 3.5 times improvement in computation complexity comparing to full search algorithm while the maximum PSNR is degraded by about 0.1 dB. For the interframe mode decision part, the proposal achieves about 30 times improvement in computation complexity while the maximum PSNR is degraded by about 1.0 dB.
Key words:video transcoder; H.264; macroblock mode; spatial resolution
0 引言
視頻的應用環境非常復雜,從傳輸的信道、存儲介質到播放終端等都各不相同。視頻轉碼技術可以將高分辨率下的比特流轉換到低分辨率下,從而滿足了不同應用環境之間的互相轉換。視頻轉碼最容易實現的方式是將輸入比特流完全解碼,然后根據輸出格式的要求進行重新編碼(即像素域的級聯轉碼, cascaded pixeldomain transcoding),顯然該方法也是運算復雜度最高的方法。為了提高重新編碼速度,在視頻轉碼中就需要充分利用解碼得到的信息。視頻轉碼技術通常分為空間分辨率轉碼[1~13]、時間分辨率轉碼[14,15]和圖像質量轉碼三部分。
在空間分辨率轉碼中,圖像縮放因子可分為整數比例[2~6]和任意比例[7~11]兩種。例如,當比例因子為1/2時,待編碼幀(縮放后的圖像)的一個宏塊對應著已編碼幀(轉碼系統的輸入幀,即高分辨率下的數據)的四個宏塊,因此需要將四個宏塊的運動矢量合并到一個宏塊中。常用的方法有任選其一[1]、選擇最大直流系數殘差[24]、選擇最多方向的運動矢量[16]、平均值[1]、中間值[1,16]等;在任意比例因子情況下,當前幀中一個宏塊對應到原始圖像中的區域通常會疊加到幾個宏塊上,而且宏塊邊界不會完全對齊,這時常用的運動矢量合并方法有加權平均[6,7,12]、加權中間值[10,12]等,常見的權重為運動矢量所占的圖像面積或所占圖像的殘差能量等。
相比于MPEG2、H.263等視頻編碼標準,為取得較高的壓縮性能,H.264使用的技術之一就是各種宏塊類型(包含變塊大小的運動預測)。如何選擇宏塊類型,是H.264編碼器中最主要的耗時部分,也是基于H.264的視頻編碼的研究熱點之一。在視頻轉碼中同樣需要為待編碼幀的宏塊重新選擇類型[2~5,17~23]。文獻[19~21]就針對MPEG2到H.264的轉碼,對宏塊類型的選擇提出了各種不同的解決方案。在文獻[4]提出的空間分辨率轉碼中,宏塊類型的選擇是基于常見的RD曲線的最小化代價函數的準則。首先為每種宏塊類型計算各自的初始運動矢量,這些初始運動矢量用來計算RD代價,并選擇具有最小代價的宏塊類型。另外,在計算RD代價前,會根據初始運動矢量的性質決定是否跳過某些宏塊類型。
本文在文獻[3]的基礎上,提出了一種快速的宏塊類型選擇方法,該方法基于H.264的任意比例因子的空間分辨率轉碼。本文方法包括幀內模式選擇和幀間模式選擇兩部分,輸入的比特流需要完全解碼,在重新編碼階段充分利用了解碼得到的信息,從而提高了編碼速度。由于在任意比例因子的空間分辨率轉碼中,待編碼幀中的宏塊無法與已編碼幀的宏塊邊界對齊,本文提出了影射塊和覆蓋塊的概念,根據縮放因子的大小,在基于塊統計和基于像素統計之間作出調整。
1 幀內/幀間宏塊類型
1.1 幀內宏塊類型
在H.264的幀內模式中,宏塊的亮度分量可以使用I4MB、I8×8、I16MB三種類型。其中I8×8僅使用在FREXT(fidelity range extensions)中,本文不對其進行討論。如果宏塊使用了I4MB類型,整個宏塊將被劃分成16個4×4的塊,每個4×4的塊有各自的預測模式。圖 1給出了一個4×4的塊(像素:a、b、c、…、n、o、p)及其相鄰像素(X、A、B、…、K、L),圖 2給出了各種亮度預測模式。
如果宏塊使用I16MB類型,則整個宏塊會使用同一個預測模式。針對I16MB類型,H.264提供了四種幀內預測模式,它們分別是豎直、水平 、DC和PLANE模式。另外,色度分量具有與I16MB宏塊相同的幀內預測模式,不同之處在于色度分量在H.264基本層(baseline profile)中的尺寸為8×8。
1.2 幀間宏塊類型
H.264中使用了變塊大小的運動預測,宏塊可以劃分為16×16(P16×16)、16×8(P16×8)、8×16(P8×16)和8×8(P8×8);如果使用P8×8的宏塊類型,則每個8×8的塊還可以進一步劃分為8×4、4×8或4×4,如圖3所示。另外,H.264還使用了SKIP宏塊類型,該類型比較適用于運動非常平穩的區域。
在H.264中,I幀僅使用幀內預測宏塊類型(I4MB或I16MB),P幀則可能會用到所有的宏塊類型(I4MB、I16MB、SKIP、P16×16、P16×8、P8×16、P8×8等)。本文在后續章節將對幀內模式選擇和幀間模式選擇分別進行討論。
2 任意縮放因子時的宏塊影射關系
在空間分辨率轉碼中,如果圖像縮放因子為整數,則每個待編碼幀的宏塊(本文簡稱為當前宏塊)都對應著已編碼幀的若干個宏塊,文獻 [3]已經重點分析了縮放因子為2的情況。但是,如果圖像縮放因子為任意比例,則當前宏塊所對應的已編碼幀中的宏塊不再簡單的是若干個宏塊。如圖 4所示,(b)是某個當前宏塊,它在已編碼幀中所對應的區域為圖 (a)中所示陰影部分(本文簡稱為影射塊)。按圖中所示,一個當前宏塊所對應的影射塊涉及到了9個已編碼的宏塊(總體尺寸為48×48),并且覆蓋的每個宏塊的區域不盡相同,如果在為當前宏塊選擇類型時,統計這9個宏塊的所有信息,則有些并沒有覆蓋到的區域會被統計進來,顯然是不合適的。由于基于H.264中宏塊類型的最小單位為4×4子塊,本文定義影射塊所涉及到的已編碼幀中所有4×4子塊為覆蓋塊,如圖 4(a)中黑色點劃線所圍區域。同樣,針對當前宏塊每個4×4子塊,如圖4(b)中左上角灰色區域,其在已編碼幀中同樣存在影射塊,即(a)中左上角的灰色區域,則相應的覆蓋塊為圖4(a)中的所示陰影部分。
假設所使用的圖像縮放因子在水平和豎直方向上分別為Nx/Mx和Ny/My,則當前宏塊在已編碼幀中的影射塊的水平和豎直尺寸分別為16×Nx/Mx,16×Ny/My。同樣,4×4塊在已編碼幀中的影射塊的水平和豎直尺寸分別為4×Nx/Mx,4×Ny/My。
3 幀內模式選擇
圖 5為當前宏塊幀內模式選擇的流程。
在圖 5所示的流程圖中,影射塊中的像素類型和塊類型表示在已編碼幀中像素或4×4塊所在宏塊的類型(I4MB或I16MB)。本文使用影射塊(覆蓋塊)中的像素類型(塊類型)來決定當前宏塊的類型(I4MB或I16MB),并選擇兩者中超過半數的作為當前宏塊的預測類型。
隨著縮放因子的減小,每個宏塊的影射塊面積逐漸增大,由于縮放后的圖像尺寸很小,整體編碼時間相對減少,如果仍以像素為單位來統計影射塊中的類型,勢必會造成統計塊類型的時間占用比例過大,從而造成整體的編碼效率過低。另外,當影射塊面積較大時,覆蓋塊與影射塊面積相差不大,兩者的統計結果也就會非常相近,進而對編碼效果影響不大。因此,在本文中,如果圖像縮放因子小于某個閾值TH_FACTOR時,統計塊類型時就使用基于塊的方式,否則基于像素統計塊類型,從而在壓縮性能和運算復雜度間取得平衡。
如果選擇的宏塊類型是I16MB,在本文中以SAD(預測值和參考值間差值的絕對值的和,sum of absolute difference)為準則測試四種候選預測模式,并選擇具有最小SAD的預測模式;如果選擇的宏塊類型是I4MB,整個宏塊將被分成16個4×4的子塊,每個子塊最多有九種候選預測模式,如圖 2所示。因此需要針對每個4×4塊,統計其在已編碼幀中的影射塊(覆蓋塊)的所有預測模式并進行測試,選擇其中預測殘差最小的模式。該過程與文獻[3]中提出的方法相同。
色度分量預測模式的選擇與I16MB類似,測試H.264中允許的四種色度預測方式,選擇其中預測殘差最小的模式。
4 幀間模式選擇
整個當前宏塊的幀間模式選擇的流程如圖 6所示。
在幀間模式選擇中,基于塊統計和基于像素統計宏塊類型的區別與幀內模式選擇相同。在模式選擇過程中,如果統計超過半數的像素(塊)為I16MB或I4MB(Is_INTRA),則使用類型I16MB或I4MB,而對I16MB或I4MB的幀內預測模式的選擇,則與第1章所述的幀內模式選擇方法相同(Encode_INTRA)。
4.1 SKIP類型的選擇
SKIP類型對應著運動非常平緩的區域,如果根據一定條件可以提前選定SKIP類型,會節省大量的計算時間。通過大量實驗發現,當前宏塊選擇SKIP類型的概率與已解碼幀中SKIP類型宏塊的比例有一定關系。圖 7給出了部分具有不同SKIP比例的序列的實驗結果,每個序列名稱下面的百分比表示當前序列已編碼幀中SKIP類型的比例,如“akiyo”序列84.38%的宏塊都使用SKIP類型。實驗中使用的縮放因子為1/2。因此,每個當前宏塊對應著已編碼幀的4個宏塊,而且這4個宏塊中SKIP類型宏塊的個數可能值為0、1、2、3、4。在待編碼幀中使用全搜索法選擇最優的宏塊類型后,對應這5個值,可以分別得到待編碼幀的宏塊取SKIP類型的概率。如圖 7所示,縱坐標為使用SKIP類型的概率,橫坐標為各種測試序列,圖中skip=x, x=0,1,2,3,4表示當前宏塊對應已編碼幀的4個宏塊的為SKIP類型的個數。例如,當已編碼幀中4個宏塊均為SKIP類型時(skip=4的型條),序列“akiyo”中當前宏塊使用SKIP類型的概率近100%,而序列“football”中當前宏塊使用SKIP類型的概率僅為10%左右。因此,由結果可以看出,如果已編碼序列中SKIP類型的宏塊比例較低時,即使當前宏塊所對應的所有覆蓋塊都是SKIP類型,當前宏塊使用SKIP類型的可能性也很小。
根據上述統計規律,下面給出本文選用SKIP類型的偽代碼(以縮放因子為1/2為例):
if(SKIP_percent > HIGH_SKIP)
{
if(num_SKIP > 0.5)選擇為SKIP類型;
else從P16×16,P16×8,P8×16,P8×8中選擇最佳類型
}
else if (SKIP_percent >LOW_SKIP)
{
if(num_SKIP = 1.0)選擇SKIP類型;
else 從P16×16,P16×8,P8×16,P8×8中選擇最佳類型
}
else從P16×16,P16×8,P8×16,P8×8中選擇最佳類型
在上述代碼中,SKIP_percent表示已編碼幀的SKIP類型宏塊比例;num_SKIP為覆蓋塊(影射塊)中SKIP類型塊的比例;HIGH_SKIPS和LOW_SKIPS為兩個閾值,區分已編碼幀的SKIP類型宏塊比例,本文分別取為50% 和15%。
4.2 運動矢量的計算和修正
本文從P16×16、P16×8、P8×16和P8×8中選擇最佳類型時使用殘差作為判斷依據,在計算殘差前,需要為每種類型計算初始運動矢量,計算方法如下:
假設覆蓋塊中所有4×4塊的運動矢量為{mvij, (0≤i P8×8塊:mv8×8mn = MEDIAN(mvij i,j 在8×8塊的覆蓋塊)m,n = 0,1,2,3 P16×8塊:mv16×8mn=MEDIAN(mvij i,j在16×8塊的覆蓋塊)m,n = 0,1 P8×16塊:mv8×16mn=MEDIAN(mvij i,j在8×16塊的覆蓋塊)m,n = 0,1 P16×16塊:mv16×16=MEDIAN(mv8×8mn, m,n =0,1,2,3 ) 為每種宏塊類型計算出初始運動矢量后,計算每種類型下的殘差數據,并選擇其中預測殘差最小的類型。如果最優的宏塊類型不是P8×8,則對初始運動矢量進行修正時步長為2個像素;如果最后的宏塊類型是P8×8,則針對每個8×8的塊進一步進行類型選擇。首先計算每個子類型下的初始運動矢量(P8×4、P4×8、P4×4),進一步計算預測殘差,并選擇預測殘差最小的類型,并且最后運動矢量的修正步長為3個像素。在上述計算初始運動矢量時,如果覆蓋塊中存在I4MB或I16MB類型,則運動矢量使用預測值。 5 實驗結果 在下面的實驗中,輸入的原始圖像尺寸為CIF(352×288),幀率為30 fps,輸入/輸出的量化參數均為28。圖像縮放因子分別為:Nx=Ny=5,Mx=My=6和Nx=Ny=1,Mx=My=2和Nx=Ny=5,Mx=My=7三種情況。閾值TH_FACTOR=3/8=0.375。圖像經過縮放,如果得到圖像尺寸不是16的倍數,則自動擴展邊界以使其為16的倍數。輸入的原始圖像由常用的H.264參考軟件JM12.1編碼。符號“FULL”表示使用全搜索法重新進行宏塊類型選擇得到的結果,“FAST”代表本文提出的方法。整個轉碼系統所消耗的時間包括解碼、降低圖像尺寸和重新編碼三部分,由于本文討論的內容集中在重新編碼部分,這里沒有給出前兩部分時間消耗。“Reencoder”表示整個重新編碼過程總的耗時;由于本文的方法與全搜索法的差別是選擇宏塊類型,為此本文單獨比較了兩者在選擇宏塊類型上的耗時,用“mode decision”表示,實驗給出的數據為相比于全搜索法本文方法所能提高的倍數。 5.1 幀內模式選擇實驗 在下面的實驗中,測試序列中所有幀都使用幀內預測模式。表1~3給出了各種縮放因子下的壓縮性能與全搜索法的比較結果,表4則給出了運算復雜度的比較。 表1 壓縮性能比較 (N=5,M=6, 目標圖像尺寸304×240) 序列 PSNR/dB FASTFULLΔdB bitrate/kbps FASTFULLΔkbps/% akiyo40.8340.92-0.091020.8973.84.83 garden36.1536.15+0.003902.83785.23.11 mobile35.1835.20-0.024918.04733.63.90 stefan36.5036.52-0.023232.83105.34.11 tempete36.1836.20-0.023116.82987.24.34 mthrdotr40.4740.50-0.03981.1958.62.35 container38.3638.40-0.041673.81613.05.6 coastguard36.5536.56-0.012181.72082.84.75 表2 壓縮性能比較 (N=1,M=2, 圖像尺寸 176×144) 序列 PSNR/dB FASTFULLΔdB bitrate/kbps FASTFULLΔkbps/% akiyo38.82238.761+0.06657.4626.54.93 garden35.58235.574+0.012014.81968.02.38 mobile34.32034.320+0.002740.72705.01.32 stefan35.49035.495+0.001815.21785.41.67 tempete35.00535.017-0.011740.61701.52.30 mthrdotr38.56838.644-0.08614.9585.35.06 container37.02537.049-0.02984.8939.14.87 coastguard34.96534.963+0.001255.41228.42.20 表3 壓縮性能比較 (N=2,M=7, 圖像尺寸112×96) 序列 PSNR/dB FASTFULLΔdB bitrate/kbps FASTFULLΔkbps/% akiyo38.19238.131+0.06336.4326.03.19 garden36.02136.019+0.00780.7745.54.72 mobile34.72234.776-0.051080.01047.33.12 stefan35.93935.988-0.05730.5697.44.75 tempete35.31935.353-0.03733.0709.43.33 mthrdotr38.21038.258-0.05278.3266.24.55 container36.74336.750-0.01420.3403.34.22 coastguard35.04935.143-0.09499.1479.34.13 表4 時間消耗比較 序列 N=5,M=6 reencodermodedecision N=1,M=2 reencodermodedecision N=2,M=7 reencodermodedecision akiyo1.563.451.473.921.302.26 garden1.393.901.273.451.192.70 mobile1.293.361.264.181.162.44 stefan1.383.601.314.231.222.64 tempete1.373.531.293.761.192.65 mthrdotr1.594.131.433.571.292.72 container1.483.751.424.161.252.67 coastguard1.4113.571.384.281.292.51 根據多個序列的實驗結果,相比于全搜索法,本文方法的最大PSNR損失不到0.1 dB,同時比特率增加量最大約5%。在運算復雜度方面,本文方法的總體編碼速度能提高約1.3倍,而選擇宏塊類型的速度可以提高約3.5倍。隨著縮放因子的降低,待編碼幀的尺寸也在減小,因此統計已編碼幀的數據所消耗的時間占用比例加大,本文方法所能提高的倍數也有所降低。例如,比例因子為N=5,M=6時,總體編碼速度和選擇宏塊類型速度可以提高約1.4倍和3.7倍;比例因子為N=2,M=7時,總體編碼速度和選擇宏塊類型速度可以提高約1.2倍和2.6倍。 5.2 幀間模式選擇實驗 在下面的實驗中,測試序列中只有第一幀使用幀內預測模式,其余幀均使用幀間預測模式。其余條件及符號均與幀內模式選擇實驗相同。 表5 壓縮性能比較(N=5,M=6, 圖像尺寸304×240) 序列 PSNR/dB FASTFULLΔdB bitrate/kbps FASTFULLΔkbps/% akiyo39.98740.367-0.3854.352.33.82 garden34.82434.858-0.031063.0997.56.57 mobile33.77533.835-0.061231.31169.05.33 stefan34.74335.396-0.65892.6836.06.77 tempete34.88634.964-0.08826.6775.66.58 mthrdotr39.34239.556-0.2190.685.65.84 container36.87337.022-0.15120.9116.24.04 coastguard35.27635.302-0.03583.3553.95.31 表6 壓縮性能比較(N=1,M=2, 圖像尺寸 176×144) 序列 PSNR/dB FASTFULLΔdB bitrate/kbps FASTFULLΔkbps/% akiyo37.59437.831-0.2446.445.61.75 garden33.59933.739-0.141037.21028.80.82 mobile32.64232.436+0.211464.11454.30.67 stefan33.05633.683-0.63880.7839.94.86 tempete32.46033.228-0.77680.5644.45.60 mthrdotr36.77236.865-0.0956.456.9-0.88 container35.39235.401-0.01111.6112.5-0.80 coastguard33.36733.376-0.01433.4420.23.14 表7 壓縮性能比較 (N=2,M=7, 圖像尺寸112×96) 序列 PSNR/dB FASTFULLΔdB bitrate/kbps FASTFULLΔkbps/% akiyo36.89036.911-0.0226.825.35.93 garden33.85133.929-0.08569.6545.34.46 mobile33.17732.772+0.41655.3620.75.57 stefan33.87034.052-0.18446.1419.66.32 tempete33.36333.428-0.06346.9335.23.49 mthrdotr35.85935.979-0.1237.137.10.00 container35.54135.536+0.0045.745.8-0.22 coastguard33.60333.606+0.00220.5216.41.89 表8 時間消耗比較 序列 N=5,M=6 reencodermodedecision N=1,M=2 reencodermodedecision N=2,M=7 reencodermodedecision akiyo24.8175.0321.4456.447.409.68 garden16.4532.3714.0928.709.2713.23 mobile19.5938.8115.1033.928.1912.14 stefan17.9335.3214.6428.197.7310.61 tempete18.1734.3514.6627.417.8410.69 mthrdotr20.3543.0617.5932.176.668.26 container22.2745.0818.6135.595.887.06 coastguard19.9634.9417.1930.068.6711.28 根據幀間模式選擇的實驗結果,相比于全搜索法,本文方法的最大PSNR損失不到1.0 dB,同時比特率增加量最大約7%。在運算復雜度方面,本文方法的總體編碼速度能提高約14.8倍,而選擇宏塊類型的速度可以提高約30倍。與幀內模式選擇相同,隨著縮放因子的降低,本文方法所能提高的倍數也有所降低。例如,比例因子為N=5,M=6時,總體編碼速度和選擇宏塊類型速度可以提高約19.9和42.4倍;比例因子為N=2,M=7時,總體編碼速度和選擇宏塊類型速度可以提高約7.7和10.4倍。 6 結束語 在基于H.264的空間分辨率轉碼中,需要為降低尺寸后圖像中的宏塊重新選擇類型。本文提出了一種快速的宏塊類型選擇方法,該方法適用于任意比例因子的圖像縮放。本文方法包含了幀內模式和幀間模式選擇兩部分,分析了任意比例因子時宏塊間的影射關系,并提出了影射塊和覆蓋塊的概念;同時根據縮放因子的大小,能在基于塊統計和基于像素統計間作出調整,從而降低了運算復雜度。在幀間模式選擇部分,本文分析了SKIP類型的選擇,根據實驗結果呈現的特征,提出了基于已編碼幀SKIP類型的比例來控制待編碼幀的SKIP類型的選擇;另外本文還提出了一種初始運動矢量的計算和修正方法。最后大量的實驗結果表明,與全搜索法相比,在壓縮性能相差不大的前提下,本文提出的方法可以大幅度地提高宏塊類型選擇的速度,從而提高重新編碼的速度。 在本文提出的方法中,不支持圖像質量的轉碼,即量化步長不變。在后續的研究中,可以探討重新指定量化步長時進行宏塊類型的選擇。另外,很多研究人員已經提出了基于H.264的快速幀內/幀間模式選擇的方法[25],在下一步的研究中,可以探討如何將這些選擇方法應用到轉碼系統中。 參考文獻: [1]BJORK N, CHRISTOPOULO C. Transcoder architectures for video coding[J]. IEEE Trans on Consumer Electronics, 1998, 44(1):88-98. [2]SHEN Huifen, SUN Xiaoyan, WU Feng, et al. A fast downsizing video transcoder for H.264/AVC with ratedistortion optimal mode decision[C]//Proc of IEEE ICME. 2006:2017-2020. [3]LIU Zhaoguang, PENG Yuhua. A video transcoder scheme based on H.264[J]. Acta Electronical Sinica, 2008, 36(5):848-851. [4]LI Chihung, WANG Chungneng, CHIANG Tihao. A fast downsizing video transcoder based on H.264/AVC standard[C]//Proc of PCM. 2004:215-223. [5]FUNG K T, SIU W C. Diversity and importance measures for video downscaling[C]//Proc of IEEE ICASSP. 2005:1061-1064. [6]SHEN Bo, SETHI S K, VASUDEV B. Adaptive motionvector resampling for compressed video downscaling[J]. IEEE Trans on Circuits and System for Video Technology, 1999, 9(6):929-936. [7]LIANG Yongqing, CHAU L P, TAN Y P. Arbitrary downsizing video transcoding using fast motion vector reestimation[J]. IEEE Letters Signal Processing, 2002, 9(11):352-355. [8]SHU Haiyan, CHAU L P. A resizing algorithm with twostage realization for DCTbased transcoding[J]. IEEE Trans on Circuits and System for Video Technology, 2007, 17(2):248-253. [9]SALAZAR C, TRAN T D. A complexity scalable universal DCT domain image resizing algorithm[J]. IEEE Trans on Circuits and System for Video Technology, 2007, 17(4):495-499. [10]TAN Y P, SUN Haiwei. Fast motion reestimation for arbitrary downsizing video transcoding using H.264/AVC standard[J]. IEEE Trans on Consumer Electronics, 2004, 50(3):887-894. [11]KUMAR R, PATIL V. An efficient motion vector composition scheme for arbitrary frame downsampling video transcoder[J]. IEEE Trans on Circuits and System for Video Technology, 2006, 16(9):1148-1152. [12]XIN Jun, SUN Mingting, CHOI B S, et al. An HDTVtoSDTV spatial transcoder[J]. IEEE Trans on Circuits and System for Video Technology, 2002, 12(11):998-1008. [13]FUNG K T, SIU W C. DCTbased video downscaling transcoder using split and merge technique[J]. IEEE Trans on Image Processing, 2006, 15(2):394-403. [14]FUNG K T, CHAN Y L, SIU W C. New architecture for dynamic frameskipping transcoder[J]. IEEE Trans on Image Processing, 2002,11(8):886-900. [15]CHEN Meijuan, CHU Mingchung, PAN C W. Efficient motionestimation algorithm for reduced framerate video transcoder[J]. IEEE Trans on Circuits and System for Video Technology, 2002, 12(4): 269-275. [16]SHANABLEH T, GHANBARI M. Heterogeneous video transcoding to lower spatiotemporal resolutions and different encoding formats[J]. IEEE Trans on Multimedia, 2000, 2(2):101-110. [17]HUR J H, KWON H K, LEE Y L. H.264/AVC baseline profile to MPEG4 visual simple profile transcoding to reduce the spatial resolution[J]. Wiley International Journal of Imaging System and Technology, 2006, 16(1):24-33. [18]BULL D L D, CANAGARAJAH N, REDMILL D. An efficient complexityscalable video transcoder with mode refinement[J]. Signal Processing:Image Communication, 2007,22(4):421-433. [19]FERNNDEZESCRIBANO G, CUENCA P, ORIACOBARBOSA L, et al. A fast intraframe prediction algorithm for MPEG2/H.264 video transcoders[C]//Proc of IEEE ICIP. 2005:684687. [20]TANG Qiang, NASIOPOULOS P, WARD R K. Compensation of requantization and interpolation errors in MPEG2 to H.264 transcoding[J]. IEEE Trans on Circuits and System for Video Technology, 2008,18(3):314-325. [21]FERNNDEZESCRIBANO G, KALVA H, CUENCA P, et al. A fast MB mode decision algorithm for MPEG2 to H.264 PFrame transcoding[J]. IEEE Trans on Circuits and System for Video Technology, 2008, 18(3):314-325. [22]FERNNDEZESCRIBANO G, KALVA H, CUENCA P, et al. A first approach to speedingup the inter mode selection in MPEG2/H.264 transcoders using machine learning[J]. Springer Multimedia Tools and Application, 2007, 35(2):225-240. [23]KIM S E, HAN J K, KIM J G. Efficient motion estimation algorithmfor MPEG4 to H.264 transcoder[C]//Proc of IEEE ICIP. 2005:656-659. [24]AHMAD I, WEI Xiaohui, SUN Yu, et al. Video transcoding: an overview of various techniques and research issues[J]. IEEE Trans on Multimedia, 2005, 7(5): 793-804. [25]KUO T Y, CHAN Chenhung. Fast variable block size motion estimation for H.264 using likelihood and correlation of motion field[J]. IEEE Trans on Circuits and System for Video Technology, 2006,16(10):1185-1195. [26]KIM J H, KIM B G. Fast block mode decision algorithm in H.264/AVC video coding[J]. Journal of Visual Communication and Image Representation, 2008, 19(3):175-183. [27]TSAI A C, PAUL A, WANG Jiaching, et al. Intensity gradient technique for efficient intraprediction in H.264/AVC[J]. IEEE Trans on Circuits and System for Video Technology, 2008, 18(5):694-698. [28]SHEN Huifeng, SUN Xiaoyan, WU Feng. Fast H.264/MPEG4 AVC transcoding using powerspectrum based ratedistortion optimization[J]. IEEE Trans on Circuits and System for Video Technology, 2008,18(6):746-755. [29]SHEN Bo. Perfect requantization for video transcoding[J]. Springer Multimedia Tools and Application, 2007, 35(2):163-173.