劉 越,章文輝
(中國(guó)傳媒大學(xué) 信息工程學(xué)院,北京 100024)
隨著全國(guó)高清頻道數(shù)量的不斷增多和相關(guān)政策的發(fā)布,人們已經(jīng)完全迎來了高清時(shí)代。高清視頻無疑帶來了更逼真的視覺享受,如何獲得更高的聽覺享受,也將逐漸成為另一研究課題。
數(shù)字音頻數(shù)據(jù)流可以通過電纜線單獨(dú)傳輸,也可嵌入在數(shù)字視頻SDI流每一行的HBI(行逆程)中的輔助數(shù)據(jù)空間中傳輸。數(shù)字視頻嵌入音頻,并非單獨(dú)傳輸音頻數(shù)據(jù),而是將音頻數(shù)據(jù)按照一定格式封裝成數(shù)據(jù)包,在視頻信號(hào)的輔助數(shù)據(jù)空間內(nèi)傳輸。這樣不僅解決了視頻、音頻不同步的問題,也大大節(jié)省了傳輸路線和裝配成本。但是,對(duì)于電視臺(tái)、影像公司、電影制作公司等傳媒公司,常常需要單獨(dú)對(duì)數(shù)字音頻進(jìn)行監(jiān)控和測(cè)量。所以,如何實(shí)現(xiàn)嵌入數(shù)字音頻的解嵌和分析,也得到越來越多的關(guān)注。
鑒于上述問題,筆者設(shè)計(jì)了基于SMPTE299M標(biāo)準(zhǔn)的HDTV嵌入數(shù)字音頻分析軟件。突破傳統(tǒng)基于硬件的系統(tǒng)設(shè)計(jì),采用軟件從HD-SDI抓包文件中提取出一幀音頻數(shù)據(jù),實(shí)現(xiàn)非實(shí)時(shí)分析和檢測(cè),對(duì)系統(tǒng)測(cè)試、理論研究、實(shí)踐教學(xué)有著重要意義。
AES/EBU數(shù)字音頻接口標(biāo)準(zhǔn)規(guī)定,音頻數(shù)據(jù)以2的補(bǔ)碼進(jìn)行編碼,接口可以對(duì)取樣頻率為48 kHz、44.1 kHz和32 kHz,量化比特?cái)?shù)為24,20和16的數(shù)字音頻信號(hào)進(jìn)行實(shí)時(shí)傳輸,并提供輔助信息。
數(shù)字聲音的數(shù)據(jù)按照幀劃分,每個(gè)數(shù)據(jù)幀(frame)為64 bit,分為兩個(gè)子幀,即Sub-frame 1和Sub-frame 2。每個(gè)子幀中的前4 bit為前置碼,用于子幀、幀和塊的同步和識(shí)別。每個(gè)子幀的后4 bit(V,U,C,P)為輔助數(shù)據(jù),各比特位所代表的功能如表1所示[1-4]。

表1 輔助數(shù)據(jù)[5]
每192個(gè)音頻幀(frame)構(gòu)成1個(gè)音頻塊(block)。有3種前置碼X,Y和Z,Z標(biāo)志每個(gè)音頻塊的開始。每個(gè)音頻塊中,除了第1個(gè)音頻幀的Sub-frame 1的前置碼用Z標(biāo)識(shí)外,其余各幀的Sub-frame 1的前置碼都為X;所有Sub-frame 2的前置碼都用Y表示[6]。AES/EBU音頻與音頻數(shù)據(jù)包之間的關(guān)系如圖1所示。

高清隔行掃描行、場(chǎng)定時(shí)關(guān)系如圖2所示。

高清隔行掃描系統(tǒng),每幀圖像共1125 行。有效視頻區(qū)1080 行,數(shù)字場(chǎng)消隱區(qū)45行。其中,第21~560行為第1場(chǎng)有效視頻區(qū),第584~1123 為第2場(chǎng)有效視頻區(qū);第1124 行、1125 行和l~20行為第1場(chǎng)數(shù)字場(chǎng)消隱區(qū),第561~583行為第2場(chǎng)數(shù)字消隱區(qū)。
HD-SDI信號(hào)里,除了有效視頻信號(hào)之外,在視頻信號(hào)消隱區(qū)里還包含其他信息[8],如有效視頻的起始點(diǎn)SAV和終止點(diǎn)EAV、行數(shù)信息LN、冗余校驗(yàn)碼CRC、輔助數(shù)據(jù)ANC等信息。數(shù)字音頻信號(hào)嵌入在分量數(shù)字視頻格式有效行的輔助數(shù)據(jù)區(qū)中。行消隱期間的取樣708個(gè)取樣字,在標(biāo)準(zhǔn)中用“SAV”和“EAV”予以界定。音頻信號(hào)嵌入在輔助數(shù)據(jù)ANC內(nèi)[7]。
HD-SDI即高清串行數(shù)字接口,用于傳輸高清視頻。HD-SDI信號(hào)由亮度數(shù)據(jù)流和兩個(gè)色差數(shù)據(jù)流復(fù)用而成,針對(duì)4∶2∶2的樣點(diǎn)結(jié)構(gòu),亮度信號(hào)取樣頻率為13.5 MHz,兩個(gè)色差信號(hào)取樣頻率為6.75 MHz,以10 bit進(jìn)行量化,所以基本碼率為1485 Mbit/s。其數(shù)據(jù)流結(jié)構(gòu)如圖3所示(T為取樣周期)。

嵌入到視頻數(shù)據(jù)中的音頻包有2種:音頻控制包(Audio Control Packet,ACP)、音頻數(shù)據(jù)包(Audio Data Packet,ADP)[9]。高清音頻數(shù)據(jù)包支持24位,不存在音頻擴(kuò)展包。音頻數(shù)據(jù)包的長(zhǎng)度是固定的,且每個(gè)包只包含每個(gè)音頻組中4個(gè)通道的各1個(gè)音頻數(shù)據(jù)。高清音頻數(shù)據(jù)包中還包含一些額外的數(shù)據(jù)和糾錯(cuò)數(shù)據(jù)。
音頻數(shù)據(jù)包只在色差數(shù)據(jù)流(Cb/Cr)的行附屬數(shù)據(jù)空間傳輸。在由源視頻格式定義的切換點(diǎn)之后的一行所在的附屬數(shù)據(jù)空間內(nèi),不插入音頻數(shù)據(jù)包。音頻數(shù)據(jù)包結(jié)構(gòu)如圖4所示,由附屬數(shù)據(jù)標(biāo)志(ADF)、數(shù)據(jù)標(biāo)志符(DID)、數(shù)據(jù)塊序號(hào)(DBN)、數(shù)據(jù)計(jì)數(shù)(DC)、用戶數(shù)據(jù)字(UDW)及校驗(yàn)和(CS)組成[6]。

每4個(gè)音頻數(shù)據(jù)構(gòu)成1個(gè)音頻組,每個(gè)音頻組都對(duì)應(yīng)1個(gè)音頻控制包。1個(gè)給定的音頻組中的全部音頻通道應(yīng)具有相同的取樣頻率、取樣相位和同步/異步狀態(tài),這些控制信息都包含在音頻控制包內(nèi)。
音頻控制包應(yīng)當(dāng)每場(chǎng)傳輸一次,因?yàn)楦粜袙呙?場(chǎng)為一幀,所以每幀HD-SDI傳輸2次音頻控制包。音頻控制包在Y并行數(shù)據(jù)流視頻切換點(diǎn)(Video Switching Point)之后第二行的行附屬數(shù)據(jù)空間內(nèi)傳輸。音頻數(shù)據(jù)包結(jié)構(gòu)如圖5所示,由附屬數(shù)據(jù)標(biāo)志(ADF)、數(shù)據(jù)標(biāo)志符(DID)、數(shù)據(jù)塊序號(hào)(DBN)、數(shù)據(jù)計(jì)數(shù)(DC)、用戶數(shù)據(jù)字(UDW)、校驗(yàn)和(CS)組成[6]。

軟件設(shè)計(jì)的系統(tǒng)框圖如圖6所示。大體分為3部分:音頻控制包和音頻數(shù)據(jù)包的提取;音頻控制包和音頻數(shù)據(jù)包格式的分析;音頻數(shù)據(jù)的提取和取補(bǔ)[9]。

為驗(yàn)證本文所述分析的可行性,按照?qǐng)D6所示的流程,利用C語言編程實(shí)現(xiàn)。數(shù)據(jù)源采用一幀HD-SDI抓包文件,成功實(shí)現(xiàn)分析任意行音頻數(shù)據(jù)包和音頻控制包的格式,取出音頻個(gè)數(shù)、采樣頻率和嵌入的音頻通道數(shù)。實(shí)驗(yàn)結(jié)果如圖7所示。

HD-SDI數(shù)據(jù)量很大,1幀畫面有400多萬個(gè)數(shù)據(jù)。限于軟件處理速度,該實(shí)驗(yàn)采取實(shí)時(shí)讀取、分析的設(shè)計(jì)思路。每讀取一行便分析一行,對(duì)需要的數(shù)據(jù)進(jìn)行處理、顯示、存儲(chǔ),不需要的數(shù)據(jù)則直接跳過。音頻數(shù)據(jù)包和音頻控制包以附屬數(shù)據(jù)標(biāo)志(ADF)即000,3FF,3FF為標(biāo)志。音頻數(shù)據(jù)包嵌入在輔助數(shù)據(jù)空間中,所以編程實(shí)現(xiàn)直接跳過有效視頻區(qū)。音頻控制包只嵌入在視頻切換點(diǎn)之后的第2行的行附屬數(shù)據(jù)空間。以1125 /50/2∶1系統(tǒng)為例,切換點(diǎn)在第7行及第659行,所以只需在Y并行流的第9行及第571行的行附屬數(shù)據(jù)空間內(nèi)尋找音頻控制包。同時(shí),實(shí)驗(yàn)采用多線程技術(shù),以提高效率。
本文提出的基于SMPTE299的HD-SDI嵌入音頻分析軟件實(shí)現(xiàn)簡(jiǎn)單,通用性強(qiáng)。隨著高清數(shù)字廣播電視的逐步發(fā)展和高清電視的不斷普及,對(duì)嵌入音頻的分析和研究,也將占據(jù)越來越重要的地位。雖然限于軟件的處理速度,只能進(jìn)行靜態(tài)分析,但其對(duì)理論研究、實(shí)驗(yàn)教學(xué)、系統(tǒng)測(cè)試都具有重要意義,對(duì)于高清數(shù)字電視的發(fā)展與變革也有一定推動(dòng)作用。
[1]王明臣,姜秀華,張永輝.數(shù)字電視與高清晰度電視[M].北京:中國(guó)廣播電視出版社,2003.
[2]姜秀華,張永輝.數(shù)字電視廣播原理與應(yīng)用[M].北京:人民郵電出版社,2007.
[3]Society of Motion Picture and Television Engineers.SMPTE292M-1998 Bit-Serial digital interface for high-definition television systems[S].1998.
[4]國(guó)家廣播電影電視總局.GY/T 162-2000高清晰度電視串行接口中作為附屬數(shù)據(jù)信號(hào)的24比特?cái)?shù)字音頻格式[S].2000.
[5]SMPTE.ANSI/SMPTE 299M-199724 -Bit digital audio format for hdtv bit-serial interface[S].1997.
[6]HARDING P,SHERRATT R,GUY C.Convergence of standard defi?nition(SD)and high definition(HD)SDI for audio multiplexing and de-multiplexing by implementing modular design[C]//Proc.2004 IEEE International Symposium on Consumer Electronics.[S.l.]:IEEE Press,2004:541-544.
[7]姜秀華,柴劍平,林正豹,等.現(xiàn)代電視原理[M].北京:高等教育出版社,2008.
[8]李寧.HD-SDI信號(hào)的特征及檢測(cè)方法的提案[J].現(xiàn)代電視技術(shù),2004,(8):35-42.
[9]謝元祿,張春,王志華.基于SMPTE272M標(biāo)準(zhǔn)的音頻加解嵌系統(tǒng)設(shè)計(jì)[J].電視技術(shù),2008,32(7):10-23.