從音頻技術(shù)從單身轉(zhuǎn)換到立體聲像那時起,似乎有一些聽眾一直在追求最有沉浸感的聲像。四聲道、環(huán)境立體混合聲、杜比環(huán)繞聲、DTS和杜比數(shù)字的出現(xiàn)都是為了滿足為聽眾提供真正環(huán)繞的聽覺體驗的要求。
雖然早期開發(fā)只是對音頻,但沒過多久采用如Fantasound和Cinerama等的系統(tǒng),多聲道音頻就與電影聯(lián)姻,而電視廣播一直到上世紀(jì)80年代依然為單聲。
個人體驗
現(xiàn)在在消費電子產(chǎn)品商店,經(jīng)常可看到大屏幕電視配環(huán)繞聲系統(tǒng),但只是許多個人用藍(lán)牙音響系統(tǒng)和大量高端頭戴式耳機。事實上,環(huán)繞聲和沉浸式聲音的趨勢看來是朝向個人而不是共享體驗,這是由智能手機和手游系統(tǒng)所推動的。不過,這些裝置上消費的很多內(nèi)容依然來自媒體和廣播制作公司。
許多制造商很早就進入了沉浸式音頻領(lǐng)域,但現(xiàn)在隨著ATSC 3.0力圖把沉浸式引入廣播領(lǐng)域,AES提出了一個旨在確保沉浸式音頻傳輸系統(tǒng)采用相同的空間音頻信息交換文件格式的標(biāo)準(zhǔn)。
在我們考察此標(biāo)準(zhǔn)之前,需要注意的是此標(biāo)準(zhǔn)把雙耳聽音提升為沉浸式聽音的關(guān)鍵,這意味著此標(biāo)準(zhǔn)全都與頭部及其存在的空間(真實或仿真)有關(guān)。
雙耳錄音并不新鮮,典型的雙耳錄音方式是使用話筒置于雙耳上的仿真頭,目的是捕獲人類將聽到的音頻。遺憾的是,人類頭部本身是該聲學(xué)空間內(nèi)另一個客體,將自己修改我們聽到的音頻。
根據(jù)許多可變因素(包括我們的頭部在聲場相對于聲源的位置),聲源可能在稍有不同的時間、以不同的聲強和有點不一樣的頻率響應(yīng)(取決于我們頭部和雙耳的形狀)以及來自我們身體的反射/抵消,到達我們每只耳朵。
全在頭腦中
幸虧我們的大腦能夠?qū)W習(xí)和適應(yīng)我們的聽覺,以稱為頭部相關(guān)傳輸函數(shù)(HRTF)的響應(yīng)補償。HRTF在兩個脈沖響應(yīng):幫助我們定位聲源的頭部相關(guān)脈沖響應(yīng)(HRIR)和允許我們找到房間內(nèi)聲源的定向房間脈沖響應(yīng)(DRIR)的幫助下,是AES69的一個關(guān)鍵參數(shù)。
如同其它AES幫助,此標(biāo)準(zhǔn)建立在其它產(chǎn)業(yè)集團所在的工作上,而不是確立沖突的標(biāo)準(zhǔn)和不必要地白費力氣做重復(fù)工作。在這種情況下,工作基于ISO、ITU和IETF標(biāo)準(zhǔn),并把netCDF-4作為數(shù)據(jù)存儲格式。
此標(biāo)準(zhǔn)很大程度上依賴于音頻對象——游戲音頻領(lǐng)域的一個重要部分,它對廣播相當(dāng)新,而隨著我們越來越接近ATSC 3.0,將越來越多地看見它。AES69中的主要對象是
“聽眾”——可能包含無限數(shù)量的接收器;“聲源”——可能包含無限數(shù)量的發(fā)射器;以及“房間”。
在任何一個特定的AE$69文件中,只能有一個聽眾、一個源和一個房間。這些對象被置于兩個確定它們空間內(nèi)存在位置的坐標(biāo)系中。整體坐標(biāo)系允許空間內(nèi)源和聽眾布置,而每個源和聽眾在整體坐標(biāo)系內(nèi)有其自己的局部坐標(biāo)系,允許源內(nèi)發(fā)射器和聽眾內(nèi)接收器布置。
發(fā)射器和接收器的指向性圖在局部坐標(biāo)系內(nèi)確定。為幫助定向,定義了正交“View”(查看)和“Up”(向上)矢量,View在正x軸,而Up在正z軸。包含有一長串元數(shù)據(jù)參數(shù),提供一個定義變量及它們的特征的額外方式,并且提供關(guān)于文件內(nèi)數(shù)據(jù)的重要信息。
正如人們所料,聽眾、接收器、房間和房間類型在元數(shù)據(jù)參數(shù)內(nèi)描述,對外部應(yīng)用做出了規(guī)定,包括針對它們的要求之元數(shù)據(jù)。有效的房間類型為自由場、混響室、小屋和.dae(提供至3D應(yīng)用鏈路的數(shù)據(jù)交換文件)。全部信息存儲在一個帶.sofa(聲學(xué)空間導(dǎo)向格式)擴展的netCDF-4二進制數(shù)據(jù)文件內(nèi)。
雙耳音頻不是沒有問題和批評者。在某些雙耳錄音中源位置可能難以找到,側(cè)方向聲音最易確定,而前后方向聲音有時似乎在聽音位置本身。
幸運的是,AES69-2015內(nèi)眾多的參數(shù)以及內(nèi)建的擴展性,可能意味著此標(biāo)準(zhǔn)有足夠的廣度彌補雙耳聆聽的任何不足。
迄今為止我聆聽沉浸式格式的一個體驗是DTS的Headphone:X演示,那是一次非凡的經(jīng)歷。音頻源在演示間的音箱播放;然后我們被指示戴上耳機,音頻重復(fù)播放。
耳機音頻聽上去與來自音箱的幾乎相同,達到我們都把耳機取下以確信的程度。當(dāng)然,DTS人員有大量時間預(yù)先準(zhǔn)備,在我們到達前調(diào)整設(shè)置,但盡管如此結(jié)果令人印象非常深刻。
如果其它廠商的沉浸式系統(tǒng)也同樣令人印象深刻,并且AEE69-2015被用于系統(tǒng)間的交換,那么沉浸式音頻世界將變成一個非常激動人心的聆聽之地。