999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于人工混響的聲源空間距離恢復模型

2015-12-20 06:58:58張茂勝
計算機工程與設計 2015年9期
關鍵詞:信號

王 櫻,張茂勝,姜 林

(武漢大學 計算機學院 國家多媒體軟件工程技術研究中心,湖北 武漢430070)

0 引 言

現有的3D (three diminutions)視頻技術雖然已經能為觀眾提供較好的視覺體驗,但3D 音頻技術相對滯后,目前市面銷售的產品主要是沿用原有的立體聲或環繞聲技術。用戶若想達到身臨其境的視聽感受,必須要有與3D 視頻內容同步的3D 聲場聽覺效果,這使得3D 音頻技術迎來了前所未有的發展機遇。法國電信在動態圖像專家 (moving pictures experts group,MPEG)會 議 上 對3D 音 頻 給 出 了明確的定義[1],根據法國電信對3D 音頻的定義,與傳統立體聲或環繞聲相比,3D 音頻技術更注重為聽音者提供更好的聲源方向感和距離感。目前基于耳機回放的3D 音頻實現技術主要有德國波鴻大學Jens Blauert提出的頭相關傳輸函數(head related transfer function,HRTF),該函數真實地模擬出聲波從聲源傳輸到雙耳的整個過程,是一個與個體體征相關的物理量。HRTF 通常在消音室中通過測量人工頭或者真人雙耳內接收到的沖激信號獲得[2]。國內外的相關機構紛紛對HRTF進行了實際測量:Algazi對45個真人進行測量,得到了CIPIC的HRTF庫,該庫包含了25個不同水平角和50個不同高度角的1250個位置的HRTF;謝菠蓀等通過對52名受試者進行測量,建立了中國人樣本的高空間分辨率的HRTF以及受試者生理尺寸的數據庫,上述工作主要是針對遠場 (聲源距離大于1 m)固定距離條件下對HRTF進行測量;龔枚等采用人工頭對多個距離的HRTF進行了測量,建立了高空間分辨率的近場頭相關傳輸函數數據庫。實驗測量方法獲得的HRTF 數據距離恢復的效果雖然精確,但是實驗過程十分繁瑣,人力和時間成本很高[3]。針對HRTF存在的不足,本文在HRTF恢復方向的前提下,提出了一種空間距離恢復模型,在該模型中,采用人工混響的方法模擬3D 視頻中聲源所在環境的混響,結合人耳距離感知機理控制音頻信號對聲源進行距離恢復,得到與3D 視頻空間信息相匹配的3D 音頻,然后通過耳機進行回放。實驗結果表明,該方法可以實現聲源距離的恢復,恢復效果與采用最新的多距離HRTF 庫時相當,且存儲需求更低,實現起來更簡單,實用性更強。

1 基于人工混響的空間距離恢復模型

基于人工混響的空間距離恢復模型結構框架如圖1所示。

圖1 基于人工混響的空間距離恢復模型結構框架

該模型主要由距離感知模塊,最佳混響時間模塊,人工混響模塊3個模塊構成。首先,將3D 視頻場景中已知聲源所在空間體積V 和聲源類型輸入到最佳混響時間模塊,通過體積V 和聲源類型確定模擬房間的最佳混響時間T60,將得到的最佳混響時T60間分別輸入到距離感知模塊和人工混響模塊中;然后,距離感知模塊根據輸入的聲源距離信息和最佳混響時間T60,計算得到恢復距離時所需的直混能量比 (direct-to-reverberation ratio,DRR),將DRR 輸入到人工混響模塊中;最后,人工混響模塊根據輸入的DRR 和T60對輸入的立體聲信號SDirect分別對左右聲道進行處理,最終將攜帶聲源距離信息的3D 音頻信號SOut輸出,輸出的信號通過耳機進行回放。每個模塊具體介紹如下所示。

1.1 距離感知模塊

杜倫大學的Jonathan S.Berry指出[4],影響距離感知的因素主要有聲音的強度、DRR、頻譜和雙耳差異 (時間差和強度差)。從人耳感知角度來說,房間反射在人耳對距離的感知中起著至關重要的作用。在現實真實房間中,當聲源與聽音者之間的距離增加時,聲音的強度和DRR 會隨之減小,當聲源距離增加一倍時,人耳接收到的強度會減少6dB,但聲音的強度線索主要應用于無混響無反射的理想環境中,此外,頻譜和雙耳線索容易受到墻面、空氣等的影響。因此,包含強度信息的DRR 相較于其它距離感知線索,能為聽音者提供更準確的聲源距離信息。

赫爾辛基理工大學的Sampo于2009年提出了DRR 與聲源距離關系模型[5]

則式 (1)簡化為

其中,r為人耳感知聲源的距離,rc為臨界距離 (或稱為混響半徑,V 為房間體積,T60為混響時間,在rc處直達聲與混響聲的能量相等),臨界距離是房間的屬性,與聲源無關。DRR 表示聽音點處直達聲與混響聲的能量比,EDirect表示直達聲的能量,EReverb表示混響聲的能量,對于固定的聲源,混響聲的能量基本保持不變,當距離增加一倍時,DRR 減少6db,減少的能量主要來自直達聲能量的減少[6]。由式 (1)、式 (2)、式 (3)、式 (4)可 以 看 出,DRR 決定了聽音者所感知到的聲源距離。因此,在對模擬的環境和信號類型有一定的先驗知識的情況下,通過控制DRR 可以恢復聲源的距離。

1.2 最佳混響時間模塊

混響時間是聲學設計中聲能定量估算的重要評價指標[7]。通常用 “T60”來表示,單位是秒 (s),菲茨羅伊公式是專門為家庭環境而設定的混響時間計算公式

式中:V——房間容積,S——房間表面積的總和,X、Y、Z——三對墻面 (6 個墻面)各自的面積,λx、λy、λz——每面墻對應的吸聲系數,該公式考慮了矩形房間內三對墻面吸聲能力不同時的情況。當三面墻的吸聲能量相同時,式 (5)可簡化為賽賓公式

式中:λ——房間六面墻的平均吸聲系數。

混響時間的長短直接影響著聽音者感知聲音的效果,混響時間太短,聲音發干,聲音聽起來不自然;混響時間太長,聲音聽起來混濁不清。不同類型的音頻信號對混響時間的要求各不相同。一般來說,為了保證有足夠的清晰度,語音信號相對于音樂信號要求混響時間要短一些。然而,要對混響時間進行有效的控制,就需要了解不同環境下的最佳混響時間范圍。最佳混響時間范圍是反映房間聲學特性的基本參數,經過長時間對各種不同環境的混響進行大量的調查與分析,眾多聲學專家總結了它們的最佳范圍,可在房間體積對應的混響時間正負10%的浮動區間選擇最佳混響時間[8],如圖2所示。因此,在已知模擬環境的體積V 和音頻信號類型的情況下,可以得到模擬房間的最佳混響時間T60。

圖2 不同房間體積下的最佳混響時間

1.3 人工混響模塊

在室內聲場中,人們聽到的聲音主要由直達聲、近次反射聲和混響聲3部分組成,如圖3所示。

圖3 室內聲場的組成

其中,直達聲SDirect,是指由聲源發出后未經過反射而直接到達聽音者的聲音。近次反射聲SE-Reverb,是聲源發出的聲音經周圍界面單次或少數次反射后,比直達聲到達聽者晚50ms以內的全部反射聲。由于人耳聽覺的延遲效應,人耳不能將直達聲和近次反射聲區分開來。比直達聲晚到50ms以上的多次反射聲都稱為后期混響聲SL-Reverb,其脈沖序列幅度隨時間成指數衰減,回聲密度與時間的平方成正比[9]。

目前人工混響主要有兩種實現方法,一種是用房間脈沖響應法 (room impulse response,RIR),一種是延時反饋網絡法 (delay feedback network,DFN)。采用RIR 需要提前獲取模擬房間的脈沖響應,并且在模擬混響時不能調整混響參數,只能模擬某一房間固定位置的聽音效果;相反,采用DFN 模擬混響時可以通過對濾波器的某些系數進行設置而方便地調整混響參數,具有更強的靈活性和實用性[10]。其中,Moorer混響模型是目前應用最廣泛的一種延時反饋網絡混響模型,其原理如圖4所示。

圖4 Moorer混響模型

由圖4可知,在Moorer混響模型中主要由兩部分構成,一部分由19 階FIR 濾波器構成,它主要模擬40—50 ms內聲音的衰減,包含直達聲和早期反射聲。第二部分由6個并聯的梳妝濾波器c1—c6和一個串聯的全通濾波器A1以及一個延時模kz-d。6個并聯的梳狀濾波器為混響效果提供了延遲較長的回聲,在每個梳狀濾波器的反饋支路上加入一個單極點的低通濾波器,該濾波器可以降低高頻成分的混響時間;全通濾波器用來增加反射聲波密度.通過調整各個濾波器中的延時可以增大回聲密度。梳妝濾波器和全通濾波器的延時選擇參照文獻 [11]中標準,梳狀濾波器的反饋增益系數a可由式計算得到

式中:t——延遲時間,T60——混響時間,由我們自己設定。在Moorer模型中,通過調整直達聲SDirect增益因子g即可實現對DRR 的控制。

2 仿真及主觀測試結果

為了驗證本文所提方法的有效性,分別對待測信號2個方位角對應的6個固定距離進行恢復,測試序列的方位角 (水平角,高度角)分別為 (0°,0°)和 (90°,0°),恢復的距離為0.3 m,0.5 m,0.75 m,1.0 m,1.3 m,1.6 m,測試所用的序列均選自國際標準組織MPEG 的標準測試序列,包括語音和音樂序列。實驗中模擬的環境體積為50m2,由圖2可知,對于語音信號,模擬的最佳混響時間為0.3s;對于音樂信號,模擬的最佳混響時間為0.5s。

在仿真實驗中,用matlab軟件對語音信號進行了模擬仿真,給出了原始語音與加了混響后的語音的時域對比波形圖,如圖5所示;通過模擬距離感知模塊,繪出了語音信號和音樂信號恢復各距離時對應的DRR,如圖6所示。

圖5為人工混響仿真,通過將原始語音和加混響后的語音圖進行對比,由于模擬了聲源所在環境的反射聲,加了混響后的語音聲音強度大于原始語音的強度;圖6為語音信號和音樂信號DRR 與恢復距離間關系,從圖中可以看出隨著聲源距離的增加,DRR 減小,由于對于固定的聲源混響聲的能量不變,DRR 的減小主要是由直達聲的能量減小造成。

圖5 人工混響仿真 (語音信號)

圖6 距離感知關系仿真 (語音信號和音樂信號)

在主觀測試實驗中,參與主觀測試的聽音者由具有聽音測試經驗的8名人員構成,每名測試人員進行四組聽音測試,每組12 個樣本 (對)。模擬的結果通過與采用HRTF恢復的距離進行對比,其中,采用HRTF方法模擬的距離對應的HRTF均來自于北京大學的HRTF庫,打分標準如表1所示,其中,A 代表采用本文方法恢復的距離,B代表HRTF方法恢復的距離。為防止聽音者聽覺疲勞,在所有實驗中,每播放完12個樣本 (對)休息5 min。每聽完一條樣本 (對),聽音者有5s的時間根據表1的打分標準進行打分。主觀測試結果如圖7所示。

表1 距離感知差異

圖7 主觀測試實驗結果

圖7為主觀測試實驗結果,其中圖7 (a)、(b)為語音信號測試結果,圖7 (c)、(d)為音樂信號測試結果。從測試結果可以看出,整體上通過人工混響方法控制DRR 恢復的距離效果和HRTF恢復控制的效果相當,測試人員總體打分分值處于-1到1之間,平均值接近0;其次,對于體積大小相同的房間,由于語音信號要求的清晰度高于音樂信號,使得語音信號所在房間的混響時間小于音樂信號所在房間的混響時間,在該種條件下,人耳對于語音信號的整體距離感知效果稍好于音樂信號。

3 結束語

針對采用HRTF方法恢復距離時需要大量的測試樣本且恢復效果與個體特征相關,本文在采用HRTF 恢復方向的前提下提出了一種基于人工混響的聲源空間距離恢復模型,通過已知3D 視頻場景中的聲源空間距離信息,采用人工混響方法模擬聲源所在環境的混響,結合人耳距離感知的機理控制音頻信號的直達聲和混響聲的能量比,對聲源距離進行恢復。通過仿真結果及主觀測試實驗可以看到,本文提出的方法在不需要大量數據采集處理獲取多距離HRTF的情況下,距離恢復效果和采用最新的多距離HRTF時相當,存儲需求更低,且提出的模型更簡單,實現起來更容易,實用性更強,能夠給聽音者提供更加逼真的空間感距離感,實現從傳統音頻到3D 音頻的轉換。下一步工作將著重于通過與3D 視頻結合,通過實時地提取聲源在3D 視頻中的空間位置信息實現對整個三維空間的距離進行恢復,使觀眾能夠同時享受視覺和聽覺上的盛宴。

[1]San-Jose,ISO/IECJTCI/SC29/WG11 (MPEG),DocumentM23748,Use cases and possible material for 3D Audio [C]//99th MPEG Meeting,2012.

[2]YIN Fuliang,WANG Lin,CHEN Zhe.Review on 3Daudio technology [J].Journal on Conmunications,2011,32 (2):130-138 (in Chinese).[殷福亮,汪林,陳喆.三維音頻技術綜述 [J].通信學報,2011,32 (2):130-138].

[3]YU Guangzheng,XIE Bosun,RAO Dan.Near-field headralated transfer functions of a artificial head and its characteristics[J].Acta Acustica,2012,37 (4):378-385 (in Chinese).[余光正,謝菠蓀,饒丹.人工頭近場頭相關傳輸函數及其特性 [J].聲學學報,2012,37 (4):378-385].

[4]Jonathan S.Berry,David AT Roberts,Nicolas S Holliman.3Dsound and 3Dimage interactions:A review of audio-visual depth perception [J].Proc.SPIE 9014,Human Vision and Electronic Imaging XIX,2014,3 (1):1-16.

[5]Sampo Vesa.Binaural sound source distance learning in rooms[J].IEEE Transactions on Audio,Speech & Language Processing,2009,17 (8):1498-1507.

[6]Yan-Chen Lu,Martin Cooke.Binaural estimation of sound source distance via the direct-to-reverberant energy ratio for static and moving sources [J].IEEE Transactions on Audio,Speech &Language Processing,2010,18 (7):1793-1805.

[7]Sklevik,Magne.Reverberation time-the mother of all room acoustic parameters [J].20th International Congress on Acoustics,2010,3 (2):2508-2512.

[8]MENG Zihou.Research on the acoustical psychology of reverberation perception [J].Applied Acoustics,2013,32 (2):81-90 (in Chinese).[孟子厚.混響感知的聽覺心理 [J].應用聲學,2013,32 (2):81-90.]

[9]Vesa Vlimki,Julian D Parker,Lauri Savioja.Fifty years of artificial reverberation [J].IEEE Transactions on Audio,Speech&LanguageProcessing,2012,20 (5):1421-1448.

[10]ZHANG Lei.The research and implementation of digital reverberator [D].Dalian:Dalian University of Technology,2010:28-32 (in Chinese).[張磊.數字效果器的研究與實現[D].大連:大連理工大學,2010:28-32.]

[11]Udo Zolzer,Xavier,DAFX-Digital Audio Effects[M].England:Wiley,2011:170-180.

猜你喜歡
信號
信號
鴨綠江(2021年35期)2021-04-19 12:24:18
完形填空二則
7個信號,警惕寶寶要感冒
媽媽寶寶(2019年10期)2019-10-26 02:45:34
孩子停止長個的信號
《鐵道通信信號》訂閱單
基于FPGA的多功能信號發生器的設計
電子制作(2018年11期)2018-08-04 03:25:42
基于Arduino的聯鎖信號控制接口研究
《鐵道通信信號》訂閱單
基于LabVIEW的力加載信號采集與PID控制
Kisspeptin/GPR54信號通路促使性早熟形成的作用觀察
主站蜘蛛池模板: 欧美啪啪网| 国产欧美另类| 亚洲天堂.com| 日韩a级片视频| 欧美性精品| 午夜视频免费一区二区在线看| 男人天堂伊人网| 中文一级毛片| 四虎影视国产精品| 网久久综合| 久久精品视频亚洲| 精品视频一区二区观看| 国国产a国产片免费麻豆| 1769国产精品视频免费观看| 国产亚洲精品在天天在线麻豆| 婷婷色在线视频| 视频二区亚洲精品| 久久99热这里只有精品免费看| 欧美三级日韩三级| 国产精品xxx| 国产丝袜精品| 国产全黄a一级毛片| 日韩欧美91| 成人国产小视频| 91精品人妻互换| 国产午夜精品鲁丝片| 一区二区三区高清视频国产女人| 国产精品片在线观看手机版| 免费毛片a| 欧美天堂在线| 亚洲无码高清视频在线观看| 99国产精品一区二区| 欧美一级一级做性视频| 亚洲精品国产乱码不卡| 久久夜色撩人精品国产| 国产精品私拍99pans大尺度| 久久国产成人精品国产成人亚洲| 久久亚洲中文字幕精品一区| 无码国产伊人| 午夜精品福利影院| 99无码熟妇丰满人妻啪啪| 国产真实乱子伦精品视手机观看| av色爱 天堂网| 日韩国产一区二区三区无码| 中文字幕亚洲另类天堂| 久久精品国产电影| 国产免费怡红院视频| 一本大道东京热无码av| 色综合婷婷| 免费中文字幕在在线不卡| 中文无码影院| 亚洲国产中文欧美在线人成大黄瓜| 亚洲色图欧美| 亚洲日本中文字幕天堂网| 国产成人1024精品| 国产成人调教在线视频| 国产精品网址你懂的| 成人综合在线观看| 另类综合视频| 激情国产精品一区| 日本一区中文字幕最新在线| 在线观看亚洲精品福利片| 国产在线观看高清不卡| 久久国产精品影院| 日韩精品欧美国产在线| 亚洲国产天堂久久综合226114| 亚洲天堂网在线视频| 在线视频一区二区三区不卡| 久久永久视频| 亚洲午夜天堂| 国产精品不卡永久免费| 波多野结衣一区二区三区AV| 国产一区二区三区精品欧美日韩| 日韩视频精品在线| 高清免费毛片| 日韩无码视频播放| 欧美精品亚洲二区| 国产成人精品三级| 国产精品手机在线观看你懂的| 国产精品香蕉在线观看不卡| 国产青榴视频| 亚洲娇小与黑人巨大交|