高清音頻是我們經常掛在嘴邊的詞,實際上高清音頻是相當廣義的,非常多的音樂格式都可以稱之為高清音頻。音樂格式的不同會帶來音樂信息量的變化,音質會隨之變化,文件的體積也會變化,甚至選擇的播放器或者播放軟件也會不同,理解高清音頻的各種格式,就變得非常重要。
數字音源大部分都是“線性PCM”,它是通過對聲音的波形(模擬信號)進行一定程度的數字化(采樣)而獲得的數據,其周期被稱為“采樣率”,也就是模擬轉數字時每秒對聲音采樣的數量。
例如44.1kHz、96kHz、192kHz就是我們常見的采樣率,數字越大說明聲音采樣的頻率越高,在將數字信號還原成模擬信號時就越能接近真實的原始聲音,意味著更多的信息量,更好的音質。
換句話說,當你看到這些數字,就可以知道“聲音的細節在單位時間里被測量的程度”。
bit數的大小表示了有多少聲音的細節被捕獲,數值越大就表示捕獲的聲音可以更接近原始聲音(模擬信號),并以高分辨率的方式再現。bit數的大小,可以說直接與音樂的解析度關聯,例如,1bit的時候振幅就為“0或1”的兩階,2bit就是“00和01”“10和11”的四階。

同理,如果是4bit就是16階,8bit就是256階,16bit就是65,536階,24bit則是16,777,216階,越多的階數越能精確描述每個采樣的振幅高度,也就越接近原始聲音的“能量”,在從數碼還原到模擬的過程中也就能越接近原始的聲音。
另外,bit的數目還決定了聲波振幅的范圍(即動態范圍,最大音量與最小音量的差距)。如果這個位數越大,則能夠表示的數值越大,描述波形更精確。每一個bit的數據可以記錄約等于 6dB動態的信號。
人類聽覺的動態范圍為120dB,16bit的時候有96dB的動態范圍,24bit是144dB,32bit則為192dB。所以,高清音頻文件有足夠的動態來詮釋豐富的音樂細節,理論上滿足人類的聽覺極限。
TIPS
波形和采樣率的關系

采樣率越高,得到的信息量就越大,也就越接近原始的波形

什么樣的音樂格式才能被稱為高清音頻呢?如果以上述通過采樣率和bit數來區別的話,至少應該要超過CD(44.1kHz/16bit)的音質。實際上,根據日本電子情報技術產業協會(J EITA)的定義,只要音樂文件的采樣率和bit數都超過CD的規范標準,就可以稱之為高清音頻。
另一方面,由索尼提出并定義,日本音頻協會(J AS)和消費電子協會(CE A)也制定了自己的高清音頻標準,并對支持高清音頻播放的產品打上金色的logo,就是我們經常在產品上見到的“Hi- Res Audio”商標。該規則下,基本上只要符合播放24bit/96kHz的FLAC或者WAV的,都是屬于Hi- Res Audio的標準規范。
知道了Hi- Res Audio的標準以后,就可以來了解一下支持高清音頻的文件格式了。實際上高清音頻并沒有嚴格的統一標準,也不僅是FLAC或者WAV兩種格式,是否是高清音頻更多還是從音頻文件的采樣率和bit數來辨別。采樣率44.1kHz以上,bit數在24bit以上,我們都可以理解為高清音頻。
雖然,我們現在是以PC M為前提來定義高清音頻,不過大家應該還有對S AC D的印象,S AC D全名為“Super Audio CD”由SONY與Philips共同制定的,借此提供比CD更好的音樂質量。
但SACD的取樣方法并不是像CD一樣使用PCM的方法來取樣聲音,而是使用一種叫做DSD(Direct Stream Digital)的方式取樣。在DSD上的取樣頻率達到每秒2,822,400次,比起CD的44,100次還要高出64倍,而且是以1bit的單位在記錄信息。不同于PCM每16bit一個單位的取樣方式,在這樣的取樣方法下,可以由量化不精確的聲音訊號而造成的噪音和失真,減少至一個位以內的誤差。
所以,DSD也能夠被認為是高清音頻,雖然日本電子情報技術產業協會的定義并沒有明確表明,但是根據日本音頻協會的定義,只要支持播放DSD 2.8MHz/5.6MHz的產品就可以獲得Hi- Res的認可。由于SACD的不普及,緣由則是設備門檻太高,錄制成本也高,消費者購入的管道少,所以,即使有著高音質的優勢,最后也還是無法取代CD成為更好的音樂載體。
TIPS
PCM和DSD的采樣區別

