張渤
數字化技術是信息技術課程中的基礎內容之一,尤其是數字化的原理、用途、特點及相關技術的特色,比較難以理解,通過信息技術實驗,用數據與作品輸出技術原理及應用,可以更容易地探索其技術特點。例如,在音頻處理中,可以通過音頻處理軟件觀察計算機將自然界聲音進行轉換,存儲為音頻文件的過程、方法、結果,加深計算機對數據進行處理的認識和理解。
實驗目的
(1)具體感知計算機采集處理聲音的一般過程,掌握聲音錄制所需的硬件設備和軟件設置等基礎知識。
(2)通過觀察波形,結合采樣頻率的設置,了解計算機采集聲音的基本原理。
(3)通過更改設置錄音的不同參數、改變存儲格式等,對比分析計算機采集聲音的共性特征、不同參數和格式對音頻文件存儲容量的影響。
實驗原理
自然界的聲音信號,我們稱之為模擬信號。根據學過的物理知識,我們知道自然界的聲音信號都是連續的波形。計算機是采用二進制進行數據存儲和處理,所以將自然界的聲音錄制到電腦中,其實就是把連續的模擬信號轉換成為使用0或1表示的數字信號的過程,這個過程稱為模擬/數字轉換(通常稱為聲音的數字化)。自然音源只有轉換為數字信號后,才能在計算機中作進一步加工處理。
聲音數字化包含兩個關鍵步驟——采樣和量化。
采樣就是每隔一定時間讀一次聲音信號的幅度,而量化則是將采樣得到的聲音信號幅度轉換為數字值。從本質上來說,采樣是時間上的數字化,每隔一定時間就對聲音進行抽取,單位時間內的采樣次數稱為采樣頻率(采樣過程可以類比數學上的描點作函數圖像)。采樣頻率越高則采樣時間間隔越小,采樣得到的數據越接近原來的波形。而量化則是幅度上(音量高度)的數字化,通常采用采樣位數對模擬音頻信號進行數字化。采樣位數越高(度量越精確),數字化后的信號就越接近原始信號(如圖1)。
根據奈奎斯的采樣理論,采樣頻率要高于輸入信號最高頻率的兩倍,而正常人的聽覺頻率為20Hz~20KHz,所以采樣頻率應在40KHz左右,常用采樣頻率有44.1KHz、48KHz等。采樣位數決定了模擬信號數字化后的動態范圍,常用的有8位、12位和16位。從模擬/數字轉換角度來看,影響音頻文件質量的主要因素就是采樣頻率和采樣位數。
數字化后的聲音信號在通過電腦進行回放處理時,需要再次將數字信號按照一定的規則還原成連續的模擬信號,這就是在音頻編輯軟件中看到聲音仍然是連續波形的原因。另外,數字化時采樣頻率和采樣位數越高,還原效果就越接近原來的聲音(如圖2、圖3)。
數字化后的聲音信號要存儲和再處理,都需要按照一定的規則把信號進行編碼。因為編碼會把數據冗余部分去掉,所以經過編碼壓縮后的音頻信號也會有不同程度的質量損失,存儲占用空間也不盡相同。我們常采用的音頻壓縮編碼格式有PCM、WAV、APE、FLAC、MP3、MP3PRO、AMR、AAC等,對應有無損壓縮和有損壓縮等不同品質的音頻文件。
除此之外,不同聲道數的音頻信號也會影響人的聽覺感受。
實驗設備
電腦、耳麥、音頻編輯軟件(如Cool Edit Pro或GoldWave、Auditio等)、歌曲一首或多首。
實驗內容
(1)進行錄音前的設備調試準備(錄制外界聲音或人聲與錄制電腦自身發出聲音設置有差異)。
(2)新建不同采樣頻率、采樣位數的音頻文件,進行錄音,并采用不同格式進行存儲,對比分析其聽覺差異和文件容量差異。
(3)記錄數據,并分析推理實驗結論(如左下表)。
通過聽覺感受前后對比,重點區分音頻文件的清晰度能否真實反映原聲音,以及有何不同,不能單純以好或不好作為描述。
實驗思考
(1)如何設置實驗,對比分析觀察某一參數變化所造成的影響?
(2)為避免不同音源錄音所造成的差異影響實驗效果,應如何保證音源的一致性?
(3)如何觀察采樣后的波形其實是原始信號的抽樣結果?(請把觀察截圖附在本題后)
(4)比較常見的音頻文件的品質區分方式是KBPS,通常稱為碼率,代表著音頻文件每秒內所含的信息量,一般碼率越高信息越豐富,音樂也會更“真”,細節也會更飽滿。通過你的觀察分析,你認為影響碼率的主要因素是什么?其規律是什么?endprint