楊蕾 張雁輝 張育中 張騰達 盧榮勝



摘? 要? 在新工科理念的指導下,分析傳統信號與系統課
堂教學現狀,研究將知識點與案例結合的項目式教學。以傅里葉變換在圖像處理、音頻信號、目標定位和文字識別中的應用為例,通過分析對比信號的時域和頻域,讓學生了解頻譜的表現形式和作用。該教學方法有助于培養學生解決問題的能力和主動學習的意識。
關鍵詞? 新工科;項目式教學;信號與系統;傅里葉變換
中圖分類號:G642.0? ? 文獻標識碼:B
文章編號:1671-489X(2022)07-0063-06
0? 引言
當前,我國堅持創新驅動發展,積極推進“一帶一路”“中國制造2025”“互聯網+”等,以新技術、新業態、新模式、新產業為代表的新經濟蓬勃發展,對工程科技人才提出更高要求。教育部提出新工科的概念,標志著新工科教學改革的開始。新工科研究和實踐將圍繞工程教育改革的新理念、新結構、新模式、新質量、新體系開展[1]。現行本科教育,特別是在應用型大學,不可避免地留下傳統本科教育的痕跡,迫切需要加快工程教育改革創新,確立能力導向的教學理念,實施以項目為核心的體驗式教學。
信號與系統是工科專業必修的專業基礎課,具有承上啟下的重要作用,但內容概念較多,數學要求高,理論性強,理解和掌握其中的分析方法和基本理論比較困難。傳統的課堂教學仍采用知識點講授的教學模式,課堂注重數學公式的計算,與實際應用聯系較少,學生普遍反映理論性強,學習難度大,不易理解,抑制了學習興趣及創新意識。因此,需要把提高學生主動學習的積極性,提高學生綜合運用知識解決實際問題的能力作為目標,以此達到創新型人才培養的目的,滿足新工科背景下對人才培養和畢業的新要求[2]。
項目式教學(PBL)強調將學習與解決問題緊密相連,讓學生在學習過程中思考如何利用知識點解決問題,發揮問題對學習的指導作用,調動學生的主動性和積極性[3]。如在信號與系統課程中以圖片、音樂為切入點,利用知識點解決工程實際問題。本文以課程中的重點、難點之一傅里葉變換為出發點,闡述項目式教學的理念,同一課程知識點在不同項目案例中的應用,如何解決問題,并實現抽象概念具體化、工程化、項目化,提高學生學習的積極性及創新意識。
傅里葉級數和傅里葉變換在數學、科學和工程領域都是非常重要的工具[4]。人們習慣從時域角度思考問題,因此不易理解其變換的原理。本文以傅里葉變換在圖像處理、音頻信號、目標定位與文字識別等方面的項目應用為例,對比處理前后的時域波形圖和頻域波形圖,闡述傅里葉變換如何解決實際項目案例中的問題及其基本原理。
根據維度、信號特性,傅里葉變換分為一維連續變換、一維離散變換、二維連續變換和二維離散變換等[5],音頻信號處理是一維離散變換,圖像處理是二維離散變換。二維連續傅里葉變換及逆變換公式分別見式(1)、式(2):
其中,F(u,v)是函數f(x,y)的頻譜,u是x方向的頻率,v是y方向的頻率。分辨率為M×N二維圖像的離散傅里葉變換如式(3)所示:
其中,F(u,v)是該圖像的頻譜。若定義F(u,v)的實部和虛部分別為R(u,v)、I(u,v),則相應的傅里葉變換幅度譜和相位譜分別為式(4)、式(5):
1? 圖像處理
根據傅里葉變換理論,滿足條件的任何信號都可表示為一系列正弦信號的疊加。在圖像處理中則為每幅灰度圖像都可表示為由正弦信息疊加組成的圖像。其中每個正弦信息由三個變量組成:頻率、幅值及相位。經過變換的圖像即是該圖像頻譜圖(或功率圖),在頻譜圖中更加關注頻率及幅值。在圖像處理中,傅里葉變換的主要應用有圖像去噪、邊緣檢測、圖像壓縮等,利用傅里葉變換將圖像由空域轉換至頻域,在頻域進行運算與操作,實現對圖像的處理。
1.1? 圖像去噪
圖像去噪在時域是利用傳遞函數與圖像信號卷積來濾除噪聲[6],在頻域即傳遞函數H(u,v)和圖像的頻譜函數F(u,v)相乘,減弱期望去除的頻率信號(噪聲),得到新的頻譜函數G(u,v),通過傅里葉逆變換得到新的函數g(x,y),即去噪后的圖像。噪聲屬于高頻分量,故傳遞函數H(u,v)是低通濾波器時,可以有效去除高頻噪聲成分。以高斯低通濾波器為例進行項目案例解釋,其傳遞函數式為式(6):
式中,D0為截止頻率,D為任意頻率。
圖1是高斯低通濾波去噪的結果:對比圖1a帶噪聲的圖像和圖1b去噪后圖像,可以看出濾波后的圖像大部分噪點已經去除;與圖1c帶噪圖像頻譜圖相比,圖1d去噪后的圖像頻譜圖,其四周高頻部分顏色加深,說明高頻分量得到一定的抑制,中間亮點部分對應低頻有用信息,仍然不變,得到保留。仔細觀察,圖像邊緣部分有些模糊,是由于噪聲信號與原圖像邊緣信號均為高頻信號,采用低通濾波器會影響圖像邊緣部分,導致圖像邊緣與原圖相比較模糊。
1.2? 邊緣檢測
圖像邊緣檢測原理與圖像去噪類似,圖像的邊緣信息對應頻譜圖中的高頻分量,故邊緣檢測的傳遞函數H(u,v)則是高通濾波器[7]。對原圖進行傅里葉變換轉換至頻域,頻率信號通過高通濾波器,能有效保留并處理邊緣高頻分量。圖2所示是高斯高通濾波器對圖像邊緣檢測:圖2b為邊緣檢測結果,圖中有效保留了原圖中的邊緣信息;與圖2c原圖頻譜圖相比,圖2d濾波后的頻譜圖中心低頻成分變為黑色,即低頻分量被濾除,四周的高頻部分顏色與圖2b相似,邊緣高頻分量被保留。
1.3? 圖像壓縮
圖像壓縮的本質是去除冗余的數據,以少量的有用信息表達同一幅圖像。人眼對圖像低頻分量的變化較敏感,對于高頻分量的失真不敏感,合理去除部分高頻分量,可以達到圖像壓縮的目的。
由式(3)可知二維圖像信號傅里葉變換后為復數序列,復數包括實部和虛部,一個復數則需占用兩個數據空間,所以有限長序列信號的離散傅里葉變換(DFT),有一半數據是冗余的,這與圖像壓縮的目的相違背[8]。故只取傅里葉變換的余弦部分即離散余弦傅里葉變換(DCT)進行頻譜分析[9],如式(7)所示。
DCT和DFT一樣具有能量集中特性,大部分能量集中在低頻部分。對圖像進行分塊處理并采用DCT,在每塊中去除高頻分量,可以增加圖像局部結構的變化精度,提高壓縮率。圖像分塊不宜太大,否則影響量化的精度;分塊也不宜太小,否則每塊內部關聯性降低,影響DCT的效果,一般采用8*8。圖像壓縮的流程如圖3所示:原圖像以8*8像素分塊取樣,每塊進行DCT變換,得到8*8的數字陣列;該陣列內低頻信息集中在左上角,高頻信息分布于右下角,乘以上三角矩陣,可以保留數字陣列中低頻部分,舍棄高頻部分,得到壓縮后頻譜;每塊進行余弦反變換,重新組合,得到壓縮后圖像。
圖4為圖像壓縮前后對比圖:壓縮后圖像如圖4b所示,與圖4a原圖在視覺效果上差別不大,這是因為人眼高更容易接受高頻分量的失真;將壓縮后的圖片放大如圖4d所示,可見圖中鑰匙的邊緣已經有輕度模糊的特征。
2? 音頻信號
音頻信號的處理,通過傅里葉變換將音頻信號由時域轉換至頻域,在頻域對其頻率進行運算與處理[10],可以實現變聲、聲音降噪和聲音分辨與提取等,以變聲和聲音降噪為案例進行說明。
2.1? 變聲
人說話的個性化音色取決于基頻和共振峰頻率,聲帶振動的頻率稱為基音頻率(基頻),與人的性別特征有關。口鼻腔耦合共振時的頻率稱為共振峰頻率,與人的口鼻形狀(聲道長度)有關。如表1所示:兒童聲道短,共振峰頻率偏高;成年女性的聲道比成年男性短,所以女性的共振峰頻率一般高于男性。變聲的原理即改變基頻和共振峰頻率,基頻是人聲源特征的反映,因此,變聲主要是改變基頻[11]。但由于聲源和聲道不是獨立的,基頻改變時必然會非線性地影響共振峰,反之亦然,兩者相互作用。
語音包含音調、音速兩個參數,變聲分為變調和變速:變調不變速可以保證變聲后內容仍能清晰地被表達,時域重采樣算法可以實現變調;變速是將音頻時間變長或變短,音速發生變化。圖5為變調不變速的案例,增大重采樣頻率,可以使女聲變變男生。對比圖5a女聲和圖5b變為男聲的時域波形圖,可以看出男聲時域波形的線條更稀疏。人的聲帶振動具有周期性,基頻在頻譜圖中為周期性變化且能量集中的頻率分量。由圖5c原信號女生頻譜圖和圖5d變男聲后信號頻譜圖的局部放大圖可以看出:原信號女生的基頻位于180 Hz附近,變聲后的男聲基頻位于130 Hz附近(圖中直線標記)。共振峰在頻譜圖上與聲音頻譜包絡線的峰值位置有一一對應的關系,包絡線峰值位置就是共振峰所在位置,其位置如圖5e和圖5f中直線所標記。可見,重采樣頻率增大,頻域壓縮,變聲后的共振峰頻率減小。
2.2? 聲音降噪
聲音降噪就是去除高頻噪聲信號。含有噪聲的音頻信號經過傅里葉變換后轉換到頻域,根據噪聲的頻率分布設計濾波器實現音頻降噪。圖6所示為某一音頻信號加入3 kHz、5 kHz、8 kHz的混合余弦噪聲,經過巴特沃斯低通濾波器后的時域波形和頻譜圖。原始音頻信號的頻率分布于0~0.2(頻率歸一化處理),三余弦噪聲頻率都大于0.2,噪聲與原始音頻信號在頻域不重疊,經過巴特沃斯低通濾波,截止頻率為0.22,濾波后音頻信號頻譜如圖6f所示,余弦噪聲頻率均被有效濾除,圖6e原始音頻信號頻率幾乎沒有受到影響。
3? 目標定位
卷積運算可以實現圖像目標定位,即模板匹配。傅里葉變換將目標模板和待定位目標圖像轉換到頻域,兩者頻譜相乘,利用頻域乘積運算實現時域的卷積運算。傅里葉反變換為時域并取實部,該實部數值就是和模板匹配的相關系數,設置合理的系數閾值,大于閾值的位置就是圖像中目標所處位置。
從圖7a定位字母a的位置,圖中所有需定位字母a的位置用紅框標記出,一共六個位置。從原圖中分割出字母a的圖像作為定位目標a的模板,將字母模板與原圖像進行卷積運算,計算模板匹配的相關系數。圖7a文字排列有水平和豎直兩種,故分別計算水平和豎直兩個方向的相關系數(旋轉模板頻譜90°可得豎直方向)。根據兩個方向的相關系數的最大值設置閾值,輸出并顯示相關系數大于閾值的像素點,如圖7b為圖像目標定位的結果,一共六個白點,對應原圖中六個字母a的位置,它們的像素點坐標分別為(23,118)(45,98)(45,185)(123,170)(153,170)(225,192),前三者為水平方向坐標,后三者為豎直方向的坐標。
4? 文字識別
文字識別包括圖片預處理、圖像文字分割、字符識別、結果輸出[12],核心在字符識別中的算法。目前字符算法包括模板匹配和特征提取,傅里葉變換在文字識別中的作用就是模板匹配,其原理與目標定位類似。與目標定位不同的是,文字識別需要將所有分割圖像分別與文字模板庫中的所有模板圖像逐個匹配,通過設置閾值,相關系數大于閾值時,認為文字分割圖像與某個模板圖像最相似,即確定該分割圖像的字符。文字識別經典的應用是車牌識別,如圖8所示為基于傅里葉變換車牌識別的結果。
5? 結束語
隨著國家新工科建設的不斷推進,高校在新工科建設方面的力度也不斷加大。理論性強的信號與系統課程作為工科專業的核心課程,課程改革也勢在必行。立足于新工科建設的發展目標,分析信號與系統傳統課堂教學中的問題,提出面向新工科的項目式教學,以傅里葉變換為例,將其應用到圖像、聲音、文字等項目中解決問題,闡述每個案例中頻譜在解決實際問題中的作用,真正實現將理論運用于實踐中,理論與實踐相結合,調動學生主動學習的積極性,學生的工程實踐能力也得到提高。
參考文獻
[1] 孫明燦,徐曉靜,葛愛冬,等.新工科背景下電氣工程學科建設研究[J].高教學刊,2021(21):66-69.
[2] 孫偉,郭寶龍,潘蓉.工程理念指導下“信號與系統”教學研究與探索[J].電氣電子教學學報,2017(4):62-65.
[3] 張文利,王卓崢,司農,等.創新類通識教育課程建設的探索與實踐[J].高等工程教育研究,2019(4):90-95.
[4] 曹欣遠,陳明生,齊琦.“信號與系統”中傅里葉變換的教學方法研究[J].合肥師范學院學報,2019,37(6):87-89.
[5] 安成錦,張磊,王玲.傅里葉變換在傅里葉級數求解教學中的應用:以“信號與系統”課程為例[J].工業和信息化教育,2016(1):44-46,62.
[6] 馬曉凱,付禹.淺談傅里葉變換在圖像處理中的應用[J].科技資訊,2018(8):80-81.
[7] 李麗英.基于邊緣檢測的數字圖像拼接實現研究[J].南方農機,2021(5):172-173,187.
[8] 鄭華,緱林峰,李長征,等.復指數函數內涵的傅里葉變換教學方法探索[J].電氣電子教學學報,2020,43(3):100-102,143.
[9] 曹燦云.離散余弦變換在圖像壓縮中的應用[J].信息與電腦(理論版),2018(12):43-45.
[10] 楊曉杰,王閎毅,陳金河,等.快速傅里葉變換算法在音頻功放中的應用[J].電子技術,2015,44(7):33-35.
[11] 張棟,彭建云,余春艷.穩定音色的音樂語音變調方法[J].計算機工程,2018,44(3):315-321.
[12] 張送蘭.車牌識別系統算法綜述[J].電子技術與軟件工程,2021(4):128-130.
*項目來源:安徽省級質量工程項目“光電信息工程教學團隊”(基金編號:GRTD1906)。
作者:楊蕾,合肥工業大學儀器科學與光電工程學院,副教授,研究方向為激光檢測;張雁輝,合肥工業大學儀器科學與光電工程學院碩士研究生,研究方向為光譜增強技術;張育中,合肥工業大學儀器科學與光電工程學院,副教授,研究方向為輻射測溫理論與技術;張騰達,合肥工業大學儀器科學與光電工程學院,講師,研究方向為自動光學檢測;盧榮勝,合肥工業大學儀器科學與光電工程學院,教授,研究方向為激光與光電檢測技術(230009)。