高直 朱志浩


關(guān)鍵詞:機(jī)器視覺課程;教學(xué)方法;圖像匹配;教學(xué)效果
0 引言
隨著人工智能技術(shù)的飛速發(fā)展,基于機(jī)器視覺識別技術(shù)的應(yīng)用成為了很多行業(yè)的發(fā)展契機(jī),如無人駕駛[1]、工業(yè)機(jī)器人抓取[2]、人工智能[3]、交通監(jiān)控[4]、人臉識別[5]等。這一系列的應(yīng)用都離不開圖像匹配技術(shù),因此,圖像匹配研究已經(jīng)成為當(dāng)前機(jī)器視覺領(lǐng)域的一個(gè)熱點(diǎn)。
機(jī)器視覺課程是新工科建設(shè)的產(chǎn)物,以互聯(lián)網(wǎng)和工業(yè)智能為核心,著力培養(yǎng)創(chuàng)新型、應(yīng)用型人才,華東理工大學(xué)于2021 年1 月起已經(jīng)開設(shè)跨學(xué)科、跨專業(yè)的機(jī)器視覺算法課程[6]。機(jī)器視覺課程屬于一門多學(xué)科交叉課程,具有較強(qiáng)的應(yīng)用性,能夠培養(yǎng)學(xué)生的高階思維[7]。
圖像匹配技術(shù)已經(jīng)較為成熟,理論知識扎實(shí),應(yīng)用十分廣泛,如在醫(yī)學(xué)領(lǐng)域,通過圖像匹配技術(shù)對醫(yī)學(xué)圖像進(jìn)行分析,醫(yī)生能夠結(jié)合分析結(jié)果獲取更多的有效信息[8];如在航空航天領(lǐng)域,利用圖像匹配技術(shù)能夠提高飛行器的自主導(dǎo)航精度[9]。因此圖像匹配技術(shù)不僅能夠降低教師的教學(xué)難度,同時(shí)也能使學(xué)生盡快步入機(jī)器識別領(lǐng)域,激發(fā)學(xué)生的學(xué)習(xí)興趣。
1 機(jī)器視覺課程現(xiàn)狀
從目前的機(jī)器視覺課程教學(xué)來看,存在一些不足。
⑴ 教學(xué)模式死板,課堂乏味無趣,學(xué)生積極性不高
該課程在一些院校形成了較固定的教學(xué)模式。老師通常以板書和PPT 的形式向?qū)W生傳輸知識,學(xué)生學(xué)習(xí)動力不足,缺乏積極主動性。學(xué)生的學(xué)習(xí)成績多為考核理論知識,學(xué)生平時(shí)少學(xué)甚至不學(xué)也能夠靠突擊背誦知識點(diǎn)過關(guān),考過后就忘。
⑵ 教學(xué)內(nèi)容局限,資源配置不均
目前因?yàn)闄C(jī)器視覺課程是多學(xué)科交叉課程,故該課程的內(nèi)容過于廣泛,內(nèi)容深度對于初學(xué)者而言較難掌握。所采用的課本或教材陳舊,繁瑣的公式推導(dǎo)多,知識更新慢,與社會需求脫節(jié)。
⑶ 案例陳舊,致使學(xué)生盲目跟從學(xué)習(xí)
課程實(shí)踐對工科學(xué)生而言,尤為重要,機(jī)器視覺課程實(shí)踐對于剛接觸這一領(lǐng)域的學(xué)生來說,有些實(shí)踐項(xiàng)目案例陳舊,而且多以算法的數(shù)學(xué)推導(dǎo)為主,這只會讓學(xué)生陷入復(fù)雜繁瑣的數(shù)學(xué)邏輯中去。學(xué)生面對實(shí)際應(yīng)用,只會跟隨老師操作,不能理解“為什么”,遇到問題不知所措。學(xué)生沒有參與度,最終為了考核死記硬背蒙混過關(guān),無法體現(xiàn)教師的教學(xué)水平。
2 圖像匹配技術(shù)
在不同條件下獲得的圖像因角度、灰度等影響產(chǎn)生差異,圖像匹配就是通過對比方法識別出這些存在差異的圖像中的相同特征,其所用到的對比方法就是圖像匹配算法。圖像匹配算法主要分兩大類:基于灰度的匹配算法和基于特征。基于灰度的圖像匹配算法是利用圖像的像素灰度值信息,其包含了圖像記錄的所有信息,利用灰度信息建立兩幅圖像之間的相似性度量,采用搜索方法找到使得相似性度量值達(dá)到最大或最小變換模型的參數(shù),因此該方法計(jì)算量過大,難以達(dá)到實(shí)時(shí)性要求;基于特征點(diǎn)的圖像匹配算法是目前的主流算法,其最大的優(yōu)點(diǎn)是能夠?qū)z測出來的特征點(diǎn)通過特征描述呈現(xiàn)并根據(jù)相似原則完成匹配,在受到圖像角度、灰度、旋轉(zhuǎn)等影響下都有較好的適應(yīng)能力[9]。圖像匹配的流程如圖1 所示。
圖像匹配算法經(jīng)過多年的研究也出現(xiàn)了很多經(jīng)典的算法,如SURF 和SIFT 兩種算法。2004 年,Low 等提出了一種尺度不變特征變化算法SIFT(Scale Invariant Feature Transform),在大多數(shù)情況下,該算法都取得了滿意的匹配效果,但是SIFT 描述符運(yùn)算復(fù)雜,處理時(shí)間長,對于相似結(jié)構(gòu)的圖像會有大量誤匹配點(diǎn)產(chǎn)生。在SIFT 算法的基礎(chǔ)上,Bay 等提出了耗時(shí)更短的加速魯棒特征(SURF)算法,SURF 算法通過對海森行列式算法的簡化,大大提升了運(yùn)算速度。
諸多研究人員又在SURF 算法的基礎(chǔ)上提出改進(jìn),對SURF 算法的改進(jìn)大都在圖像預(yù)處理、特征提取和模板匹配這三部分。對圖像預(yù)處理部分的改進(jìn),主要是為了之后能獲取更多的圖像特征信息;對特征提取部分的改進(jìn)大都通過對描述符的降維或采用其他描述符來完成特征描述,以加快計(jì)算速度等;對于模板匹配部分的改進(jìn)大多是通過添加約束條件實(shí)現(xiàn)對匹配結(jié)果精準(zhǔn)度的提高。
3 圖像匹配在機(jī)器視覺課程中的優(yōu)勢分析
機(jī)器視覺課程的基本內(nèi)容是圖像匹配技術(shù),學(xué)生通過學(xué)習(xí)圖像匹配技術(shù),可以由淺入深的掌握機(jī)器視覺技術(shù)。因此,面對機(jī)器視覺課程的現(xiàn)狀,圖像匹配技術(shù)能夠帶來諸多優(yōu)勢。
3.1 對機(jī)器視覺課程的改進(jìn)
⑴ 理論與軟硬件教學(xué)相結(jié)合,提高學(xué)生的應(yīng)用技能能力
圖像匹配技術(shù)對于整個(gè)機(jī)器視覺領(lǐng)域而言難度較低,學(xué)生易于接受,以SURF 算法為例,國外諸多大學(xué)針對SURF 算法已經(jīng)開設(shè)多年相關(guān)課程,通過讓學(xué)生在掌握SURF 算法的基礎(chǔ)上,運(yùn)用SURF 算法實(shí)現(xiàn)機(jī)器視覺中的一些應(yīng)用,提高了學(xué)生的實(shí)踐能力,也不會因難度過大導(dǎo)致學(xué)生學(xué)習(xí)動力不足。對于國外大學(xué)的教學(xué)理念,可以取長補(bǔ)短,先熟悉編程環(huán)境,讓學(xué)生充分利用網(wǎng)絡(luò)資源,查閱相關(guān)文獻(xiàn),了解經(jīng)典圖像匹配算法,這些算法經(jīng)典透徹,學(xué)生容易掌握。建立科研小組,能夠調(diào)動學(xué)生的積極主動性,將理論知識運(yùn)用到實(shí)踐中,讓學(xué)生自己動手,編寫相關(guān)程序,能夠增強(qiáng)學(xué)生對Vs、Python、Matlab 等開發(fā)環(huán)境的掌握能力,同時(shí)也能激發(fā)學(xué)生的思考和創(chuàng)新能力。科研小組的成立使學(xué)習(xí)效果評價(jià)更科學(xué)合理,既避免了學(xué)生為應(yīng)付理論考試的突擊背誦,也能體現(xiàn)教師的教學(xué)水平。
⑵ 調(diào)動學(xué)生的學(xué)習(xí)興趣
圖像匹配技術(shù)發(fā)展至今,在很多領(lǐng)域都發(fā)揮著極其重要的作用,呈現(xiàn)出一系列的應(yīng)用成果,可以將互聯(lián)網(wǎng)上的諸多成功案例通過視頻的形式給學(xué)生進(jìn)行講解,讓學(xué)生感受到這門課程的有趣之處,也能讓學(xué)生對自己的未來有所規(guī)劃,理解為什么學(xué)習(xí)這門課程該課程的學(xué)習(xí)對自己以后參加工作有何用處,將最新的應(yīng)用實(shí)例呈現(xiàn)給學(xué)生,能夠調(diào)動學(xué)生對機(jī)器視覺課程的學(xué)習(xí)興趣,也能夠讓學(xué)生對自己學(xué)習(xí)的方向有更深的見解,拓展學(xué)生的思維。
3.2 教學(xué)案例分析
下面通過教學(xué)案例說明圖像匹配技術(shù)在“機(jī)器視覺”課程教學(xué)中的應(yīng)用。
以SURF 算法為例,SURF 算法的基本流程同其他匹配算法一致主要分為三部分:特征點(diǎn)的檢測取、特征點(diǎn)提取與描述、特征匹配。SURF 算法一種比例和旋轉(zhuǎn)不變的興趣點(diǎn)檢測器和描述符(如圖2),SURF算法中借用積分圖像概念來減小算法的計(jì)算量,將圖像與高斯二階微分模板的濾波轉(zhuǎn)換為對積分圖像的加減運(yùn)算,通過二階Hessian 矩陣完成特征點(diǎn)的檢測,對于一個(gè)圖像P = (x,y) 上的圖像尺度為δ 的點(diǎn)X?的Hessian 矩陣為:
利用Harr 小波響應(yīng)確定特征點(diǎn)的主方向,并將同主方向水平的Haar 小波響應(yīng)值定義為dx 和dy,通過計(jì)算他們的絕對值之和得到每個(gè)子區(qū)域的四個(gè)特征向量,計(jì)算所有的矩形區(qū)域塊得到64 維的特征描述子。
特征匹配通常是采用歐式距離的方法,針對基準(zhǔn)圖像中的某一個(gè)特征點(diǎn),在待匹配圖像中搜索出距離最近的特征點(diǎn),歐式距離越小,則相似程度越高,當(dāng)小于給定閾值時(shí)則判定匹配成功。
以圖2 為案例,該教學(xué)主要目的時(shí)使學(xué)生掌握處理圖像、特征檢測、特征提取及圖像匹配等基本技能,鍛煉學(xué)生軟件開發(fā)能力。
讓學(xué)生根據(jù)教材圖像處理的基礎(chǔ)算法動手編程,將圖像轉(zhuǎn)換為灰度圖像,對于灰度圖像進(jìn)行特征提取,特征提取部分對圖像匹配的精度和速度都具有重要影響,圖像的特征包含:顏色、形狀等[10],對于這部分可以著重講解。匹配結(jié)果如圖3 所示,讓學(xué)生采用歐氏距離的特征匹配進(jìn)行對比分析,引導(dǎo)學(xué)生通過互聯(lián)網(wǎng)資料查閱學(xué)習(xí),理解這兩種算法的區(qū)別,同時(shí)也能夠讓學(xué)生在查閱學(xué)習(xí)的過程中看是否能夠發(fā)現(xiàn)創(chuàng)新點(diǎn),通過創(chuàng)新更進(jìn)一步提高圖像匹配的精準(zhǔn)性和實(shí)時(shí)性。通過案例的學(xué)習(xí),為機(jī)器視覺課程打下基礎(chǔ)。
4 結(jié)束語
通過對機(jī)器視覺課程的研究,分析了現(xiàn)如今機(jī)器視覺課程存在的問題,并提出改進(jìn)建議,探索了圖像匹配技術(shù)在機(jī)器視覺課程教學(xué)中的優(yōu)勢,并通過案例分析了圖像匹配技術(shù)機(jī)器視覺課程的重要性,讓學(xué)生以圖像匹配技術(shù)為媒介對機(jī)器視覺課程建立一個(gè)完整的學(xué)習(xí)體系,由粗淺到深入,完成機(jī)器視覺的課程,取得了較好的教學(xué)效果。