丁一
(無錫城市職業(yè)技術(shù)學(xué)院 江蘇省無錫市 214000)
隨著線上教學(xué)資源的日益豐富。各大高校都普遍采用通過線上與線下教學(xué)結(jié)合授課,并以過程化的分?jǐn)?shù)考核替代傳統(tǒng)的卷面考核。相對(duì)于傳統(tǒng)的著重于文字的重復(fù)率的查重,關(guān)鍵的信息載體圖像以圖像識(shí)別匹配技術(shù)作為基礎(chǔ)的圖像查重算法的建立就尤為重要。本相對(duì)傳統(tǒng)的考核方式,過程化考核能夠充分發(fā)揮學(xué)生的主觀能動(dòng)性,更充分的把學(xué)生在課程學(xué)習(xí)中的知識(shí)發(fā)揮到實(shí)踐應(yīng)用當(dāng)中,并能更好地反映學(xué)生實(shí)踐實(shí)際操作水平。但在學(xué)生的分?jǐn)?shù)評(píng)價(jià)方面更主觀、更需要人工評(píng)判。因此,希望更客觀地反映分?jǐn)?shù)的同時(shí),勢(shì)必帶來更多的更復(fù)雜的工作量。而且,由此帶來的抄襲等問題的分析與判斷也是需要注意的要點(diǎn)之一。在圖像處理技術(shù)日益發(fā)展的今天,將這種大量重復(fù)性很強(qiáng)的工作交給人來做是不合適的,文將ORB 算法應(yīng)用于圖片相似度匹配中,并且結(jié)合了RANSAC 算法提高了匹配的精確度。圖像匹配算法可以針對(duì)學(xué)生實(shí)驗(yàn)報(bào)告中的特征點(diǎn)加以提取,識(shí)別并分析重復(fù)率。給人工判斷目標(biāo)作品是否抄襲提供了參考判斷依據(jù),這種算法在時(shí)效性方面大大減少了人工匹配消耗的時(shí)間,并能夠依靠計(jì)算機(jī)圖像匹配技術(shù)有效地提高了準(zhǔn)確率。這不僅能夠提高教師在教學(xué)過程中批改的客觀性和效率,更能夠使得學(xué)生更加尊重考核的嚴(yán)肅性。同時(shí),該算法屬于圖像處理方面的基礎(chǔ)算法,同時(shí)在人工智能學(xué)習(xí)方面的基礎(chǔ)數(shù)據(jù)標(biāo)記處理上也有很重要的意義。
ORB 算法[1]作者Ethan Rublee 在2011年發(fā)表于ICCV,該算法提取并根據(jù)該特征點(diǎn)的方向,采用改進(jìn)之后的BRIEF 算法的Rotated BRIEF 算法對(duì)該特征點(diǎn)進(jìn)行數(shù)學(xué)分析。該算法可以進(jìn)行特征提取和特征描述,有效性和效率很高,而且也具有旋轉(zhuǎn)不變性。該算法所解決的問題是SIFT 算法方面的大量算法復(fù)雜度方面的代價(jià)以及BRIEF 特征算法本身缺乏旋轉(zhuǎn)、尺度等幾何方面的不變性,以及受噪點(diǎn)影響非常大。首先該算法使用FAST 對(duì)圖圖片的進(jìn)行特征點(diǎn)提取之后生成ORB 算法的描述子,在進(jìn)行BRIEF 點(diǎn)特征匹配從而實(shí)現(xiàn)快速精確匹配。FAST 的特征檢測(cè)算法中沒有特征描述與匹配從而達(dá)到快速而有效。而BRIEF 特征不具備旋轉(zhuǎn)、尺度等幾何方面的不變性,對(duì)噪點(diǎn)方面有效性也不高,以上的缺陷在steer BRIEF 和rBRIEF 改進(jìn)之后的描述特征子方面基于統(tǒng)計(jì)規(guī)律利用貪心選擇對(duì)算法進(jìn)行了優(yōu)化。因此,ORB 算法在FAST 算法的基礎(chǔ)上在特征點(diǎn)的檢測(cè)和描述方面具有幾何特征比如尺度與旋轉(zhuǎn)方面的不變性,對(duì)于噪點(diǎn)的處理也十分有效。從而使得ORB 算法實(shí)現(xiàn)有效匹配的基礎(chǔ)上,在時(shí)間方面遠(yuǎn)比SIFT 算法和SURF 算法有效,比SIFT 有效100 倍,比SURF 有效10 倍。
邢藝馨等在基于ORB 與K-means 聚類的圖像匹配算法[1]一文中在雙目視覺領(lǐng)域圖像匹配的高精準(zhǔn)、高時(shí)效性匹配技術(shù)方面進(jìn)一步探索。為了提高匹配特征點(diǎn)的檢測(cè)準(zhǔn)確要求,該文采用K-means即K 均值聚類的圖像匹配算法。在減少時(shí)間復(fù)雜度方面的基礎(chǔ)上,提高了雙目圖像特征匹配的精確度,從而實(shí)現(xiàn)了更優(yōu)秀的性能。李小紅等在基于ORB 特征的快速目標(biāo)檢測(cè)算法[2]描述了一種新的動(dòng)態(tài)運(yùn)動(dòng)場(chǎng)景下目標(biāo)檢測(cè)匹配特征算法,采用八參數(shù)旋轉(zhuǎn)模型并且與最小二乘法相結(jié)合,從而實(shí)現(xiàn)對(duì)全局性的運(yùn)動(dòng)參數(shù)進(jìn)行求解以達(dá)到動(dòng)態(tài)補(bǔ)償,該文利用PROSAC 算法去除不必要的特征點(diǎn),性能上與SURF 的相比不相上下,檢測(cè)速度提高很多。從而實(shí)現(xiàn)精準(zhǔn)實(shí)時(shí)的檢測(cè)目標(biāo)。白雪冰等結(jié)合快速魯棒性特征改進(jìn)ORB 的特征點(diǎn)匹配算法[3]通過SURF 算法和ORB 算法改進(jìn)結(jié)合。利用Hessian 矩陣檢測(cè)特征點(diǎn)從而實(shí)現(xiàn)幾何方面的尺度不變性,利用ORB 算法快速生成特征點(diǎn),該算法提高了ORB 的匹配精度和SURF 算法速度。雖然時(shí)間效率方面低于ORB 算法,但保持了SURF 算法在幾何尺度和旋轉(zhuǎn)方面的不變性,而且提高了匹配精度。
在本文中提出了ORB 和RANSAC 算法的圖像匹配查重算法為基礎(chǔ),實(shí)現(xiàn)了學(xué)生論文、作業(yè)和實(shí)驗(yàn)報(bào)告等圖片的匹配,通過匹配實(shí)現(xiàn)對(duì)作品進(jìn)行查重分析。通過對(duì)學(xué)生畢業(yè)論文、實(shí)驗(yàn)、實(shí)訓(xùn)報(bào)告以及作業(yè)中的圖片數(shù)據(jù)整理篩選之后作為數(shù)據(jù)集。通過ORB 算法進(jìn)行特征點(diǎn)快速提取,以及利用RANSAC 算法的優(yōu)勢(shì)去除并篩選出正確的匹配特征點(diǎn),利用優(yōu)化之后ORB 算法充分考慮參數(shù)的設(shè)定和現(xiàn)實(shí)可能出現(xiàn)的多樣性之后,優(yōu)化并實(shí)現(xiàn)匹配查重算法。
ORB 算法在本文的實(shí)踐當(dāng)中可以分解為如下幾個(gè)步驟:
ORB 首先需要進(jìn)行的是特征檢測(cè),這個(gè)步驟采用的FAST 快速選擇關(guān)鍵點(diǎn)算法,選定特征點(diǎn)閾值參數(shù),對(duì)于某一個(gè)像素點(diǎn)該點(diǎn)周圍16 個(gè)像素來說,該點(diǎn)灰度值在該參數(shù)差值范圍內(nèi)則該點(diǎn)就是需要尋找的關(guān)鍵特征點(diǎn)。
其次要進(jìn)行創(chuàng)建二進(jìn)制特征向量,在對(duì)于給定圖像平滑處理之后以關(guān)鍵特征點(diǎn)為中心根據(jù)高斯分布抽取一個(gè)像素。再以這個(gè)像素點(diǎn)為中心再根據(jù)高斯分布抽取一個(gè)像素,比較以上兩個(gè)像素點(diǎn)的灰度值,亮度高的賦值1,亮度低的賦值0。重復(fù)循環(huán)以上步驟產(chǎn)生一定長(zhǎng)度的特征描述符。
根據(jù)上一步驟產(chǎn)生的特征描述符并不具有縮放和旋轉(zhuǎn)等幾何方面的不變性,構(gòu)建圖像金字塔以解決縮放不變性,通過為關(guān)鍵特征點(diǎn)分配方向以解決旋轉(zhuǎn)不變性。

圖1:特征點(diǎn)示例

圖2:特征點(diǎn)匹配結(jié)果(類似但無抄襲)

圖3:特征點(diǎn)匹配結(jié)果(類似且抄襲明顯)
以上步驟中找到的特征點(diǎn)通過FLANN 特征匹配,根據(jù)上面的特征描述產(chǎn)生的特征點(diǎn)的特征量進(jìn)行比較、篩選,最終得到匹配點(diǎn)集合。隨機(jī)一致性采樣方法RANSAC 剔除無效數(shù)據(jù)點(diǎn)剔除錯(cuò)誤匹配。
在廣泛的學(xué)生畢業(yè)論文、作業(yè)、實(shí)驗(yàn)實(shí)訓(xùn)報(bào)告中選取有代表性的圖像作為實(shí)驗(yàn)案例,如圖1 所示,根據(jù)原始試驗(yàn)資料取得特征點(diǎn)。根據(jù)具體實(shí)際情況不同分為若干可能性的實(shí)驗(yàn)組,例如圖2 結(jié)果中實(shí)驗(yàn)結(jié)果類似但兩幅圖之間并無抄襲現(xiàn)象。但一旦有圖像類似且已出現(xiàn)抄襲等行為,可以根據(jù)算法篩選出,例如圖3 所示結(jié)果。通過以上結(jié)果可以看出,相似圖像之間匹配特征點(diǎn)結(jié)果符合預(yù)期,且實(shí)驗(yàn)中獲取結(jié)果算法效率較高,匹配速度快速有效。
本文將ORB以及RANSAC算法融合以實(shí)現(xiàn)圖像匹配查重算法,以實(shí)現(xiàn)對(duì)學(xué)生的論文、實(shí)驗(yàn)實(shí)訓(xùn)報(bào)告、作業(yè)等出現(xiàn)的圖像進(jìn)行查重處理。該實(shí)驗(yàn)改進(jìn)了傳統(tǒng)查重中針對(duì)文字查重的不足,通過人工智能這一新技術(shù)應(yīng)用ORB 算法解放了教師在大量圖片審核批改的精力。嘗試ORB 技術(shù)在特征點(diǎn)尋找中的應(yīng)用,采用教學(xué)中學(xué)生實(shí)驗(yàn)實(shí)訓(xùn)報(bào)告作為數(shù)據(jù),實(shí)驗(yàn)結(jié)果表明,經(jīng)過優(yōu)化后的圖像匹配查重算法是高速而且有效的。在今后的研究中會(huì)進(jìn)一步探討ORB 算法在其他層面應(yīng)用中優(yōu)化和改進(jìn)的可能。