摘要:計(jì)算機(jī)視覺技術(shù)集數(shù)字圖像處理、數(shù)字信號(hào)處理、光學(xué)、物理學(xué)、幾何學(xué)、應(yīng)用數(shù)學(xué)、模式識(shí)別及人工智能等知識(shí)于一體,其應(yīng)用已經(jīng)涉及到計(jì)算幾何、計(jì)算機(jī)圖形學(xué)、圖像處理、機(jī)器人學(xué)等領(lǐng)域。文中簡(jiǎn)要地回顧了計(jì)算機(jī)視覺技術(shù)的發(fā)展史,主要介紹了計(jì)算機(jī)視覺中圖像處理技術(shù)在檢測(cè)技術(shù)方面的應(yīng)用。利用工業(yè)攝像鏡頭替代目視作為傳感器,通過(guò)圖像采集,圖像處理,圖像識(shí)別等一系列操作,達(dá)到在線對(duì)包裝產(chǎn)品進(jìn)行標(biāo)簽檢測(cè)的目的。
關(guān)鍵詞:計(jì)算機(jī)視覺;圖像處理;視覺系統(tǒng);圖像識(shí)別;檢測(cè);標(biāo)簽
中圖分類號(hào):TP311.5 文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-3044(2008)35-2449-02
The Development and Application of Computer Vision Technology
CHEN Dan
(Wuhan Vocational College of Software and Engineering, Wuhan 430205, China)
Abstract: Computer vision technology integrates the knowledge on digital image processing, digital signal processing, optics, physics, geometry, applied mathematics, pattern recognition, artificial intelligence, etc. Its application has involved in such fields as computational geometry, computer graphics, image processing, robotics and so on. In this paper the history of computer vision technology is reviewed. As one of the technology, image processing applied to measurement technology is mainly introduced. An image processing system is presented, using industrial camera lens instead of man eyes as the sensors, through a series of operation, like image sample, image processing, image dissecting, then the identification of labels can be realized.
Key words: computer vision; image processing; vision system; image recognition; identification; labels
1 引言
計(jì)算機(jī)視覺是人工智能領(lǐng)域的一個(gè)重要部分,它的研究目標(biāo)是使計(jì)算機(jī)具有通過(guò)二維圖像認(rèn)知三維環(huán)境信息的能力。計(jì)算機(jī)視覺是以圖象處理技術(shù)、信號(hào)處理技術(shù)、概率統(tǒng)計(jì)分析、計(jì)算幾何、神經(jīng)網(wǎng)絡(luò)、機(jī)器學(xué)習(xí)理論和計(jì)算機(jī)信息處理技術(shù)等為基礎(chǔ),通過(guò)計(jì)算機(jī)分析與處理視覺信息。作為一個(gè)科學(xué)學(xué)科,計(jì)算機(jī)視覺研究相關(guān)的理論和技術(shù),試圖建立能夠從圖像或者多維數(shù)據(jù)中獲取信息的人工系統(tǒng)。計(jì)算機(jī)視覺是一門綜合性的學(xué)科,它已經(jīng)吸引了來(lái)自各個(gè)學(xué)科的研究者參加到對(duì)它的研究之中,其中包括計(jì)算機(jī)科學(xué)和工程、信號(hào)處理、物理學(xué)、應(yīng)用數(shù)學(xué)和統(tǒng)計(jì)學(xué),神經(jīng)生理學(xué)和認(rèn)知科學(xué)等。計(jì)算機(jī)視覺也是當(dāng)前計(jì)算機(jī)科學(xué)中的一個(gè)非常活躍的領(lǐng)域,計(jì)算機(jī)視覺領(lǐng)域與圖像處理,模式識(shí)別,投影幾何,統(tǒng)計(jì)推斷,統(tǒng)計(jì)學(xué)習(xí)等學(xué)科密切相關(guān),近年來(lái),與計(jì)算機(jī)圖形學(xué),三維表現(xiàn)等學(xué)科也發(fā)生了很強(qiáng)的聯(lián)系。
2 計(jì)算機(jī)視覺技術(shù)的出現(xiàn)與發(fā)展
計(jì)算機(jī)視覺是在20世紀(jì)50年代從統(tǒng)計(jì)模式識(shí)別開始的,當(dāng)時(shí)的工作主要集中在二維圖像分析和識(shí)別上,如光學(xué)字符識(shí)別,工件表面、顯微圖片和航空?qǐng)D片的分析和解釋等.60年代,Roberts(1965)通過(guò)計(jì)算機(jī)程序從數(shù)字圖像中提取出諸如立方體、楔形體、棱柱體等多面體的三維結(jié)構(gòu),并對(duì)物體形狀及物體的空間關(guān)系進(jìn)行描述[Roberts 1965]。到了70年代,已經(jīng)出現(xiàn)了一些視覺應(yīng)用系統(tǒng)[Guzman 1969, Mackworth 1973,]。70年代中期,麻省理工學(xué)院(MIT)人工智能(AI)實(shí)驗(yàn)室正式開設(shè)“機(jī)器視覺”(Machine Vision)課程,由國(guó)際著名學(xué)者B.K.P.Horn教授講授。80年代以來(lái), 計(jì)算機(jī)視覺的研究已經(jīng)歷了從實(shí)驗(yàn)室走向?qū)嶋H應(yīng)用的發(fā)展階段。而計(jì)算機(jī)工業(yè)水平的飛速提高以及人工智能、并行處理和神經(jīng)元網(wǎng)絡(luò)等學(xué)科的發(fā)展,更促進(jìn)了計(jì)算機(jī)視覺系統(tǒng)的實(shí)用化和涉足許多復(fù)雜視覺過(guò)程的研究。目前,計(jì)算機(jī)視覺技術(shù)正在廣泛地應(yīng)用于計(jì)算幾何、計(jì)算機(jī)圖形學(xué)、圖像處理、機(jī)器人學(xué)等多個(gè)領(lǐng)域中。
3 計(jì)算機(jī)視覺技術(shù)的圖像處理方法
計(jì)算機(jī)視覺系統(tǒng)中,視覺信息的處理技術(shù)主要依賴于圖像處理方法,它包括圖像增強(qiáng)、數(shù)據(jù)編碼和傳輸、平滑、邊緣銳化、分割、特征抽取、圖像識(shí)別與理解等內(nèi)容。經(jīng)過(guò)這些處理后,輸出圖像的質(zhì)量得到相當(dāng)程度的改善,既改善了圖像的視覺效果,又便于計(jì)算機(jī)對(duì)圖像進(jìn)行分析、處理和識(shí)別。
3.1 圖像的增強(qiáng)
圖像的增強(qiáng)用于調(diào)整圖像的對(duì)比度,突出圖像中的重要細(xì)節(jié),改善視覺質(zhì)量。通常采用灰度直方圖修改技術(shù)進(jìn)行圖像增強(qiáng)。圖像的灰度直方圖是表示一幅圖像灰度分布情況的統(tǒng)計(jì)特性圖表,與對(duì)比度緊密相連。通過(guò)灰度直方圖的形狀,能判斷該圖像的清晰度和黑白對(duì)比度。如果獲得一幅圖像的直方圖效果不理想,可以通過(guò)直方圖均衡化處理技術(shù)作適當(dāng)修改,即把一幅已知灰度概率分布圖像中的像素灰度作某種映射變換,使它變成一幅具有均勻灰度概率分布的新圖像,實(shí)現(xiàn)使圖像清晰的目的。
3.2 圖像的平滑
圖像的平滑處理技術(shù)即圖像的去噪聲處理,主要是為了去除實(shí)際成像過(guò)程中因成像設(shè)備和環(huán)境所造成的圖像失真,提取有用信息。眾所周知,實(shí)際獲得的圖像在形成、傳輸、接收和處理的過(guò)程中,不可避免地存在著外部干擾和內(nèi)部干擾,如光電轉(zhuǎn)換過(guò)程中敏感元件靈敏度的不均勻性、數(shù)字化過(guò)程的量化噪聲、傳輸過(guò)程中的誤差以及人為因素等,均會(huì)使圖像變質(zhì)。因此,去除噪聲,恢復(fù)原始圖像是圖像處理中的一個(gè)重要內(nèi)容。
3.3 圖像的數(shù)據(jù)編碼和傳輸
數(shù)字圖像的數(shù)據(jù)量是相當(dāng)龐大的,一幅512*512個(gè)像素的數(shù)字圖像的數(shù)據(jù)量為256 K字節(jié),若假設(shè)每秒傳輸25幀圖像,則傳輸?shù)男诺浪俾蕿?2.4M比特/秒。高信道速率意味著高投資,也意味著普及難度的增加。因此,傳輸過(guò)程中,對(duì)圖像數(shù)據(jù)進(jìn)行壓縮顯得非常重要。數(shù)據(jù)的壓縮主要通過(guò)圖像數(shù)據(jù)的編碼和變換壓縮完成。圖像數(shù)據(jù)編碼一般采用預(yù)測(cè)編碼,即將圖像數(shù)據(jù)的空間變化規(guī)律和序列變化規(guī)律用一個(gè)預(yù)測(cè)公式表示,如果知道了某一像素的前面各相鄰像素值之后,可以用公式預(yù)測(cè)該像素值。該方法可將一幅圖像的數(shù)據(jù)壓縮到為數(shù)不多的幾十個(gè)特傳輸,在接收端再變換回去即可。
3.4 邊緣銳化
圖像邊緣銳化處理主要是加強(qiáng)圖像中的輪廓邊緣和細(xì)節(jié),形成完整的物體邊界,達(dá)到將物體從圖像中分離出來(lái)或?qū)⒈硎就晃矬w表面的區(qū)域檢測(cè)出來(lái)的目的。它是早期視覺理論和算法中的基本問(wèn)題,也是中期和后期視覺成敗的重要因素之一。
3.5 圖像的分割
圖像分割是將圖像分成若干部分,每一部分對(duì)應(yīng)于某一物體表面,在進(jìn)行分割時(shí),每一部分的灰度或紋理符合某一種均勻測(cè)度度量。某本質(zhì)是將像素進(jìn)行分類。分類的依據(jù)是像素的灰度值、顏色、頻譜特性、空間特性或紋理特性等。圖像分割是圖像處理技術(shù)的基本方法之一,應(yīng)用于諸如染色體分類、景物理解系統(tǒng)、機(jī)器視覺等方面。圖像分割主要有兩種方法:一是鑒于度量空間的灰度閾值分割法。它是根據(jù)圖像灰度直方圖來(lái)決定圖像空間域像素聚類。二是空間域區(qū)域增長(zhǎng)分割方法。它是對(duì)在某種意義上(如灰度級(jí)、組織、梯度等)具有相似性質(zhì)的像素連通集構(gòu)成分割區(qū)域,該方法有很好的分割效果,但缺點(diǎn)是運(yùn)算復(fù)雜,處理速度慢。
3.6 圖像的識(shí)別
圖像的識(shí)別過(guò)程實(shí)際上可以看作是一個(gè)標(biāo)記過(guò)程,即利用識(shí)別算法來(lái)辨別景物中已分割好的各個(gè)物體,給這些物體賦予特定的標(biāo)記,它是計(jì)算機(jī)視覺系統(tǒng)必須完成的一個(gè)任務(wù)。按照?qǐng)D像識(shí)別從易到難,可分為三類問(wèn)題。第一類識(shí)別問(wèn)題中,圖像中的像素表達(dá)了某一物體的某種特定信息。第二類問(wèn)題中,待識(shí)別物是有形的整體,二維圖像信息已經(jīng)足夠識(shí)別該物體,如文字識(shí)別、某些具有穩(wěn)定可視表面的三維體識(shí)別等。第三類問(wèn)題是由輸入的二維圖、要素圖、2×5維圖等,得出被測(cè)物體的三維表示。這里存著如何將隱含的三維信息提取出來(lái)的問(wèn)題,當(dāng)是今研究的熱點(diǎn)。目前用于圖像識(shí)別的方法主要分為決策理論和結(jié)構(gòu)方法。決策理論方法的基礎(chǔ)是決策函數(shù),利用它對(duì)模式向量進(jìn)行分類識(shí)別,是以定時(shí)描述(如統(tǒng)計(jì)紋理)為基礎(chǔ)的;結(jié)構(gòu)方法的核心是將物體分解成了模式或模式基元,而不同的物體結(jié)構(gòu)有不同的基元串(或稱字符串),通過(guò)對(duì)未知物體利用給定的模式基元求出編碼邊界,得到字符串,再根據(jù)字符串判斷它的屬類。這是一種依賴于符號(hào)描述被測(cè)物體之間關(guān)系的方法。
4 基于圖像處理技術(shù)的標(biāo)簽檢測(cè)應(yīng)用實(shí)例
隨著當(dāng)今工業(yè)生產(chǎn)水平的提高,人們對(duì)產(chǎn)品質(zhì)量要求亦愈來(lái)愈高,自動(dòng)化生產(chǎn)已經(jīng)成為一個(gè)必然趨勢(shì),在線檢測(cè)技術(shù)則在自動(dòng)化生產(chǎn)中占有著越來(lái)越重要的地位。如何提高檢測(cè)效率和檢測(cè)準(zhǔn)確性是目前需要解決的問(wèn)題,采用計(jì)算機(jī)視覺技術(shù)與其它檢測(cè)方式相比,它能夠節(jié)約時(shí)間和節(jié)省勞動(dòng)力。目前采用計(jì)算機(jī)視覺技術(shù)的檢測(cè)系統(tǒng)具有速度快,精度高,非接觸式等優(yōu)點(diǎn)。
下面我們?cè)O(shè)計(jì)了一個(gè)圖像處理系統(tǒng)的應(yīng)用實(shí)例,利用工業(yè)攝像鏡頭替代目視作為傳感器,通過(guò)圖像采集,圖像處理,圖像識(shí)別等一系列操作,達(dá)到在線對(duì)包裝產(chǎn)品進(jìn)行標(biāo)簽檢測(cè)的目的。本系統(tǒng)是對(duì)包裝產(chǎn)品進(jìn)行標(biāo)簽檢測(cè),主要檢測(cè)目標(biāo)是:檢測(cè)標(biāo)簽的有無(wú);檢測(cè)包裝上標(biāo)簽是否破損;檢測(cè)標(biāo)簽邊角是否折疊,檢測(cè)標(biāo)簽是否在正確的位置;檢測(cè)標(biāo)簽粘貼的方向是否正確。
系統(tǒng)的硬件基本構(gòu)成如圖1所示。由于是對(duì)產(chǎn)品的在線檢測(cè),因此系統(tǒng)選用具有異步復(fù)位功能的黑白CCD攝像機(jī)進(jìn)行拍攝。所得圖像通過(guò)圖像采集卡送入計(jì)算機(jī)中進(jìn)行處理,同時(shí)在監(jiān)視器上顯示出當(dāng)前標(biāo)簽圖像,檢驗(yàn)工可以進(jìn)行目測(cè)和人工判斷。系統(tǒng)的光源選用節(jié)能光管,它具有壽命長(zhǎng)、亮度高點(diǎn)等特點(diǎn)。
圖像信號(hào)在圖像采集卡中經(jīng)過(guò)A/D轉(zhuǎn)換為8位的數(shù)字信號(hào),數(shù)字信號(hào)的值0對(duì)應(yīng)暗,255對(duì)應(yīng)亮,數(shù)值在0~255之間,對(duì)應(yīng)不同的明暗情況,然后將數(shù)字信號(hào)送入到計(jì)算機(jī)存儲(chǔ)器中進(jìn)行處理。系統(tǒng)選用擴(kuò)展性強(qiáng)的VC++語(yǔ)言進(jìn)行圖像處理軟件的開發(fā)。
在本系統(tǒng)中,每個(gè)產(chǎn)品在運(yùn)行過(guò)程中在傳送帶的位置不變,且粘有標(biāo)簽的檢測(cè)面與鏡頭正對(duì),保證在獲取的圖像中只有標(biāo)簽發(fā)生變化。圖像處理系統(tǒng)通過(guò)對(duì)提取出的標(biāo)簽圖像的面積、重心和方向的計(jì)算,來(lái)判斷標(biāo)簽是否合格。通過(guò)逐行掃描,計(jì)算出包含像素的多少。當(dāng)產(chǎn)品沒(méi)有貼上標(biāo)簽,標(biāo)簽破損以及標(biāo)簽標(biāo)邊角產(chǎn)生折疊的時(shí)候,檢測(cè)出來(lái)的標(biāo)簽面積必然發(fā)生變化,通過(guò)與預(yù)先設(shè)定的標(biāo)簽面積值相比較,當(dāng)超出設(shè)定誤差范圍的時(shí)候,則認(rèn)為不合格。系統(tǒng)首先計(jì)算出標(biāo)準(zhǔn)圖像中心坐標(biāo),這樣就能設(shè)定出合格標(biāo)簽的重心坐標(biāo)范圍。如果當(dāng)前圖像的重心坐標(biāo)處于這一范圍內(nèi),則認(rèn)為標(biāo)簽所貼位置正確。
本實(shí)例采用計(jì)算機(jī)視覺技術(shù)對(duì)產(chǎn)品標(biāo)簽進(jìn)行檢測(cè),通過(guò)對(duì)標(biāo)簽圖像特征值的計(jì)算來(lái)判斷標(biāo)簽是否合格,該方法簡(jiǎn)單實(shí)用,可以滿足標(biāo)簽檢測(cè)的需要。
5 結(jié)論
計(jì)算機(jī)視覺技術(shù)正廣泛地應(yīng)用于各個(gè)方面,從醫(yī)學(xué)圖像到遙感圖像,從工業(yè)檢測(cè)到文件處理,從毫微米技術(shù)到多媒體數(shù)據(jù)庫(kù),并成為計(jì)算機(jī)科學(xué)的重要研究領(lǐng)域之一。
參考文獻(xiàn):
[1] 朱虹.數(shù)字圖像處理基礎(chǔ)[M].北京:科技出版社,2005.
[2] 夏良正.數(shù)字圖像處理[M].南京:東南大學(xué)出版社,1999.
[3] 賈云得.機(jī)器視覺[M].北京:科學(xué)出版社,2000.
[4] 陳兵旗,孫明.Visual C++實(shí)用圖像處理[M].北京:清華大學(xué)出版社,2004.
[5] 王永強(qiáng).工業(yè)圖像在線識(shí)別中的一種有效方法[J].天津輕工業(yè)學(xué)院學(xué)報(bào),1998,2:25-27.
[6] 毛文華,王一鳴,張小超.實(shí)時(shí)識(shí)別行間雜草的機(jī)器視覺系統(tǒng)[J].農(nóng)業(yè)工程學(xué)報(bào),2003,19(5):114-117.
[7] 楊枝靈,王開.Visual C++數(shù)字圖像獲取處理及實(shí)踐應(yīng)用[M].人民郵電出版社,2003.
[8] 李煒,黃心漢,王敏.一種快速Hough變換改進(jìn)算法及其在圖像邊緣檢測(cè)中的應(yīng)用[J].信號(hào)處理,1999,6(15):182-185.
[9] 鄧?yán)^忠,張?zhí)X,羅錫文.計(jì)算機(jī)視覺技術(shù)在農(nóng)產(chǎn)品品質(zhì)檢測(cè)中的應(yīng)用[J].廣東農(nóng)機(jī),2002(2):25-27.
[10] 吳冰,秦志遠(yuǎn).自動(dòng)確定圖像二值化最佳閥值的新方法[J].測(cè)繪學(xué)院學(xué)報(bào),2001(12):283-286.