田凱 杜鵬 杭州電子科技大學數字媒體與藝術設計學院
基于C#的圖像分類系統實現
田凱 杜鵬 杭州電子科技大學數字媒體與藝術設計學院
本文介紹了基于C#的圖像分類系統的實現。目前,支持向量機是分類研究中的熱點,它建立在統計學理論基礎上的,相比與神經網絡分類和傳統分類方法具有較高的泛化性能。本文研究了圖像的顏色特征在圖像分類中的作用,并對顏色特征基本理論做了簡要的說明。同時對核函數在SVM分類器中對圖像分類的影響做了扼要論述。在C#平臺上建立了一個使用SVM分類器的圖像分類系統,并討論了組成系統的各個模塊及其功能。
支持向量機 核函數 特征提取 圖像分類
人類的活動產生了大量的數字圖像。然而,爆炸式增長的數字圖像卻給人們帶來了困擾。大量的圖像涵蓋了各領域的信息,人們從還量的圖像中獲得想要的信息的難度增大。因此,人們要求計算機對圖像的自動分類檢索能力有更大的提升,從而能更快、更有效的獲得目標信息。支持向量機有廣泛的應用前景,本文主要是通過核函數來對SVM分類器進行研究,然后在VS2010C#平臺上實現一個基于支持向量機的圖像分類系統。
本文使用C#平臺基于支持向量機算法對圖像進行分類,包括圖像數據庫、圖像特征提取、分類器三個模塊。圖像數據庫的數據內容是從Web等處下載的若干圖像共222張圖片作為系統的數據庫。對于圖像類別的選擇主要是特征明顯,易于從色彩上區分。圖像特征提取部分主要是對輸入的文件和數據庫的訓練集進行圖像特征提取,其一,數據庫中的訓練集進行圖像特征的提取,把這些圖像特征值進行處理后輸入到相應的文件中,然后執行分類器算法,生成分類模型;其二,對測試樣本(輸入的圖像)進行圖像特征提取,然后執行分類模型,生成預測結果。SVM的分類模塊主要是輸入的圖像和數據庫的圖像進行匹配,整個分類器的關鍵是圖像特征提取和分類器算法,分類器的算法包括多項式核函數、高斯核函數、卡方核以及直方圖交叉核等。不同的核函數引起原理不一樣多分類結果的影響也不一樣。
統計學習的出現和完善,再到結構風險最小化原理的提出,這些為支持向量機的出現提供了理論基礎,支持向量機的主要作用就是利用小樣本提供的信息去在模式繁復程度性和學習能力中間找出最優價值的方案,期望得到良好的發展進步和泛化能力。傳統的模式識別方法都是建立在經驗風險最小化的基礎上的,只在樣本數量趨近于無于無窮大時才有理論上的性能保障。而支持向量機是基于統計學理論為研究小樣本情況下的模糊識別模式。支持向量機是在有限數據及、非線性和維度較高的模式識別問題中展示了其良好的學習能了,在解決過學習和欠學習問題、局部最小值問題等有更佳的發展潛力。
核函數的功能就是將輸入空間中的線性不可分問題,通過非線性變化映到某個高維空間中,然后在高維空空間中求出一個最優分類平面,在進行線性分類,以此來提高學習機器的非線性計算能力。高維空間的所有值都是通過的核函數映射而得到的,我們不需要知道映射后的空間向量來進行計算最優平面,甚至不需要知道具體的映射,維數的改變只影響了內積運算,不會影響到算法的復雜度。
人眼對色彩圖像比對黑白圖像的有更豐富的主觀視覺感受,為了有效的利用科學技術,尤其是利用計算來處理圖像的色彩信息,就必須用定量的方法來對圖像的色彩信息進行描述,建立彩色模型。人們對圖像彩色的描述具有多樣性,選擇恰當的方法來表是顏色是非常必要的,在圖像處理的自動分析中,顏色特征的表達方式不止依靠提前決定的顏色模型,但是顏色空間的數據在計算機是以數字形式儲存和顯示的,和人對色彩空間的帶感情色的感官并不一致。人們對色彩的感覺與許多的所處空間的物理現象、人當時心理狀態和生理效果有關,是一種比較復雜的化學反應關系。普通情況下,我們獲取的圖像都是使用RGB顏色空間描述,但是HSV顏色空間更符合人類視覺感知,因此在進行某些圖像處理的時候,可以根據需要將圖像從RGB顏色空間模型轉化成HSV顏色空間模型。
隨著網絡技術和新興多媒體技術的迅速發展,人們對于圖像數據的搜索和分類要求越來越高。本文對支持向量機在圖像分類方面進行了研究,主要有:其一,研究了支持向量機的發展進程;其二,研究了核函數對SVM分類器性能的影響,分析了核函數參數的選擇方法;其三,研究了基于圖像內容分類的基本原理,并對圖像顏色提取技術做了簡單的探索。
[1]張文博.多類別智能分類器方法研究[D].西安電子科技大學,2014
[2]高錦.基于SVM的圖像分類[D].西北大學,2010
[3]淦艷.多核學習算法及其在人臉檢測中的應用[D].重慶師范大學,2015