王順然


摘要 本文展示了一種在將圖片根據顏色數值進行分割之后,使用DBSCAN算法進行降噪的方法。本文只討論在點陣圖的情況下的處理方法,矢量圖并不適用。
關鍵詞 DBSCAN算法;探測點;高斯噪點
中圖分類號 U2 文獻標識碼 A 文章編號2095—6363(2016)13—0002—01
數字照片含有確定行數與列數的像素。像素是點圖中最小的基礎單位,包含著表示該點像素顏色或者亮度的數值。在一張數字照片中,相似的像素會聚集。這也就意味著,如果有一個像素看起來明顯與附近其他的像素不同,即該像素點的色度值(Grey value或者RGB)與周圍的點明顯不同,這個像素點很有可能被識別為一個噪點。現在已經有很多降噪器(noise deduction filter)的方法被發明了出來,比如說,中值降噪器(median filter),會將圖片中的每個像素點用附近九個像素數值的中位數來替換原本的數值。不同的降噪器可以用來處理不同的圖片。但是絕大多數降噪器會移除部分圖片中的信息。
為了盡量避免圖片中的部分信息被移除,本文會提供一種探測圖像噪點的方法,用此方法先來探測噪點,之后可以用降噪器來對已經探測出的噪點進行處理,來盡量避免圖片信息的丟失。
1實驗設計
為了能夠將數值相似的像素進行聚類,我們要采取的方法就是將圖像根據原本像素的數值進行分割(image segmentation),而相對孤立的點則意味著該點與周圍的點的數值存在明顯不同。所以,出現在我們的聚類算法中的噪點,就可以被我們判斷為噪點。在本文中,我們將會用一種對數值進行分割的最簡單的方法,使用臨界值進行分割(thresholding)。這種方法是一種古老、簡單并且受歡迎的對圖像進行分割的方法。
DBSCAN算法在1996年被Martin Ester,Hans Peter Kriegel,Jrg Sander和Xiaowei Xu。我們使用這種算法的主要目的是這種方法是一種基于密度的聚類算法。在聚集中的像素的密度要大于噪點中像素的密度。并且DBSCAN算法并不像kmeans算法一樣需要提前給出聚集數量作為前提條件,而且可以對于任何形狀的點集進行聚類。它還可以對于一個點集外環繞但并不連接的另外一個點集進行聚類。DBSCAN需要兩個自定義的參數:掃描半徑(eps)和最小包含的點數(minPts)。隨機選取一個未被訪問(unvisited)的點開始,找出與其距離在eps之內(包括eps)的所有像素點。如果附近點的數量≥最小包含點數(minPts),則當前點與其附近像素點形成一個簇(cluster),并且出發點被標記為己訪問(visited)。然后,以同樣的方法處理該簇內所有沒有被標記為已訪問(visited)的點,擴展該簇。如果附近點的數量<最小包含點數(minPts),則該點暫時被標記作為噪點。如果簇充分地被擴展,即簇內的所有點被標記為已訪問(visited),然后繼續使用DBSCAN算法去處理未被訪問的其他簇。
2實驗
高斯噪點。高斯噪點指的是一種功率譜函數是常數,且幅度服從高斯分布,即正態分布的噪聲信號。因其可加性、幅度服從正態分布且功率譜函數是常數命名。
3結論
從實驗結果中可以發現,我們的算法成功識別出來了圖像分割后大多數的偏離值outlier,證明了本算法能夠用來探測圖像噪點。endprint