李冠楠,譚慶昌*,張 闊,張宇鵬
(1.吉林大學 機械科學與工程學院,吉林 長春 130025;2.中國科學院 長春光學精密機械與物理研究所,吉林 長春 130033)
近年來,由于能源的不斷枯竭以及全球暖化問題的日益嚴重,促使各國都在不斷地尋找新能源,且考慮到地域限制、安全性等因素,現階段較可行的下一代替代能源便是太陽能。太陽能電池是獲取太陽能的最主要的光電組件,目前全球所生產的太陽能電池90%以上使用結晶硅,只有約10%使用薄膜技術。結晶硅依照制造材質不同,又可分為單晶硅、多晶硅與非晶硅,現今消費市場的應用大多使用多晶硅,主要是因為多晶硅制程簡單且無需封裝,所以價格較為便宜。在太陽能電池的制造過程中[1],常因為疏失造成太陽能芯片表面刮傷、污點以及裂痕等瑕疵產生,如果忽視這些瑕疵,會造成太陽能電池的工作效率降低,甚至喪失儲存電量的功能。因此,太陽能電池的制程檢測是必要的。
隨著太陽能電池產業的興起,太陽能芯片/電池的瑕疵檢測技術也得到了發展。2004年,Fu等[2]使用高斯-拉普拉斯濾波器找出單晶太陽能芯片表面裂痕的邊緣,進而使用形態學濾除噪聲并填補瑕疵。在檢測技術上首先使用圖像強化方法凸顯裂痕的輪廓,接著利用該輪廓的幾何特征及條件進行辨識。蔡欣儒[3]在2007年利用亞像素邊界檢測、霍夫變換和最小平方誤差法來檢測單晶太陽能芯片的邊緣,并利用偵測到的邊緣來判定是否有破損瑕疵。同年,陳心怡[4]針對不同類型的太陽能芯片影像,發展出不同的瑕疵檢測技術。對具有均勻表面的太陽能芯片,以多選擇性閾值檢測瑕疵。對具有規律性紋理表面的太陽能芯片,則事先訓練無瑕疵影像中10 種不同的紋理做為比對,以此檢測模版區塊內的瑕疵。
上述研究大多局限于單晶太陽能芯片的瑕疵檢測,且假設裂痕在影像中有顯著的灰度差異。多晶太陽能芯片則不能使用這些方法進行檢測,主要是因為多晶太陽能芯片表面晶格分布很復雜,且瑕庛與正常晶格的輪廓都呈現細長線條形狀,如果使用該方法進行檢測,則會將瑕疵與正常晶格邊緣同時檢測出來,而造成檢測誤判。由于多晶太陽能芯片的表面瑕疵無法由肉眼或一般CCD 攝影察覺,因此可以運用電致發光(EL)影像技術[5-6]來凸顯瑕疵。在EL 影像中,瑕疵具有條狀或線狀特性,而正常的隨機晶格背景也會被凸顯出來,使得自動瑕疵檢測的困難加大。為此,本文提出了一種基于模糊C 均值(FCM)聚類法[7]的EL 影像瑕疵檢測方法。首先,根據多晶太陽能芯片EL 影像的樣本特性,對傳統FCM 聚類法進行改進。其次,提取經過圖像處理的正常影像樣本的特征,并應用這些樣本特征進行訓練,即對正常樣本進行分群。最后,根據訓練結果完成多晶太陽能芯片的瑕疵檢測。
本研究旨在提高針對多群組未知數據進行辨識與分群的辨識準確率,以傳統FCM 聚類分群法為基礎方法,加入本研究的衡量標準與分群方法進行數據辨識與分群。由于具有二維特征的數據可以用繪圖的方法將結果顯示出來,因此本節僅以此類數據為例進行說明。


其中,C 代表分群數,N 為總樣本數,xk為第k 個樣本。參數p 是具有加權性質的指數,即取決于主觀意識的模糊程度,也就是說p 值越大,模糊程度越大。在本研究中,使用的權重權數為p=2。


其中dik=‖xk-vi‖。各群中心點會因重新計算的權重的改變而跟著更新,計算方法如下:

通過迭代,當目標函數J 達最小值或收斂為一穩定值時,即求得各群中心點vi與最終分群結果并停止計算。
從傳統FCM 的模型來看,雖然可以用于對任意群數的數據進行分群,但當樣本的群數過多時,通過上述的迭代求最小值的方法對樣本進行分類,就會使目標函數陷入局部的最小值,導致產生錯誤的分群結果。
如圖1(a)所示的樣本,從數據的分布情況看,應該將其分成20 群,但如果用傳統FCM 分群法一次將其分成20 組,結果得到的20 個群的中心位置如圖1(c)中實心點所示,從圖中可以明顯地看出分群效果不好,傳統FCM 分群法并沒有準確地找到每個群的中心。

圖1 傳統FCM 聚類法分群結果。(a)多群組;(b)疏密程度不同;(c)圓形與非圓形分布。Fig.1 Results of conventional FCM clustering method.(a)Multiple clusters.(b)Different level of density.(c)Circular and non-circular.
由于傳統FCM 分群算法主要是利用樣本點至中心點距離dik=‖xk-vi‖計算方式進行不斷的演算修正,因此適合在數據結構密度相當、數據形態成近圓的情況下使用。對于兩個數據形態擁有明顯差異或者疏密程度明顯不同的群集,以FCM 進行分群,其結果卻不理想且有很明顯的差異,如圖1(b)和(c)所示。
一般認為,傳統FCM 分群算法適合分較少群數的樣本,因此首先利用傳統FCM 分群算法將樣本分為兩群,通過均勻度的概念來衡量需要下一次分群的群組,即哪一群的均勻度差下一次就分哪一群,再用傳統FCM 分群算法將均勻度差的那一群分成兩群,以這兩群替換原來的群組。之后,繼續在剩下的所有群組中尋找均勻度最差的群組,并將其分成兩群,直到達到所需群數為止,其演算過程如圖2 所示。這種分群方法有助于充分利用傳統的FCM 分群算法的特點,而且只需一個參數來控制分群結果,該參數即為所分群數。

圖2 針對多群數樣本的改進FCM 聚類法流程圖Fig.2 Flow chart of improved FCM clustering method aiming at samples of multi-clusters
從樣本特征值的意義來看,一般認為在同一群內如果兩兩樣本的相關程度基本都一致,則該群的均勻性較好;如果兩兩樣本的相關程度不一致,則均勻度較差。因此,可以用主成分分析方法中的協方差矩陣來定義同組樣本的相關程度。
為了敘述方便,把測試樣本寫成如下形式:

首先,對樣本做零平均值處理,即:

其次,計算樣本的協方差矩陣K:

其中,A=[Δ x1Δ x2… Δ xc]。
最后,由協方差矩陣K 的特征值來計算群組的均勻度。令λ=[λ1λ2… λc]為協方差矩陣K 的c 個特征值,如果群組中樣本的相關性不一致,則c 個特征值的標準差較大,否則這個標準差較小。由于各群組樣本的疏密程度不完全相同,導致各群組的特征值不在同一數量級上,因此用協方差矩陣K 的特征值的標準差與均值的比值作為均勻性的衡量標準,即均勻度,其公式為:

在使用上述改進FCM 分群算法進行分群時,每次用傳統的FCM 分群算法把某個群組分為兩群,經常會出現樣本形態不是近圓形或疏密程度不均的現象。為了避免這種情況導致錯誤的分群結果,需要對每次分群時使用的傳統FCM 分群算法進行改進。本文將式(5)的目標函數改為如下形式:

由于傳統的FCM 并沒有考慮到數據的分散程度,因此在本研究中加入了變異數因子,該變異數因子是每個樣本點對各群中心點之變異程度,以加強同一群樣本之間的緊密性(相關性):

同時,將傳統FCM 算法中的dik=‖xk- vi‖修改為:

當r 逐漸增加時,每個樣本點至各群中心點距離的差距變大,便可達到加劇各群間差異性的目的。根據實驗資料測試,本文采用r=3??偨Y起來,針對樣本分布形態的改進FCM 算法演算流程如下:

(2)隨機從原始數據中取出一筆數據作為初始質心位置vi;
(4)求得目標函數J;
(7)更新質心位置vi;

圖3 改進FCM 聚類法分群結果。(a)多群組;(b)疏密程度不同;(c)圓形與非圓形分布。Fig.3 Results of improved FCM clustering method.(a)Multiple clusters.(b)Different level of density.(c)Circular and non-circular.
(8)重復(4)~(7),當J 達最小值或收斂為一穩定值時,計算停止。
如圖3 所示,使用改進FCM 聚類法對圖1 數據進行分群,誤判點的數目明顯減少,對樣本的辨識率得到了明顯的提高。

圖4 形態學處理實驗結果。(a)形態學處理前;(b)形態學處理后。Fig.4 Results of morphological processing.(a)Before morphological processing.(b)After morphological processing.
對于多晶太陽能芯片,金屬手指斷線(圖5(a))、微裂痕(圖5(b))和裂痕(圖5(c))是最常出現的3 種瑕疵,這些瑕疵在隨機晶格背景圖案中呈現條狀或帶狀特征。因此,根據Rainer Lienhart 等[8]提出的擴展Haar 特征,本文選取以下12 個特征用于邊緣像素點的特征值提取,如圖6 所示。
圖6 的3 組特征,每組的后2 個特征是由該組前兩個特征逆時針旋轉45°得到的。在這3 組特征中,第1 組和第2 組是邊緣特征,第3 組是線狀特征。每個特征的特征值可用公式表示為

圖5 太陽能芯片EL 影像瑕疵種類。(a)金屬手指斷線;(b)微裂痕;(c)裂痕。Fig.5 Defect types of solar cell in EL image.(a)Fingerinterruption.(b)Micro-crack.(c)Crack.

圖6 本文所選用的12 種擴展Haar 特征Fig.6 12 extended Haar features proposed in the article

其中:Fj代表第j 種Haar 特征的特征值,ω1是第j個Haar 特征的權值,ω2是第j 個Haar 特征中黑色矩形的權值,R1代表第j 個Haar 特征中包含的所有像素點的灰度值之和,R2代表第j 個Haar 特征中黑色矩形塊所包含的所有像素點的灰度值之和。前兩組特征原型的權值比ω1∶ω2=1∶(-2),第三組特征原型的權值比ω1∶ω2=1∶(-3)。
當固定Harr 塊的大小時,用這12 個特征對影像中的邊緣像素點進行特征值提取,即以該像素點為中心對Haar 塊大小的區域內的所有像素點做如公式(10)的運算,對于每個邊緣像素點就可以得到該樣本的12 特征值。為了測量像素尺寸不同大小的瑕疵,可以取多種Haar 特征的尺寸,如果取r 種Haar 特征的尺寸,對于某一個像素點,就可以得到12 ×r 個特征值。
本文在訓練時,只采用正常邊緣像素點的樣本作為訓練樣本,這就要求要收集到幾乎全部形式的正常樣本。這種要求對于用肉眼判斷的方式是很難做到的。本文采用以下方法:(1)通過觀察首先收集得到一些不同形式的正常無瑕疵的EL 影像(如圖7 所示),共10 張,將這些影像上的每個邊緣像素點作為一個樣本,這些樣本稱作不完全正常樣本;(2)用上述不完全原本進行訓練,并對若干張正常影像進行測試,在測試結果中會出現很多誤判點,這些誤判點是將正常樣本判成了瑕疵樣本,原因在于訓練樣本中并不含有這些正常樣本,因此再將這些誤判點附近的影像(如圖8 所示)加入到訓練影像中,這樣就得到了幾乎全部形式的正常樣本。

圖7 不完全的無瑕疵太陽能芯片EL 影像(經過形態學處理)Fig.7 Incomplete EL image of defect-free solar cell (after morphological processing)

圖8 誤判的無瑕疵太陽能芯片EL 影像(經過形態學處理)Fig.8 Misjudged EL image of defect-free solar cell (after morphological processing)
用上述正常樣本進行訓練,即使用第二節改進的FCM 分群法將其分為n 個群集。對于每個測試樣本,計算它到自身所屬群的群中心的歐式距離

其中,xi為第i 個樣本,i=1,2,…,n;vj為xi所在群的中心,j=1,2,…,n。
則每一群的閾值可定義為:
胃穿孔發病的原因具有較強的復雜性,其發病的原因也比較多,如胃潰瘍、胃癌等,在傳統的急性胃穿孔治療中,主要采用開放式穿孔修復術。當前治療急性胃穿孔最好的方式是外科手術治療,此外應盡早實施手術。若患者就診時已經超過12h且腹部感染情況較為嚴重[6]。出現中毒性休克、腸粘連、腸梗阻以及其他并發癥的可能性明顯提高,且相關的研究顯示,對于急性胃穿孔患者,只要患者耐受,均可采用胃大部切除手術進行治療。

對于某個待測樣本,根據公式(11)計算其到第j 個群中心的距離dj,如果該距離大于Tj,則這個樣本不在該群中;如果該距離小于Tj,則這個樣本在該群中。即:

如果測試樣本不屬于n 群中的任何一個群,就定義該樣本是瑕疵樣本;如果測試樣本屬于n群中的某個群,就定義它是一個正常樣本。
實驗時,使用一個直流電源向太陽能電池輸出0.4~0.6 V 電壓和6~20 mA/cm2電流;使用冷卻的近紅外光(λ=1.1~1.2 μm)CCD 相機在完全密不透光的環境下取像,無需任何外加光源。
從圖6 各Haar 特征的樣式可以看出,Group1和Group2 將Haar 塊的寬w 平均分成了2 份,Group3 將Haar 塊的寬w 平均分成了3 份。因此,為了使每個Haar 特征的每個區域(黑色區域或白色區域)都為整像素,Haar 塊的寬w 必須是6 的整數倍。通過觀察和實驗分析,選擇參數如下:
Haar 塊大小:h=18,w=6,12,…,42;分群組數:30 組;閾值Tj中t 值:0.02。

圖9 原始測試影像與測試結果。(a)~(h):原始瑕疵影像;(a')~(h'):瑕疵檢測結果。Fig.9 Original testing images and testing results.(a)~(h):Original defect image.(a')~(h'):Defect detection result.
實驗選用改進FCM 聚類法對正常樣本進行分群,并用該訓練結果對50 塊太陽能芯片(20 塊瑕疵+30 塊正常)進行測試,測試的統計結果顯示:20 塊瑕疵樣本中,有18 塊被判為瑕疵,2 塊被判為正常,誤差為10%;30 塊正常樣本中,0 塊被判為瑕疵,30 塊被判為正常,誤差為0。50 個樣本的總辨識率高達96%,其中12 塊的測試結果如圖9 所示。
本文介紹的改進FCM 分群算法能夠有效地解決多群數數據分類問題,明顯提高分群辨識率。本研究在訓練過程中只用到了正常樣本,省去了收集瑕疵樣本的復雜過程,給瑕疵檢測帶來了極大的方便。根據瑕疵的特點,本文選擇大小適當的Haar 特征,使用改進FCM 分群法將訓練樣本分為30 組,閾值Tj中的t 選用0.02,可以有效地對太陽能電池EL 影像中的瑕疵進行檢測,并能夠近似地給出瑕疵的位置,有助于工廠進行自動化的太陽能電池的制造檢測。
[1]Zhang M J,Li J D,Chen J S.Solar cell and production of polysilicon[J].J.Mater.Metall.,2007,6(1):33-38.
[2]Fu Z,Zhao Y Z,Liu Y,et al.Solar cell crack inspection by image processing[C]// 2004 International Conference on Business of Electronic Product Reliability and Liability,New York:Cambridge University Press,2004:77-80.
[3]Tsai H J.The Scale Measurement and Defect Inspection for Printed Solar Cell[D].Chungli:National Central University,2004.
[4]Chen S Y.Surface Defect Detection for Solar Cells[D].Chungli:National Central University,2004.
[5]Fuyuki T,Kondo H,Yamazaki T,et al.Photographic surveying of minority carrier diffusion length in polycrystalline silicon solar cells by electroluminescence[J].Appl.Phys.Lett.,2005,86(26):262108.
[6]Fuyuki T,Kitiyanan A.Photographic diagnosis of crystalline silicon solar cells utilizing electroluminescence[J].Appl.Phys.A,2009,96(1):189-196.
[7]Bezdek J C.Pattern Recognition with Fuzzy Objective Function Algorithm[M].New York:Plenum Press,1981.
[8]Lienhart R,Maydt J.An extended set of Haar-like features for rapid object detection[C]// 2002 IEEE ICIP,New York:CRC Press,2002:900-903.