李法揚
(上海交通大學,上海 200240)
在項目管理中,技術風險評估是風險管理的關鍵步驟,事關項目成敗。采用何種風險評估技術和工具對技術風險因素進行有效分析,得到準確的定性定量風險評估結果,為應對技術風險提供依據,是各個行業項目管理者一直探索研究的重點。
依照現有的理論基礎,風險評估主要分為3種方式:定性評估方式,定量評估方式,定性定量兩種方式相結合的綜合評估方式。在這3種評估方式當中,定性分析法主要基于相關技術人員的技術積累和主觀判斷,容易操作,評估結果也相對清晰,但往往分級較少,很難做到精確評估;定量評估在評估過程中需要收集大量的實驗數據,能夠得到一個量化的相對精確的評估結果,但是這種評估方式對專業人員的要求比較高,而且費時費力;綜合評估則結合定性和定量優點,往往在項目前期先進行簡單的定性評估,而后再有針對性地采用定量評估方法,相對高效地去獲得比較精確的風險評估結果。定性評價法主要有定性分析法、調查評價法、加權評價法;定量評價法主要有主成分分析法、灰色關聯分析法、數據分析法;綜合評價主要有層次分析法、模糊評價法、灰色系統理論等[1]。
半導體封裝研發項目以高技術性而著稱,技術風險成為高新技術企業最基本的風險,并貫穿其整個經營過程。針對封裝行業的特點,結合項目管理風險管理的知識體系,本文介紹一種新的綜合性風險評估方法,即CTQ(CriticaltoQualityCharacteristics,質量關鍵特性)-EPPM(EscapeDPPM)-Scorecard(積分卡)法在半導體封裝研發項目風險源定性定量分析中的應用。
技術風險的分析評估是風險管理體系的重中之重,事關項目研發的成敗,因此找到一個契合本行業特點、行之有效的風險評估方法尤為重要。常規的定性定量或者綜合評估方法雖然在半導體行業中也有一定的應用,也確實識別并準確評估了一些技術風險,但往往或者失之偏頗,無法具體量化;或者難以抓住半導體行業的行業特性,缺乏具體操作性;又或者思考面、覆蓋面不夠廣泛,往往對于重大技術風險評估過低,甚至遺漏。本文介紹的CTQ-EPPM-Scorecard方法,切合半導體封裝制造業的技術特點,抓住了風險評估中的關鍵要點,能夠對半導體封裝研發中的技術風險進行有效而詳細的評估,而且方法詳盡有效,能準確評估封裝研發項目中的技術風險因素。
CTQ,是指為了滿足“關鍵的需求或者關鍵客戶流程需求的產品或服務”的一組特性,是從顧客角度出發,影響顧客滿意度的質量特性。它包含兩大類別:產品特性和過程參數[2]。
存儲芯片是一個高度集成化的復雜系統。客戶應用端條件復雜,對產品的品質要求嚴苛。此類產品結構設計復雜,構成材料繁多,制造工序綿長,加工精度和生產環境要求都很高。芯片的制造要經歷一系列的工藝環節,每一道工序都會產生很多質量特性。這些特性不但影響這道工序的良率和品質,而且會影響下一道工序的質量特性,甚至影響最終成品的質量特性。這些質量特性不但內在關系復雜,每一個都可能關乎產品的成敗,而且受外部環境(人員、管理、資材、環境、工藝、設備等)潛在影響;由于資源和手段的制約,質管人員在制造過程中實際上無法對每步工序的質量特性進行監控。因此,在制造系統生產過程質量分析和預防中,識別出關鍵工序,進而對關鍵工序中質量特性進行管控就成為重點。因此,若想構建完善的質量保證體系,首先要識別出多級工序之間的質量特性關系,其次要識別出CTQ[3]。
半導體封裝行業的CTQ主要來自于DFMEA(設計失效模式與效果分析),PFMEA(制程失效模式于效果分析),控制計劃,封裝缺陷模式,產品失效分析結果,制程規格參數,客戶抱怨類型和統計過程控制監控項目。CTQ不但包含影響產品品質的缺陷,也包含制程輸出中可能會引起客戶品質抱怨的項目。CTQ項目一般由專家委員會審核確定。
EPPM,是基于“每百萬缺陷機會中的不良品數”(DefectPartPerMillion,DPPM)的一個概念。產品特性參數基于客戶的應用要求,制程特性參數基于自身的制程能力以及設計要求,都會有一個目標值以及設定的規格上限和規格下限,而超出這個規格上限或者下限的產品即為殘次品,每生產百萬個產品中出現殘次品的數量就是DPPM數。這是代表制程能力的關鍵指數。每個產品風險因子的技術風險在制造端的最終量化體現就是DPPM。
DPPM是指每生產一百萬個產品的缺陷數,從定義中看到這個缺陷數是指在產品生產過程中存在的數量,但是這些缺陷產品并不是都會流向客戶、走向市場的。在產品的生產過程中,產品成品之后要做一系列的檢驗步驟,偵測是否有缺陷品。因此,絕大部分缺陷品是在生產過程中或者成品之后的測試中被檢測出來,不會最終走向市場。在檢驗環節中,根據檢驗數量可分為批次抽檢、100%全檢兩種;根據檢驗結果可分為破化性檢驗和非破化性檢驗;根據檢驗手段可分為人工目檢、設備光學檢驗、產品性能測試檢驗、產品壽命測試檢驗等。一方面,根據以上分類來看,無法在破化性檢驗中應用100%檢驗;而且由于資源的限制,即使是在非破化性檢驗中也無法在所有站別要求100%檢驗。另一方面,檢驗的有效性畢竟是建立在檢驗手段的精度基礎之上的,基于檢驗方法、設備精度的實際狀況,無法保證所有的檢驗站別的有效篩查率都是100%。因此,從理論上可以斷定,有一定比例的缺陷品會逃逸到客戶端,并最終造成客戶抱怨、產品召回的風險。
基于以上論述,每項CTQ的EPPM的公式如式(1)
EPPM(i,j)=DPPM(i,j)×SE(j)
(1)
式中,i為風險源編號(i=0~n);j為CTQ編號(j=0~m);SE為(ScreeningEffectiveness,檢驗有效性);EPPM為封裝研發中某個風險源的某項CTQ在客戶端技術風險的量化指標;DPPM為生產百萬產品的不良品數目。
SE的公式如式(2)

(2)
如果某項CTQ中應用了多種檢測手段,以最有效的那種為準。
由上文可知,針對每一項過程輸出特性或者產品特性,都會根據其對最終產品質量的影響力大小判定是否為CTQ,并根據其數據類型算出DPPM。如果是CTQ,參照這項特性的檢驗站別的有效性計算出相應的EPPM。然而,這只是單項CTQ的DPPM和EPPM,針對整個封裝研發項目的風險評估而言,需要整個項目總體的技術風險指標,即整個產品的EPPM。因此,需要匯總所有CTQ的DPPM,換算得到整個產品的最終EPPM。這是一個加總的過程,如式(3)

(3)
為了使產品的技術風險參數更加可視化,產品的最終EPPM計算過程和結果會被固定在表格中,見表1。基于產品最終的積分卡,半導體封裝項目中技術風險的量化指標、量化指標的構成、風險的具體表現形式都一目了然,方便追溯。
根據CTQ-EPPM-Scorecard方法的定義,需要針對每一項被識別出來的風險源在封裝生產過程中找到相對應的制程特性輸出/產品特性輸出,并判斷這些輸出是否是與最終產品質量相關的CTQ,然后制定評估方案,收集數據計算DPPM,再根據檢驗手段的不同計算單項的EPPM,最后匯總成積分卡,得到量化的產品風險數據。
半導體封裝行業作為一個發展了將近半個世紀的成熟產業,市場和客戶端對產品特性的要求非常細致,而且行業中也已經量化并訂立了很多標準,能夠得到詳細的有關產品的CTQ特性條目;在制程方面,無論是可量化的缺陷類特性,還是不可量化的缺陷類特性,行業現有的定義也足以覆蓋,即使有新的工藝和新的材料出現,行業內也有足夠的標準和數據作為參考去借鑒、去定義。至于檢驗手段,各家在具體的能力或者方法上或有微許差別,但其中更多的是工廠現有設備和能力的體現,與風險評估本身的關系不是很大。如何針對風險源設定評估方案,收集收據得到每項風險源的DPPM數據才是該理論和方法的重點,有了準確的DPPM數據,才能得到最終的量化風險指數EPPM,才能根據這個指數應對風險。
針對各種風險源的情況,在CTQ-EPPM-Scorecard評估體系中大致采取以下3類方法:
(1)針對工廠內部沒有現成數據可用的風險源,需要設計DOE(DesignofExperiments,試驗設計)收集相關的CTQ數據。
(2)針對有現有理論模型可用但需要大量時間或者材料才能評估的風險源,采用有限元仿真評估。
(3)SPC-數據統計分析,用于可參照現有工程/量產數據做風險分析和DOE數據的處理。
在新產品和制程的技術評估中,DOE是達成突破的一種典型的最佳途徑,在制程和系統比較復雜時主要有以下用途:改善制程參數,設計中心值及設計冗余;產品及制程的表現優化;改善產品和制程的穩定性;建立有效的設計目標,轉換函數和敏感度預算;新設備的特征性驗證和資質驗證;開發新的制程參數;產品研發過程中技術問題解決;減少變異,加強性能。DOE主要包含3個部分:X輸入因子,Y輸出響應,因子水準。關系簡圖如圖1所示。
表1導體封裝研發的積分卡示例


圖1 DOE結構圖
借助SAS公司的統計分析軟件JMP,逐步展開DOE計算風險源DPPM的具體過程。
2.1.1 確定風險源的DOE矩陣
基于目標確定輸入因子和輸出響應,根據其特性確定數據類型,輸出響應設定時需要設定目標判定、上下限;輸入因子需要設定名稱、變化難易度、因子水準。輸入因子設定時需要特別考慮是否有交互作用,并依據實際的實驗需求設定交互的范圍和權重。
2.1.2 DOE矩陣的執行,數據收集
準備物料,按照DOE矩陣的設立,投料收集工藝數據。
2.1.3 數據輸入分析軟件,建立模型
按照分析軟件的要求,將數據處理后錄入JMP,并選擇合適的分析方法建立模型擬合。這一步主要借助JMP的Fit Model分析功能,設定DOE輸出的規格標準,再用輸出的參數擬合到輸入上,仿真跑出模型。軟件詳細操作手法可參閱JMP手冊。DOE數據擬合模型示例如圖2所示。

圖2 DOE數據擬合模型
2.1.4 優化制程:基于輸出設立最佳參數點
優化工作是為了找出符合所有響應輸出的最佳參數的方案,常用的理念有收緊輸入因子的變異,扁平化的實驗設計,利用交互作用減少輸出響應的敏感性,合理利用參數組合。JMP示意如圖3所示,四周保留的空白區越大越好,黑線交叉點為最佳(黑圈所示)。

圖3 DOE制程優化
2.1.5 仿真模擬出最佳參數的DPPM
基于上述分析得出最佳參數之后,加入以下3個方面的變異:①已經完成特性驗證的產品或者制程的數學模型;②每個輸入因子在目標設定點的變異值;③模型未能計量的環境變異。模擬實際的制程條件去放大數據數量得出預測的DPPM(圖4黑圈位置)。

圖4 DOE仿真
在半導體技術風險評估中,有許多風險因素沒有數據可以參考,但是設計上又已經有成熟的理論模型可用,而且此類風險源的輸入因子非連續性,組合繁多,或者需要很長的時間去驗證。由于時間和資源的限制,無法設計實驗去驗證風險。因此,有限元仿真是評估此類風險最有效的方法。
在半導體封裝研發項目的技術風險評估中,有限元仿真的應用需要具備以下條件:①封裝結構中每個材料的特性參數是充分且準確的;②結構設計每項參數的變量是有長期量產數據支持的;③仿真目標中沒有全新的結構和材料的因素存在。
基于以上條件,收集充分的輸入設計條件,例如材料組成、規格參數、設計類型、客戶規格等,輸入仿真軟件Analysis中得到產品的三維模型,如圖5所示。
有限元分析工程師根據對有限元理論的理解和本公司產品的掌握,借助有限元仿真軟件的幫助,借助模型得到以下關于產品相關CTQ的數據:顆粒翹曲(規格≤75μm),如圖6所示。
以仿真中的數值為中心值,參考量產數據的方差水準,用JMP模擬出數據分布圖就可以得到量化的DPPM數據,從而量化判斷此類技術風險的嚴重程度。
基于摩爾定律,半導體封裝產業每年都會進行產品的更新換代。一方面,在這一年年的更新換代中,積累了大量的產品特性數據、制程數據;另一方面,半導體這個復雜的產業鏈中鏈接了很多材料、設備供應商,他們提供的原材料或者設備中也包含了很多的輸出原始數據。在新產品研發過程中,根據風險因子的特性,相當一部分可以參考舊有的數據或者采用供應商數據,依據SPC統計出響應的DPPM,從而評估出此類的量化數據。
這一方法主要應用在產品結構的外觀尺寸中或者常規制程參數中,比如產品的厚度公式如式(4)所示
H=M+S+B+W
(4)
式中,H為產品厚度;M為塑封體厚度;S為基板厚度;B為錫球高度;W為芯片顆粒翹曲度。
由于制程的原因,每個參數都是在一定的中心值附近根據某種分布浮動的,需要針對每項參數在公司內部或者通過供應商收集大量數據,得到精確的數據分布。比如,塑封體厚度可以要求設備供應商提供數據分布,或者長期在產線收集;錫球高度根據同規格錫球和同尺寸焊盤的產品的制程測量數據建立數據庫,以供產品風險分析時使用。

圖5 仿真模型

圖6 顆粒翹曲仿真
在收集到足夠數據后,需要用JMP仿真出每項參數的分布,舉例翹曲參數分布示例如圖7所示。
選取擬合度最高的分布,將各項參數的分布公式根據式(4)輸入到JMP對應欄位中,并擬合到10 000個數據甚至百萬個數據以模擬制程水平。基于各項參數的分布輸入、公式的計算和JMP的輔助,即可得到產品厚度在實際生產中的模擬輸出分布,并比對規格要求計算出此項CTQ的DPPM為2983,如圖8黑圈所示。
本文主要闡述了半導體封裝研發項目的技術風險評價方法——CTQ-EPPM-Scorecard,詳細解釋了這種新型綜合技術風險評估方法的各項定義、來源和格式,分類說明了針對不同情況風險源的DPPM的算法。這是一種比較新型的、能夠
量化評估技術風險的綜合評定方法,相比較常規的定性評估方法和定量評估方法具有更高的準確性,相對簡便的操作性,能夠為半導體研發項目中的風險管理提供有效的評估手段,確保項目成功。
[1]馬澤雯.我國衛星應用項目的風險管理研究[D].北京:中國科學院大學,2017.
[2]姜凱.精益質量管理中CTQ管理的那些事兒[EB/OL].[2017-01-28].http://www.360doc.com/content/17/0128/11/3066843_625096606.shtml.
[3]于影霞,盛敬峰.面向綠色能源產品的太陽能光伏組件復雜工序CTQ識別模型與算法[J].2017,38(2):198-210.