郭晶磊,顧 吉
(中國電子科技集團公司第58研究所,江蘇 無錫 214035)
P5000設備由全球著名半導體設備廠商美國應用材料公司(Applied Materials)生產,P5000系統是世界上第一臺成功的以單晶片、多反應室理念而設計的量產與研發均適用的半導體制程設備。P5000系統具有絕佳的制程整合、量產制造等優點,并在不破真空的狀況下,最多有四個相同或不相同的制程反應室同時進行生產,更富有彈性和整合能力。反應原理為:材料源以氣體形式進入工藝腔體內,在RF加功率的情況下,材料源(反應氣體)從輝光放電(Plasma:等離子場)中獲得激活能,激活并增強化學反應,從而實現化學氣象淀積。在實際使用過程中,P5000平臺經常會出現各種各樣的死機現象,本文就針對具體的各種死機現象進行分析,并提供相關的解決方案。
P5000系統軟件能夠自動保存最后一次死機信息,具體查看方法為:
(1)在主界面用光筆點擊Service菜單,如圖1;
(2)在Service下拉菜單中選擇Diagnostics菜單,如圖2;
(3)在Diagnostics下拉菜單中選擇Last Exception Report菜單,如圖3。

圖1 死機代碼查詢界面1

圖2 死機代碼查詢界面2

圖3 死機代碼查詢界面3

圖4 死機代碼查詢界面4
該死機信息同時被保存在FAULT.LOG文件中,從死機信息報告界面中我們可以得到相關信息,見圖4和表1。
在表1所述信息中,最重要的是第4條(Exception number),根據該代碼可以對死機原因進行分析排查,最終解決死機問題。

表1 死機信息報告內容
例如Exception number 2,Bus error-FFFF4818,此類死機原因一般是因為硬件問題引起(典型的是DIO或AIO板故障),但偶爾也會是軟件、VME電壓和VME接地問題引起。其中FFFF4818是導致死機硬件的內存地址,從表2硬件內存地址表中我們可以查出引起此次死機的是AIO#3電路板,更換AIO #3電路板即可解決此次死機問題。
如果每次出現Exception number 2,Bus error的硬件內存地址都不相同,那么最大的可能就是VME電壓被瞬間拉低,此時應該著重檢查VME電壓。
Exception 3-Address Error,軟件、硬件、接地、電磁干擾均會引起地址錯誤死機,出現該死機問題時一般先從防電磁干擾方面著手:
(1)檢查VME總線架上所有板卡上下螺釘是否擰緊;
(2)空余的插槽是否用鋁合金盲板封住;
將資產管理和預算管理進行相互結合,能夠對資產增量和資產存量進行有效結合,實現資產相關信息的共享。能夠避免出現資源浪費現象,可以對資源進行最佳配置,有效降低資產配置不合理現象,構建鴿鴿合理高效的社會保障。
(3)設備各部件之間EMC接地線(P/N:1390-01554)是否安裝;
(4)EMC接地線與設備地線間阻值是否小于2Ω。
如果電磁干擾檢查沒有問題,那么再從軟件方面著手(格式化硬盤、重新安裝系統軟件等)。
Exception 4-Illegal Instruction,非法指令引起的死機原因(如系統軟件執行了680X0機器代碼之外的指令),與Exception 3相似,參照其解決方案。

表2 硬件內存地址表
Exception 5-Divide by Zero,引起該死機的原因是系統軟件BUG,所以,從軟件方面著手(如格式化硬盤、重新安裝系統軟件等)可以解決該死機問題。
Exception 7-TrapCC,該死機類型具體又分為三小類,分別是Exception 7-TRAPCC(Instruction)、Exception 7-TRAPCC(Failed to Send Software Heartbeat)和Exception 7-TRAPCC(Other)。
Exception 7-TRAPCC(Instruction),引起該死機的原因是日期或時間沖突,一般指千年蟲問題,可通過系統升級的方法來解決該問題。
Exception 7-TRAPCC(Other),一般可通過重啟解決該問題。
Exception 24-Spurious Interrupt,引起該死機的原因是VME系統總線IACK信號跳線設置錯誤,檢查每個VME系統總線插槽,如果有板卡那么插上的IACK信號跳線應該為斷開,如果沒有板卡那么插上的IACK信號跳線應該為短路。
該死機類型具體又分為三小類,分別是Exception 31-Sys-Fail、Exception 31-Abort Unknown和Exception 31-Memory Parity Error。
Exception 31-Sys-Fail,引起該死機問題一般比較典型的是VME系統總線電源系統和接地問題,可以從以上兩方面去解決問題。
Exception 31-Abort Unknown,引起該死機問題一般比較典型的是VME系統總線接地問題或不小心碰了SBC主板上的“abort”按鈕,對于后者,只需重新啟動系統就行了。
Exception 31-Memory Parity Error,引起該死機問題一般是由于V440型號的SBC主板運算時奇偶校驗錯誤,對于此問題,必須將SBC主板升級至MA3版本。
該死機類型具體又分為三小類,分別是Exception 39-Failed to Send Software Heartbeat、Exception 39-Message Pool Full和Exception 39-Memory Pool Full。
Exception 39-Failed to Send Software Heartbeat,引起該死機問題的類似于Exception 7-TRAPCC(Failed to Send Software Heartbeat),可參照其解決方案。
Exception 39-Message Pool Full,引起該死機問題的原因是系統執行兩個任務的時候信息量過載,當信息量大于255條時會導致死機,重新啟動系統可解決該問題。
Exception 39-Memory Pool Full,一般系統軟件會自動填充和清空內存地址,當系統只填充不清空內存地址時就會導致該內存池出錯死機,一般重啟可解決。3.9 Exception 46
Exception 46-Array Range Error,一般是因為軟件問題引起的死機,可參照Exception 5-Divide by Zero解決該問題。
除上述死機代碼之外,有些機臺可能還會出現一些其他類型的死機代碼,也需要用相應的方法來解決,在一時查不出問題的時候可以嘗試著從接地、電源、硬盤、軟件等方面入手,往往可以取得意想不到的效果。