王兆勇
(邢臺邢臨高速公路管理處,河北 邢臺 054000)
工控機(jī)是一種加固的增強(qiáng)型個(gè)人計(jì)算機(jī),它可以作為一個(gè)工業(yè)控制器在工業(yè)環(huán)境中可靠運(yùn)行。早在20世紀(jì)80年代初期,美國AD公司就推出了類似IPC的MAC—150工控機(jī),隨后美國IBM公司正式推出工業(yè)個(gè)人計(jì)算機(jī)IBM7532。IPC的性能可靠、軟件豐富、價(jià)格低廉,因而在工控機(jī)中異軍突起,后來居上,應(yīng)用日趨廣泛。在邢臨高速公路監(jiān)控系統(tǒng)中,工業(yè)控制計(jì)算機(jī)(以下簡稱“工控機(jī)”)起到了關(guān)鍵作用。因此,工控機(jī)的安全也顯得尤為重要。本文結(jié)合邢臨高速公路的實(shí)際情況,就高速公路監(jiān)控系統(tǒng)中工控機(jī)的日常維護(hù)與維修展開分析與討論。
粗糙的生產(chǎn)工藝、劣質(zhì)的制作材料、非標(biāo)準(zhǔn)的規(guī)格尺寸等都是引發(fā)故障的因素,常常引發(fā)板卡上元件焊點(diǎn)的虛焊脫焊、插接件之間接觸不良、連接導(dǎo)線短路斷路等故障。
操作人員的使用習(xí)慣和應(yīng)用水平也不容小覷,例如帶電插拔設(shè)備、設(shè)備之間錯(cuò)誤的插接方式、不正確的BIOS參數(shù)設(shè)置等均可導(dǎo)致硬件故障。
使用環(huán)境包括溫度、濕度、灰塵、電磁干擾、供電質(zhì)量等方面。每一方面的影響都是嚴(yán)重的,例如過高的環(huán)境溫度會嚴(yán)重影響設(shè)備的性能,等等。
設(shè)備的正常磨損和硬件老化也常常引發(fā)硬件故障。
工控機(jī)發(fā)生故障后,一定要先排除軟件方面的原因(例如BIOS參數(shù)設(shè)置不當(dāng)引起工控機(jī)不能重啟、電子盤扇區(qū)損壞導(dǎo)致紅外線程序不能運(yùn)行等)之后再考慮硬件原因。
由于外部設(shè)備原因引發(fā)的故障往往比較容易發(fā)現(xiàn)和排除,可以先根據(jù)系統(tǒng)報(bào)錯(cuò)信息檢查外部設(shè)備的各種連線和本身工作狀況。在排除外部設(shè)備方面的原因后,再考慮主機(jī)。
電源的作用很重要。電源功率不足、輸出電壓電流不正常等都會導(dǎo)致各種故障的發(fā)生。因此,應(yīng)該首先排除電源的問題,然后再考慮其他部件。
硬件產(chǎn)品并不易損,因此在遇到硬件故障時(shí),應(yīng)該從最簡單的原因開始檢查,如判斷各種線纜的連接情況是否正常、各種插卡是否存在接觸不良的情況等。若在進(jìn)行上述檢查之后故障依舊,這時(shí)方可考慮部件的電路部分或機(jī)械部分存在較復(fù)雜的故障。
對由于軟件設(shè)置方面的原因?qū)е掠布o法工作的,故障檢修方法為還原BIOS參數(shù)至缺省設(shè)置:開機(jī)后按Del鍵進(jìn)入BIOS設(shè)置窗口→選中“Load Optimized Defaults”項(xiàng)→回車后按Y鍵確認(rèn)→保存設(shè)置退出。
對于硬件資源沖突這類情況來說,通常是發(fā)生了設(shè)備沖突問題,如中斷、DMA、端口、I/O等出現(xiàn)沖突。
對于添加安裝完某硬件或更新某硬件的驅(qū)動程序后出現(xiàn)頻繁“死機(jī)”這類情況來說,是所安裝的硬件驅(qū)動程序存在兼容性問題,可能是這個(gè)硬件設(shè)備新安裝的驅(qū)動程序與另一個(gè)設(shè)備的驅(qū)動程序存在沖突,或是新驅(qū)動程序本身存在問題,或是新驅(qū)動程序與系統(tǒng)的某個(gè)文件存在版本沖突,還有可能是安裝了別的操作系統(tǒng)下的驅(qū)動程序(比如把用于Windows XP的驅(qū)動程序安裝到了Windows 2000的操作系統(tǒng)中)以致于發(fā)生死機(jī)故障。由于引發(fā)該故障的可能性非常多,所以要采取相對應(yīng)的解決方法,比如:以“安全模式”啟動,然后在“設(shè)備管理器”中進(jìn)行相應(yīng)的查看和設(shè)置,或者卸載這個(gè)驅(qū)動,安裝經(jīng)過微軟認(rèn)證的驅(qū)動程序。安裝后在硬件驅(qū)動程序版本里邊有“數(shù)字簽名程序:Microsoft Windows Hardware Compatibility Publisher”字樣。
直接觀察法即通過看、聽、摸、嗅等方式檢查比較明顯的故障。例如根據(jù)BIOS報(bào)警聲或Debug卡判斷故障發(fā)生的部位;觀察電源內(nèi)是否有火花、異常聲音;檢查各種插頭是否松動、線纜是否破損、斷線或碰線;電路板上的元件是否發(fā)燙、燒焦、斷裂、脫焊虛焊;各種風(fēng)扇是否運(yùn)轉(zhuǎn)正常等。有的故障現(xiàn)象時(shí)隱時(shí)現(xiàn),可用橡皮頭輕敲有關(guān)元件,觀察故障現(xiàn)象的變化情況,以確定故障位置。
初步確定發(fā)生故障的位置后,可將存疑的部件或線纜重新插拔,以排除松動或接觸不良的原因。例如將板卡拆下后用橡皮擦擦拭金手指,然后重新插好;將各種線纜重新插拔等。如果經(jīng)過插拔后不能排除故障,可使用相同功能型號的板卡替換有故障的板卡,以確定是板卡本身已經(jīng)損壞還是主板的插槽存在問題,然后根據(jù)情況更換板卡。
最嚴(yán)重的故障是機(jī)器開機(jī)后無任何顯示和報(bào)警信息,應(yīng)用前文所述方法已無法判斷故障產(chǎn)生的原因。這時(shí)可以采取最小系統(tǒng)法進(jìn)行診斷,即只安裝CPU、內(nèi)存、顯卡、主板。如果不能正常工作,則在這四個(gè)關(guān)鍵部件中采用替換法查找存在故障的部件。如果能正常工作,再接硬盤(電子盤)等。以此類推,直到找出引發(fā)故障的罪魁禍?zhǔn)住?/p>
將同型號插件板,總線方式一致、功能相同的插件板或同型號芯片相互交換,根據(jù)故障現(xiàn)象的變化情況判斷故障所在。此法多用于易拔插維修環(huán)境,例如內(nèi)存白檢出錯(cuò),可交換相同的內(nèi)存芯片或內(nèi)存條來判斷故障。總之,若能找到相同型號的微機(jī)部件或外部設(shè)備,使用交換法可以快速判定是否是元件本身的質(zhì)量問題。交換法也可用于以下情況:沒有同型號的微機(jī)部件或外部設(shè)備,但有相同類型的微機(jī)主機(jī),則可以把微機(jī)部件或外部設(shè)備插接到該同型號的主機(jī)上以判斷其是否正常。
運(yùn)行兩臺或多臺相同或相類似的計(jì)算機(jī),根據(jù)正常計(jì)算機(jī)與故障計(jì)算機(jī)在執(zhí)行相同操作時(shí)不同表現(xiàn)可以初步判斷故障產(chǎn)生的部位。
用手指輕輕敲擊機(jī)箱外殼,有可能解決因接觸不良或虛焊造成的故障問題。比如:用手指或塑料棒輕敲主板的南、北橋芯片來判斷是否是BGA虛焊;然后據(jù)此再進(jìn)一步檢查并確定故障點(diǎn)的位置。
中控室工控機(jī)(上位機(jī))監(jiān)視和控制S7—400PLC(下位機(jī)),信息阻斷時(shí)故障現(xiàn)象為:工控機(jī)畫面上監(jiān)控信號處出現(xiàn)陰影且信號數(shù)值都為零,上位機(jī)對下位機(jī)無法監(jiān)視和控制。這種故障與前面提到的“死機(jī)”現(xiàn)象不一樣。該故障是由信息阻斷造成的,由于下位機(jī)“死機(jī)”或傳輸信號網(wǎng)線和網(wǎng)卡發(fā)生故障,導(dǎo)致上位機(jī)接收不到信號,其實(shí)上位機(jī)并沒有“死機(jī)”。這種故障曾于2011年11月初在邢臨高速公路發(fā)生過,是由于網(wǎng)線和網(wǎng)卡接觸不良導(dǎo)致上位機(jī)對下位機(jī)無法監(jiān)視和控制。
針對這類故障的處理辦法為:當(dāng)上位機(jī)畫面出現(xiàn)“陰影”時(shí),首先需要檢查下位機(jī)的工作狀態(tài),S7—400PLC的CPU模板上有各種錯(cuò)誤指示燈,可根據(jù)指示燈的狀態(tài)進(jìn)行操作。如果PLC“死機(jī)”,則用鑰匙將PLC的CPU重新啟動就能恢復(fù)正常。如果網(wǎng)線和網(wǎng)卡有問題,操作工應(yīng)立即檢查上、下位機(jī)的信號電纜插頭有無接觸不良,用手對各插頭輕壓或擺動,很有可能找出故障點(diǎn)。
在工控機(jī)常見故障維護(hù)中,應(yīng)先根據(jù)現(xiàn)場情況分析問題可能出在哪兒,然后再動手操作。先從軟件入手,然后再從硬件著手分清是機(jī)械原因還是電氣原因造成的。筆者在實(shí)際工作采用上述辦法,快速修復(fù)了工控機(jī)故障,保障了正常生產(chǎn)。