999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

PC服務(wù)器故障預(yù)測(cè)分析及維護(hù)處理

2020-11-26 06:06:44來(lái)風(fēng)剛李濟(jì)偉董耀眾宋瑞華李偉良
電子技術(shù)與軟件工程 2020年1期
關(guān)鍵詞:故障

文/來(lái)風(fēng)剛 李濟(jì)偉 董耀眾 宋瑞華 李偉良

(1.國(guó)家電網(wǎng)有限公司信息通信分公司 北京市 100053)

(2.國(guó)電南瑞科技股份有限公司信息系統(tǒng)集成分公司 江蘇省南京市 211102)

在信息化時(shí)代的今天,計(jì)算機(jī)技術(shù)的發(fā)展有目共睹,而PC 服務(wù)器作為與計(jì)算機(jī)息息相關(guān)的一項(xiàng)技術(shù),其因自身價(jià)位較低且性能較高的優(yōu)點(diǎn)被廣泛應(yīng)用于各行各業(yè)的工作中,如國(guó)網(wǎng)數(shù)據(jù)中心等,現(xiàn)今也在實(shí)施現(xiàn)代化的管理,PC 服務(wù)器正為這項(xiàng)工作提供了強(qiáng)有力的技術(shù)保障[1]。

1 關(guān)于服務(wù)器的概述

技術(shù)上的服務(wù)器主要的概念就是管理資源,而后給用戶提供一系列服務(wù)。作為計(jì)算機(jī)軟件,其包含數(shù)據(jù)庫(kù)服務(wù)器、應(yīng)用程序服務(wù)器以及文件服務(wù)器等,令此類(lèi)軟件正常運(yùn)行的各種計(jì)算機(jī)以及計(jì)算機(jī)系統(tǒng)被叫做服務(wù)器。和一般的PC 比較,這類(lèi)服務(wù)器的性能、穩(wěn)定性以及安全性等都有較高的要求,且在網(wǎng)絡(luò)、內(nèi)存、硬盤(pán)系統(tǒng)、PU 以及芯片組等方面也和普通計(jì)算機(jī)存在差異[2]。其是網(wǎng)絡(luò)節(jié)點(diǎn)服務(wù)器,所以可以處理或存儲(chǔ)網(wǎng)絡(luò)里80%的數(shù)據(jù)和信息,還一直被叫做“PC 網(wǎng)絡(luò)靈魂”。受到操作系統(tǒng)的控制,服務(wù)器可以將和它所連接的打印機(jī)、de、硬盤(pán)、磁帶或其他的通訊設(shè)備作為共享給網(wǎng)絡(luò)客戶的站點(diǎn),同時(shí)還可給用戶提供信息發(fā)表、數(shù)據(jù)管理以及集中計(jì)算等各項(xiàng)服務(wù)。服務(wù)器的高性能一般體現(xiàn)在長(zhǎng)時(shí)間的運(yùn)行能力、強(qiáng)大的外部數(shù)據(jù)傳播能力以及高速運(yùn)算的能力。

2 PC服務(wù)器的故障預(yù)測(cè)分析

2.1 常見(jiàn)的故障

在所有的故障中,比較常見(jiàn)就是服務(wù)器的軟件故障,這種情況大概占整體故障的70%,而其余的30%則是硬件故障。其中,軟件故障主要有人為造成、治理軟件例存在BUG、服務(wù)器的驅(qū)動(dòng)程序問(wèn)題、應(yīng)用程序沖突或BIS 版本太低等[3];而硬件故障則主要包括:操作系統(tǒng)加載問(wèn)題、上電自檢的故障、系統(tǒng)運(yùn)行的故障、安裝階段的故障以及開(kāi)機(jī)問(wèn)題等。服務(wù)器的構(gòu)成相對(duì)來(lái)說(shuō)比較復(fù)雜,所以在排查是應(yīng)保持謹(jǐn)慎。

2.2 服務(wù)器故障的預(yù)測(cè)分析

服務(wù)器的主要組件無(wú)外乎CPU、內(nèi)存、硬盤(pán)、主板、I/O 板卡、RAID 卡、電源、風(fēng)扇等,我們可以從這些組件來(lái)探討如何預(yù)測(cè)服務(wù)器不久可能出現(xiàn)的問(wèn)題,從而提前做出相應(yīng)準(zhǔn)備,做好相應(yīng)應(yīng)急措施,減少服務(wù)器出問(wèn)題時(shí)定位和恢復(fù)服務(wù)器的時(shí)間,減少服務(wù)器出故障出現(xiàn)的負(fù)面影響,提高我們的平均修復(fù)時(shí)間(MTTR)。

2.2.1 PC 服務(wù)器構(gòu)成主要部件

(1)中央處理器(CPU):CPU 是服務(wù)器的計(jì)算單元,其功能主要是解釋計(jì)算機(jī)指令以及處理計(jì)算機(jī)軟件中的數(shù)據(jù)。我們平時(shí)有什么方法來(lái)知道它的狀態(tài)及運(yùn)行情況,在不同的操作系統(tǒng)上,我們可能通過(guò)命令或圖形操作知道CPU 的信息,如:Linux:/proc/cpuinfo,Windows 我的電腦-屬性及Windows 任務(wù)管理器,通過(guò)腳本或者工具檢測(cè)其狀態(tài),如:Super Pi forlinux,CPU GrabEx–Windows 測(cè)試工具,以便對(duì)有其穩(wěn)定性、性能、隱形問(wèn)題進(jìn)行分析和預(yù)測(cè),根據(jù)問(wèn)題和頻繁程度預(yù)測(cè)CPU 情況,做出相關(guān)應(yīng)對(duì)措施。

(2)內(nèi)存:內(nèi)存就是隨機(jī)存取存儲(chǔ)器(RAM),在計(jì)算期間被用作高速暫存記憶區(qū),物理上是我們平常看到的內(nèi)存條,它的檢測(cè)方法有很多,很多服務(wù)器本身在bios 里面就有memory test,或者自帶的檢測(cè)光盤(pán),通過(guò)這些檢測(cè)手段,在檢測(cè)完畢后可以看到檢測(cè)的結(jié)果和問(wèn)題,如果存在某一根內(nèi)存有較多的ECC 報(bào)錯(cuò),我們可以預(yù)測(cè)它出問(wèn)題的概率很大,如果只是幾次ECC 報(bào)錯(cuò),那么我們可以繼續(xù)觀察,它認(rèn)為是沒(méi)有問(wèn)題。在系統(tǒng)上我們也能使用工具memtester、Windows memory diagnostic 測(cè)試,測(cè)試完畢后可以分析內(nèi)存存在的問(wèn)題,預(yù)測(cè)內(nèi)存出問(wèn)題的可能性。

(3)硬盤(pán):硬盤(pán)(harddisk)是服務(wù)器中的存儲(chǔ)器。計(jì)算機(jī)需要正常運(yùn)行所需數(shù)據(jù)及軟件都存儲(chǔ)在硬盤(pán)上,現(xiàn)在有一項(xiàng)技術(shù)--S.M.A.R.T., 全 稱 為“Self-Monitoring Analysisand Reporting Technology”,即“自我監(jiān)測(cè)、分析及報(bào)告技術(shù)”。通過(guò)硬盤(pán)內(nèi)的檢測(cè)指令對(duì)硬盤(pán)如磁頭、盤(pán)片、馬達(dá)、電路的運(yùn)行情況進(jìn)行監(jiān)測(cè)、記錄并與廠商所設(shè)定的預(yù)設(shè)安全值進(jìn)行比較,若監(jiān)測(cè)情況超出預(yù)設(shè)安全值,它就通過(guò)主機(jī)的監(jiān)控硬件或軟件自動(dòng)向運(yùn)維人員發(fā)出警告,這樣我們就可以對(duì)硬盤(pán)進(jìn)程預(yù)測(cè),提前做出準(zhǔn)備。

(4)主板:主板是負(fù)責(zé)連接服務(wù)器各組件的橋梁,其工作的穩(wěn)定性直接影響著服務(wù)器能否正常。由于它所集成的組件和元器件復(fù)雜,因此發(fā)生故障的原因也比較多,要預(yù)測(cè)服務(wù)器上主板的問(wèn)題,一般沒(méi)有很好的方法,主要是查看日志,比如:BMC日志,溫度、電壓,系統(tǒng)日志等,能做個(gè)基本的預(yù)測(cè)。

(5)I/O 板卡、RAID 卡、電源、風(fēng)扇:這類(lèi)板卡、電源及風(fēng)扇檢測(cè)相對(duì)比較容易,如:網(wǎng)卡在系統(tǒng)上就可以使用命令或者軟件做到,Ethtool 和Windows perfmon 看看其丟包率,HBA 卡通過(guò)交換機(jī)看到相應(yīng)端口的光衰情況,命令fcping 也能做出相關(guān)檢測(cè),raid 卡使用megacli、storcli 查看raid 的報(bào)錯(cuò)情況和頻率做出判斷,風(fēng)扇和電源在BMC 上可以查看其轉(zhuǎn)速和電壓情況與廠家給出的正常范圍做出比較,如果經(jīng)常臨近閥值時(shí),我們可以預(yù)測(cè)此部件可能不久會(huì)出問(wèn)題,我們可以提前做好更換的準(zhǔn)備。

2.2.2 常見(jiàn)故障可以分為兩大類(lèi)

(1)死機(jī)故障:以國(guó)網(wǎng)數(shù)據(jù)中心為例,其對(duì)PC 服務(wù)器的穩(wěn)定性與安全性要求很高,一旦服務(wù)器出現(xiàn)數(shù)據(jù)丟失等情況,則可能影響正常工作,所以對(duì)PC 服務(wù)器的故障進(jìn)行預(yù)測(cè)和分析至關(guān)重要。就死機(jī)故障又可以分為三子類(lèi):

1)硬件故障,所有故障中最常見(jiàn)的就是死機(jī)的問(wèn)題,有時(shí)系統(tǒng)無(wú)法正常啟動(dòng),如開(kāi)機(jī)之后不顯示、在啟動(dòng)的過(guò)程中發(fā)生終止、瀏覽信息后出現(xiàn)死機(jī)或運(yùn)行中出現(xiàn)永久性和間歇性死機(jī)的情況。導(dǎo)致這些問(wèn)題的原因經(jīng)過(guò)分析發(fā)現(xiàn):首先可能是器件的故障問(wèn)題,如AHE、主板、PU 或內(nèi)存條等出現(xiàn)問(wèn)題;然后就是部件的安裝問(wèn)題,安裝不到位、插接的松動(dòng)或連接缺乏準(zhǔn)確性等,或在安裝時(shí),不恰當(dāng)?shù)牟僮鲗?dǎo)致部件變形,進(jìn)而引發(fā)死機(jī)[4];同時(shí),系統(tǒng)配置問(wèn)題也可能造成死機(jī),主板跳線開(kāi)關(guān)、硬件設(shè)備、系統(tǒng)BIS 和系統(tǒng)配置存在很大關(guān)聯(lián);還有一點(diǎn)就是軟件在安裝和配置時(shí)令內(nèi)部發(fā)生了沖突,進(jìn)而導(dǎo)致死機(jī)的情況發(fā)生,其中S 參數(shù)和系統(tǒng)被病毒破壞,就很可能引發(fā)死機(jī);除此之外,使用和維護(hù)也很重要,一旦維護(hù)不當(dāng),也很可能造成死機(jī),如出現(xiàn)板卡和芯片引腳氧化的情況,會(huì)導(dǎo)致接觸不良,部件受潮或積灰等也易引發(fā)死機(jī),服務(wù)器的板卡和外設(shè)接口出現(xiàn)松動(dòng),當(dāng)發(fā)生閃電或雷擊等意外時(shí),就會(huì)使電源、主機(jī)以及其他的設(shè)備被損壞,進(jìn)而導(dǎo)致死機(jī);

2)性能故障,此類(lèi)問(wèn)題一般比較隱蔽,它出現(xiàn)死機(jī)的情況一般都是有規(guī)律的,在固定的日期或者時(shí)間出現(xiàn),一般日志不容易發(fā)現(xiàn),等你檢查了很多東西后發(fā)現(xiàn)還是沒(méi)有什么頭緒。服務(wù)器重啟后也許就好了,也許過(guò)一段時(shí)間又出現(xiàn)這種情況,運(yùn)維人員才把注意力放到服務(wù)器性能上,我們的慣性思維認(rèn)為服務(wù)器一般是滿足應(yīng)用需要的,只有在日積月累中服務(wù)器的性能才會(huì)慢慢的不能匹配業(yè)務(wù)需要,種類(lèi)問(wèn)題才會(huì)發(fā)生,分析性能問(wèn)題是需要安裝軟件的,在Linux 中我們使用nmon,Windows 有自己自帶的Performance Monitor,在分析中我們可以看到某些性能達(dá)到極限值,最后導(dǎo)致服務(wù)器死機(jī);

3)程序故障,程序出故障導(dǎo)致服務(wù)器死機(jī)我們?cè)谄綍r(shí)也能見(jiàn)到,特別是新上線的軟件程序,它的兼容性、穩(wěn)定性都有待提高和改進(jìn),程序?qū)Σ煌到y(tǒng)版本的支持,和其他程序是否有沖突,程序是否存在漏洞及程序的邏輯錯(cuò)誤等都會(huì)導(dǎo)致程序出問(wèn)題,從而最終導(dǎo)致服務(wù)器死機(jī)。

(2)無(wú)法訪問(wèn)網(wǎng)絡(luò)或IP 地址沖突的故障:PC 服務(wù)器在運(yùn)行的過(guò)程中,還會(huì)發(fā)生無(wú)法訪問(wèn)網(wǎng)絡(luò)等問(wèn)題,這也會(huì)給工作單位帶來(lái)諸多困擾,所以要及時(shí)分析原因。

導(dǎo)致這種情況最主要的因素有兩個(gè):

1)計(jì)算機(jī)硬件的問(wèn)題,如網(wǎng)絡(luò)連線和網(wǎng)卡安裝等導(dǎo)致;

2)網(wǎng)絡(luò)屬性的設(shè)置問(wèn)題。

除此之外,在利用計(jì)算機(jī)進(jìn)行登錄時(shí),有時(shí)還會(huì)發(fā)生IP 地址沖突等現(xiàn)象,導(dǎo)致這種情況的原因就是使用計(jì)算機(jī)的過(guò)程中,局域網(wǎng)IP 地址被認(rèn)為改動(dòng),導(dǎo)致IP 地址發(fā)生資源重復(fù)的現(xiàn)象,這種故障在很多領(lǐng)域都會(huì)發(fā)生。PC 服務(wù)器在運(yùn)行過(guò)程中,遇到的故障有很多,這些故障很可能導(dǎo)致工作的無(wú)法進(jìn)行,如國(guó)網(wǎng)數(shù)據(jù)中心使用PC 服務(wù)器時(shí),如發(fā)生故障,則可能使工作受到影響,進(jìn)而引發(fā)嚴(yán)重后果,所以一定要進(jìn)行處理。

3 PC服務(wù)器的維護(hù)處理措施

3.1 維護(hù)處理死機(jī)故障

導(dǎo)致PC 服務(wù)器死機(jī)故障的因素眾多。

(1)當(dāng)硬件出現(xiàn)故障,如出現(xiàn)電源無(wú)法開(kāi)機(jī)的情況時(shí),需取下服務(wù)器里的所有電源模塊,同時(shí)還要檢查電源模塊和電源籠的接口,這種做法主要是對(duì)電源模塊和電源籠的接口松動(dòng)情況進(jìn)行確認(rèn),觀察其是否可以經(jīng)過(guò)重裝達(dá)到加固的效果,但如果是固定卡被損壞,則需更換電源,進(jìn)而對(duì)電纜進(jìn)行控制;另外,如果出現(xiàn)其他電纜接口被損壞的情況,則需更換備件;當(dāng)開(kāi)機(jī)無(wú)法顯示,且系統(tǒng)日志里表明CPU 的電壓為OV 信息,而系統(tǒng)的指示燈也在不斷的閃爍,則表示為VRM 出現(xiàn)問(wèn)題或CPU 發(fā)生故障,此時(shí)應(yīng)該把CPU換到其他CPU 插槽中,但如果重啟之后還是出現(xiàn)此類(lèi)現(xiàn)象,則表示CPU 發(fā)生損壞,此時(shí)可將CPU 取出,而后仔細(xì)擦拭金手指;當(dāng)開(kāi)機(jī)之后未出現(xiàn)系統(tǒng)的信息提示時(shí),則分析可能為電源因素,但如果檢查之后認(rèn)定電源沒(méi)有問(wèn)題,則可能為PC 服務(wù)器的電源管理板發(fā)生故障,對(duì)此,只要更換電源管理板即可解決;在自檢的過(guò)程中,按CTRL+M 鍵但沒(méi)有檢測(cè)出硬盤(pán),且此時(shí)硬盤(pán)于其他服務(wù)器里可以正常使用,說(shuō)明應(yīng)該清除CMOS,如果還是沒(méi)有恢復(fù)正常,則需升級(jí)BIOS,此時(shí)依然沒(méi)有將問(wèn)題解決,則需全面檢查電源線、數(shù)據(jù)線以及硬盤(pán)籠子,如果還是無(wú)法解決,則需檢查服務(wù)器I/O 板,進(jìn)而對(duì)異常網(wǎng)卡予以清除[5]。另外,當(dāng)遇到系統(tǒng)死機(jī)、藍(lán)屏或反應(yīng)遲鈍等現(xiàn)象,表示服務(wù)器的軟件系統(tǒng)有問(wèn)題,此時(shí)應(yīng)該將重要文件備份之后重裝系統(tǒng);

(2)出現(xiàn)性能故障的時(shí)候,需要借助分析軟件,綜合分析服務(wù)器的性能瓶頸,做到有的放矢,增加內(nèi)存、增加網(wǎng)絡(luò)帶寬、提高處理器處理能力、調(diào)整系統(tǒng)核心參數(shù),通過(guò)一系列測(cè)試,將服務(wù)器的性能引起的死機(jī)問(wèn)題處理解決;

(3)出現(xiàn)應(yīng)用程序故障,我們一般是從系統(tǒng)或者應(yīng)用的日志中能查詢到相關(guān)報(bào)錯(cuò),抓取程序日志、系統(tǒng)日志、服務(wù)器BMC 端口日志,綜合分析。

3.2 維護(hù)處理無(wú)法訪問(wèn)網(wǎng)絡(luò)或IP地址沖突的故障

遇到這種情況且無(wú)法進(jìn)行查看時(shí),需考慮以下幾方面問(wèn)題。如果為硬件原因,則首先要仔細(xì)檢查,做好安裝和連接;如果是因網(wǎng)絡(luò)屬性的設(shè)置原因,則要進(jìn)行專(zhuān)門(mén)的設(shè)置操作,首先需檢查網(wǎng)絡(luò)標(biāo)示,具體的步驟為:打開(kāi)“我的電腦”中“屬性”選項(xiàng),檢查計(jì)算機(jī),而后對(duì)計(jì)算機(jī)名進(jìn)行修改,在對(duì)話框中檢查網(wǎng)絡(luò)的標(biāo)示,檢查“工作組”或“域”,然后就是檢查IP 地址的設(shè)置,準(zhǔn)確設(shè)置網(wǎng)絡(luò)地址,最后則是對(duì)網(wǎng)絡(luò)協(xié)議進(jìn)行設(shè)置。而當(dāng)IP 地址發(fā)生問(wèn)題時(shí),則需重新規(guī)劃IP 地址,或?qū)P 地址進(jìn)行動(dòng)態(tài)的分配,這樣即可解決問(wèn)題。

4 結(jié)束語(yǔ)

總而言之,PC 服務(wù)器故障問(wèn)題可能會(huì)對(duì)整個(gè)工作區(qū)域造成影響,所以要做好預(yù)測(cè)分析和維護(hù)處理。只有保證PC 服務(wù)器正常、安全、有效地運(yùn)行,才能使工作順利進(jìn)行,推動(dòng)各單位的信息化發(fā)展。

猜你喜歡
故障
故障一點(diǎn)通
奔馳R320車(chē)ABS、ESP故障燈異常點(diǎn)亮
WKT型可控停車(chē)器及其故障處理
基于OpenMP的電力系統(tǒng)并行故障計(jì)算實(shí)現(xiàn)
故障一點(diǎn)通
故障一點(diǎn)通
故障一點(diǎn)通
故障一點(diǎn)通
故障一點(diǎn)通
江淮車(chē)故障3例
主站蜘蛛池模板: 她的性爱视频| 老司机午夜精品网站在线观看| 国产精品页| 亚洲精品片911| 欧美一级高清片久久99| 99视频有精品视频免费观看| 真人免费一级毛片一区二区| 1级黄色毛片| 日韩国产 在线| 亚洲天堂在线视频| 97久久免费视频| 久久公开视频| 一级爆乳无码av| 99精品免费欧美成人小视频| 久久国产热| 呦女精品网站| 男人天堂伊人网| 日韩色图在线观看| 亚洲丝袜中文字幕| 日韩午夜福利在线观看| 福利在线不卡一区| 久久精品一卡日本电影| 国产在线一区二区视频| 亚洲人成电影在线播放| 日韩美毛片| 天天躁狠狠躁| 五月婷婷导航| 无码网站免费观看| 色综合中文| 99视频只有精品| 无码电影在线观看| 99久久精品国产自免费| 亚洲欧美精品在线| 免费A∨中文乱码专区| 国产福利微拍精品一区二区| 综合五月天网| 老司机久久99久久精品播放| 亚洲欧美日韩中文字幕一区二区三区| 香蕉国产精品视频| 日韩性网站| 福利在线不卡| 国产99精品久久| 国产三级a| 欧美午夜久久| 精品国产乱码久久久久久一区二区| 免费99精品国产自在现线| 国产午夜看片| 亚洲毛片在线看| 五月婷婷综合网| 国产欧美精品一区二区| 国模在线视频一区二区三区| 婷婷伊人久久| 成色7777精品在线| 欧美一级大片在线观看| 亚洲欧美另类专区| 狠狠操夜夜爽| 国产精品久久自在自2021| av手机版在线播放| 免费又黄又爽又猛大片午夜| 欧美不卡在线视频| 欧美黄网在线| 亚洲av无码专区久久蜜芽| 伊人天堂网| 乱人伦视频中文字幕在线| 日韩在线中文| 免费在线色| 99久久人妻精品免费二区| 91免费国产高清观看| 久久综合伊人77777| 欧美97色| 色一情一乱一伦一区二区三区小说 | 久久综合色视频| 国产福利免费视频| 日韩a级片视频| 亚洲成a人片7777| 久久精品中文字幕少妇| 中文字幕在线日韩91| 无码一区18禁| 自拍中文字幕| 亚洲天堂高清| 国产精品久久精品| 国产精品免费福利久久播放|