湖南師范大學文學院 李達清
嵌入式計算機控制系統容錯策略
湖南師范大學文學院 李達清
在信息時代快速發展的背景下,計算機與互聯網已經成為人們日常生活、學習與工作中的重要組成部分。計算機控制技術的廣泛應用,尤其是在航空航天、工程設計、精密器件生產管理等方面具有重要應用價值。在此過程中,計算機具有的容錯性至關重要。基于此,本文以嵌入式計算機控制系統為例,對嵌入式計算機控制系統容錯工作模式與系統容錯策略進行了分析,以供參考。
嵌入式計算機系統;系統容錯性;系統容錯設計
在計算機控制系統不斷創新與發展的背景下,容錯計算機控制系統整體性能得到了有效提升,并被應用于電子通信、工業制造、航空航天、公共服務等領域中,為計算機控制系統運行的穩定性、準確性提供了保障。對嵌入式計算機控制系統容錯策略的研究,有利于進一步明確并掌握嵌入式計算機控制系統存在的問題,為嵌入式計算機控制系統容錯設計提供依據,以便進一步提升計算機控制系統功能的最大化發揮。
近年來,隨著計算機技術的不斷創新與普及應用,構建計算機控制系統已成為各領域各行業現代化建設工作中的重點內容之一。隨著計算機控制系統應用價值的提升,計算機控制系統穩定性與運行安全性問題的研究被提上日程。而據分析發現,受大數據以及我國計算機技術水平的影響,提升計算機控制系統穩定性的重要途徑在于強化系統的容錯性。
容錯(Fault-tolerance),通俗的說就是容許錯誤、容忍故障,。以嵌入式計算機控制系統為例,當系統中一個或多個硬件、軟件產生故障與錯誤時,系統可以自動進行檢測與診斷,并執行既定程度,保證系統規定作用的正常發揮,進行正常運行。
因此,明確嵌入式計算機控制系統容錯策略,從系統結構出發實現容錯技術的有效應用,是提高嵌入式計算機控制系統可靠性的重要舉措,具有一定研究價值。
現階段,在計算機運行過程中,嵌入式計算機控制系統容錯一般分為以下幾個階段,進行系統故障處理。
第一,系統故障檢測:由于嵌入式計算機系統故障最終結果多為邏輯故障,容錯系統可通過“一致性校驗”或“奇偶校驗”進行具體檢測。目前,在故障檢測主要分為兩種類型,即線檢測與離線檢測。其中,在線檢測具有實際檢測功能且與計算機控制系統運行具體協調統一性,因此多被應用于衛星控制或軍事控制系統中,而在進行離線檢測時,系統則不能進行維持在工作狀態中。
第二,系統故障限制:嵌入式計算機容錯故障限制模式主要是指,當故障發生時,將影響系正常工作的因素或故障的影響性限制在一定范圍內,用以避免系統故障對計算機控制系統中的其他區域產生影響。
第三,系統重試:在計算機控制系統運行過程中,瞬間故障作為系統不穩定故障,對系統整體穩定性具有重要影響作用。而通常情況下,多數計算系控制系統統一操作具有二次重啟功能,該功能對受非物理性質破壞的計算機控制系統故障具有一定的應用價值。
第四,系統重組與修復:當計算機容錯系統檢測并判定計算機控制系統出現永久性故障時,系統容錯則側重于對重組系統元件與失效系統元件的替換與分離。修復則主要是指當計算機控制系統發生故障時,對故障元件進行替換,用以保證系統的正常運行,該操作可實現系統在線或離線轉態的同時進行[3]。
第五,系統屏蔽:系統屏蔽主要是指,為避免出現故障區域或節點對系統輸出的影響,采用將多模表決冗余或邏輯屏蔽的方法將故障效應進行遮蓋。在此過程中,當冗余資源被消耗殆盡時,系統設備將產生輸出錯誤。
第六,系統恢復:在進行系統重組、屏蔽等操作后,借助于系統軟件程序,實現系統故障轉態向系統正常運行狀態的恢復。
嵌入式計算機控制系統容錯策略,是容錯技術與亢余技術的整合設計。為提升嵌入式計算機控制系統容錯能力,在計算機控制系統故障頻發單元中,適當加入亢余計設計,強化系統容錯性。
由于嵌入式計算機控制系統主要由硬件系統和軟件系統共同組成,因此系統容錯策略可分為系統硬件的容錯策略與系統軟件的容錯策略。近年來隨著信息技術的快速發展,嵌入式計算機控制系統呈現智能化發展,智能化硬件系統容錯策略在基于亢余技術的實現得到提升。其中,電路級冗余、靜態冗余、動態冗余、靜態冗余與動態冗余混合設計,推動了計算機系統容錯策略工作模式的順利執行,在一定程度上保證了計算機控制系統可靠性。
在計算機軟件系統的容錯策略中,主要采用“指令冗余”與“軟件陷阱”兩種容錯設計進行方法的具體體現:其一,指令冗余:指令冗余是提升嵌入式計算機控制系統容錯性能的重要手段,主要由“操作數”與“操作碼”共同組成計算機控制系統中CPU所執行并完善的所有操作多由操作碼在基于操作數的技術性進行指明的[4]。而在計算機控制系統中,無論是操作碼,還是操作數其指令控制皆由程序計數器PC完成,因此一旦PC遇到干擾產生故障,將對其他指令產生重要影響,致使系統程序脫離正常運行軌道,形成“跑飛”現象。在嵌入式計算機控制系統容錯中通過進行指令冗余設計,則可有效改善上述問題,降低跑飛程序發生機率,通過單字節指令將跑飛的程序引導至原有軌道。與此同時,在雙字節指令、多字節指令后面適當的插入NOP單字節指令,可有效提升各指令之間的關聯性與緊密性,改善指令整體質量。NOP指令依據自身所具有的本質特性,可有效控制跑飛程序對對操作數上其他程度的影響,提升系統容錯性。此外,也可利用指令冗余技術提升嵌入式計算機控制系統容錯策略中“系統重復”作用的最大化發揮,即在容錯重復系統中設置一定量的重要重復指令,在保證指令科學運行的基礎上,對系統中重要的數據進行審核,通過不斷的審核及時探尋系統程序中存在的問題并給予有效的修正,提升系統運行準確性與可靠性。其二,軟件陷阱:據經驗分析與資料整合發展,在嵌入式計算機控制系統容錯中,通過創設一定的軟件陷阱,可效提升控制系統運行的穩定性,減低程序錯誤的影響性。即,嵌入式計算機控制系統容錯中所設置的軟件陷阱,通過利用相應的指令對跑飛程序進行及時撲捉;其次,軟件陷阱將跑飛程序引入到復位入口,并在過程中對應程度問題產生的各項故障進行實質性處理,避免因部分程序錯誤而影響系統整體程序錯誤,用以保證計算機控制系統運行的穩定性。目前,常用的軟件陷阱方法主要有“運行程序區”、“中斷服務區”以及“未使用的ROM空間”,在軟件陷阱設計應用過程中,需根據實際需求與軟件規模特性進行合理設置。例如,在運行程序區設計過程中,可利用“模塊化”設計形式在用戶計算機控制系統空白程序模塊中,設置既定陷阱指令,實現對跑飛程序的有效控制;而中斷服務程序區主要是通過在系統主程序運行區域內布設“計時器”,當遇到跑飛程序時,執行定時中斷,用以避免跑飛程序影響性的擴散;對ROM空間的設計,通常情況下需保留一部分空間用以為跑飛程序的引導提升前提條件,保證系統運行的可靠性[5]。
綜上所述,本文對計算機控制系統概述、容錯工作模式以及系統可靠性提升策略進行了分析,以期進一步明確并掌握嵌入式計算機控制系統容錯策略,提升嵌入式計算機控制系統運行的穩定性與可靠性,為我國計算機技術水平的優化發展,提供有益幫助。
[1]劉曄.計算機控制系統可靠性設計[J].信息通信,2016,02:133-134.
[2]謝建洲.計算機系統容錯技術研究[J].電腦知識與技術,2016(06).
[3]呂迅竑,姜斌,陳欣,等.無人機容錯飛行控制計算機體系結構研究[J].系統工程與電子技術,2016,11:2586-2597.