曹孟剛

摘要:FPGA具有豐富的可編程I/O引腳、邏輯宏單元、門電路以及RAM空間,在嵌入式領域的廣泛應用。本文以FPGA使用中一種設計缺陷進行分析并進行了改進。
關鍵詞:FPGA;PowerPC最小系統;故障分析及改進
0引言
本PowerPC最小系統故障為通訊模塊中偶發故障。通訊模塊由FPGA電路與協議芯片電路組成,處理GJB289A總線數據時,應用端數據通過PCI總線送到FPGA內部的雙端口RAM緩沖區,FPGA內部的PowerPC405將數據從雙口RAM中搬移至GJB289A總線協議芯片中,再通過GJB289A總線協議芯片轉換成GJB289A總線格式的數據在總線上傳輸;CIM模塊從GJB289A總線接收到的數據也通過PowerPC405搬移至雙口,應用端通過雙口獲取到數據;處理429總線數據時,應用端數據通過PCI總線送到FPGA內部的雙端口RAM緩沖區,FPGA內部的PowerPC405將數據從雙口RAM中搬移至429總線協議芯片中,再通過429協議芯片轉換成429格式的數據在總線上傳輸;CIM模塊從429總線接收到的數據也通過PowerPC405搬移至雙口,應用端通過雙口獲取到數據。在FPGA內部,包含兩個PowerPC405硬核,分別處理GIB289A總線的數據和429總線的數據。通訊模塊的設計原理框圖如圖1所示。
PowerPC最小系統由PowerPC405、PLB總線以及掛接在PLB總線上的RAM組成,其中,PowerPC405是運行總線數據處理軟件的處理器,PLB總線是處理器本地總線,RAM是PowerPC405中軟件的程序區、數據區及堆棧區的存儲空間。
應用端周期通過PCI總線訪問通訊模塊上BRAM1上的數據較短,當訪問周期較低時,PowerPC1偶發軟件運行異常。
一、故障機理分析
在通訊模塊的設計中,PPC405_1在運行時,通過PLB總線1訪問RAM1,進行取程序指令操作、讀寫程序數據、進棧出棧操作,同時在程序運行時,通過PLB總線1對1553協議芯片通信模塊進行讀寫訪問,通過PLB2OPB橋訪問掛接在OPB總線1上的BRAM1、中斷控制器IP核、timebase核。PPC405_2在運行時,通過PLB總線2訪問RAM2,進行取程序指令操作、讀寫程序數據、進棧出棧操作,同時在程序運行時,通過PLB2OPB橋訪問掛接在OPB總線1上的BRAM2,通過PLB2OPB橋訪問掛接在OPB總線2上的429通信模塊。
基于上述設計,在進行GJB289A總線通信發送數據時,CPU通過PCI官方IP核,訪問OPB總線1上掛接的BRAM1,將數據寫入BRAM1中。1553軟件通過PLB2OPB橋訪問掛接在OPB總線1上的BRAM1將數據從BRAM1中搬移至掛接在PLB總線1上的1553協議芯片通信模塊中。之后等待總線上來自總線控制器的消息命令,GJB289A總線協議芯片收到消息命令后,將已寫入的數據發送至總線上,之后發送消息結束中斷給FPGA,消息結束中斷通過中斷控制器核送給PPC405_1,PPC405_1中的軟件進入中斷服務程序執行,在中斷服務程序中,首先通過PLB2OPB橋訪問掛接在OPB總線1上的中斷控制器核,讀取中斷狀態等寄存器,然后進入用戶的中斷服務程序執行,在用戶的中斷服務程序中,存在對1553協議芯片通信模塊和BRAM1的訪問。
在上述程序運行及通信過程中,存在對PLB總線的頻繁訪問,導致PLB總線占用率過高,導致PPC405_1中的程序運行錯誤,出棧異常,導致PPC405_1訪問非法地址,該非法地址通過PLB2OPB橋傳到OPB總線上,導致OPB總線出現timeout現象,進而導致CPU通過PCI訪問BRAM1和BRAM2異常。程序運行錯誤導致程序進入0x0700異常處理中斷無法跳出,進而導致故障。
進一步分析OPB總線上出現訪問非法地址的原因,監控PPC405內部的軟件工作狀態,通過軟件debug的方式進行監控跟蹤,發現出現故障時,程序運行出棧異常,堆棧溢出,程序訪問了非法空間,該非法空間通過PLB2OPB橋傳到OPB總線上,導致OPB總線上出現timeout信號。進一步通過debug的方式監控PPC405的行為,發現出現異常后,軟件進入0x0700異常處理中斷執行,且無法跳出。針對該現象,修改xilinx庫文件中的源文件,修改0x0700異常處理中斷程序,在該異常中斷中,讀取PLB和PLB2OPB橋的DCR寄存器,DCR寄存器中的值顯示,在出現故障后,PPC405處理異常,存在對非法空間的訪問,導致出現timeout信號。
更改軟件,將0x0700異常處理中斷掛接在用戶的中斷服務程序中,在用戶的中斷服務程序中增加GPIO輸出,通過示波器測量PPC405的中斷信號,發現在出現故障時,軟件在用戶掛接的中斷服務程序中,進入一次700異常中斷,之后中斷服務程序正常結束,但是在下一次中斷進入之前,PPC405反復進入700異常中斷。導致軟件運行無法恢復正常。
由于PowerPC405中的軟件運行時,需要通過PLB總線訪問RAM讀取程序指令,讀寫程序運行的數據,并進行壓棧出棧等操作。因此針對PLB總線進行分析,通過查看PLB總線數據手冊可知,PLB總線不支持高總線占用率,詳見圖2。
二、優化設計
在FPGA邏輯中將原來PLB總線上掛接的供PPC405軟件運行指令和數據的RAM去掉。啟用OCM,將PPC405中軟件的指令分配至isocm中運行,將數據分配至dsocm中運行。