999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于多級片上總線的并行圖像處理系統設計

2008-12-31 00:00:00楊根慶尹增山
計算機應用研究 2008年7期

摘 要:采用基于平臺級FPGA的SOC設計方法, 設計了一種基于多級PLB總線的可擴展并行圖像處理系統。系統采用總線橋并行擴展處理單元來增加系統處理性能和擴展存儲訪問帶寬;通過數據分發模塊實現圖像數據輸入與處理流水線操作。時序功能仿真與硬件實現表明,該設計能靈活高效地實現系統結構的并行擴展,顯著提高了系統并行處理性能。

關鍵詞:片上系統;處理器局部總線; 流水線; 圖像處理

中圖分類號:TP302.1 文獻標志碼:A

文章編號:1001-3695(2008)07-2208-02

Designing of parallel image processing system based on multi-bus onchip

PAN Bo1, 2, YANG Gen-qing1, SUN Ning1, YIN Zeng-shan1

(1.Shanghai Institute of Microsystem Information Technology, Chinese Academy of Sciences, Shanghai 200050,China;2.Graduate School, Chinese Academy of Sciences, Beijing 100039, China)

Abstract:This paperintroduced grounded on the FPGA platform SOPC design methodology, a scalable parallel image processing system based on multilevel PLB. By using a distribution module, a pipeline operation was carried out in date input and process; and a bus bridge was applied to augment the parallel process elements. Bus functional simulation and hardware verification show that this design can flexibly realize parallel processing in system structure, and enhance the parallel process performance of the system remarkably.

Key words: SOC; PLB (processor local bus); pipeline; image process

片上系統(SOC)能在單個硅芯片上集成各種功能子模塊,通過片上總線互連實現系統級處理性能。特別是基于FPGA的可編程片上系統(SOPC),由于它能滿足系統對于體積、靈活性以及穩定性的要求,在實時圖像處理系統中得到了廣泛的應用。隨著圖像精度的不斷提高,在滿足系統實時性要求的情況下,處理任務負載將會大大增加。SOC通過在內部擴展多個處理單元,顯著地提高了系統處理能力。但應該指出的是系統總線必須具備相應的數據吞吐速率才能提高系統的整體性能。特別是較底層的圖像處理任務雖然算法簡單但是需要對數據進行頻繁的訪問和操作。當處理單元所需的數據訪問帶寬大于總線傳輸能力時將會造成總線競爭,進而影響到圖像處理系統的實時性。

本文在基于平臺的SOPC設計技術基礎上,從系統并行擴展的同時提高存儲訪問帶寬的角度出發,設計了一種基于多級片上總線的可擴展并行圖像處理系統。本文首先介紹了系統結構框架與功能;然后對系統的總線帶寬以及并行擴展性能進行了分析與介紹;最后進行時序仿真與硬件驗證。結果表明,本設計在靈活實現系統并行擴展的同時,顯著提高了系統并行處理性能。

1 基于多級總線SOPC系統結構設計

隨著圖像精度的不斷提高,在滿足系統實時性情況下必然要加大系統的計算性能,如在系統總線上擴展處理單元,同時相應地擴展存儲帶寬以提供相應的數據訪問速率。單總線結構由于總線帶寬固定,勢必會成為系統數據傳輸的瓶頸,進而影響到系統的實時性。

不同于ASIC(專用集成電路),SOC主要通過IP核復用來實現系統級功能,通過標準片上總線接口,可以使SOC系統中的IP功能單元具有較好的可移植性。本文設計了一種基于多級PLB的可擴展并行處理架構,如圖1所示。通過片上總線擴展了多個處理單元。 處理器PE-m是主控制器,功能為配置其他從單元;Distribution模塊為數據分發控制模塊,用來實現圖像數據輸入與處理的流水線操作;處理單元PE1和PE2為并行圖像處理單元,它們作為從設備通過PLB-PLB總線橋掛接于總線PLB-m之上,同時也是局部總線PLB-1和PLB-2的惟一主設備。高速同步雙口SRAM作為局部總線上的從設備,用來存儲原始圖像數據與數據處理結果。

并行處理流程如下,外部輸入的圖像數據在distribution模塊控制下以分塊形式輸入,前一個數據塊通過片內邏輯互連寫入SRAM的端口A,隨后啟動PE1通過端口B進行數據訪問與處理;同時后一個數據塊寫入PE2處理單元的局部存儲器,隨后啟動PE2進行處理。PE1和PE2處理完成后以中斷方式通知主控制器進行后續操作。

總線占用情況如圖1所示,除了與主控制器交互以外,從處理單元PE1和PE2將一直占用局部總線;主控制器PE通過distribution模塊訪問存儲器來得到處理結果,圖像數據的輸入通路不占用系統總線。整個操作過程滿足數據驅動原則,即由數據塊的輸入來驅動整個流水線操作。對于圖像精度的增加,即單位時間增加了輸入圖像的數據量,則可通過總線橋在PLB-m總線上并行擴展如圖1虛線框內部所示單元來增加系統處理性能。

2 系統性能分析

本文通過多級總線擴展并行處理單元來滿足SOPC圖像處理系統對實時性的要求,主要分析了該系統的各級總線帶寬以及采用該結構的并行系統加速比性能。

2.1 總線帶寬分析

本文采用的PLB片上總線是IBM公司研究開發的高端SOC的片上系統CoreConnect-v3.5[1]總線協議的其中一部分。相對于其他常用的片上總線,如AMBA總線與Wishbone總線, CoreConnect更適合高性能與復雜計算系統的互連。PLB作為系統總線主要掛接多主從設備、可地址流水、讀寫并發以及突發(burst)操作,同時支持低延遲、靈活性好的高帶寬數據通道。

PLB對從設備的數據訪問操作是采用應答方式進行的,一次讀或寫操作可分為單傳輸與突發模式。考慮到系統中采用的流水線型并行SRAM的數據信號比存儲控制信號延遲兩個時鐘周期,單傳輸將加大總線訪問存儲器時間開銷,且由于定長突發相對于不定長突發具有更高的總線利用率,系統在圖像數據的讀寫過程中采用定長突發傳輸模式;同時為了實現存儲帶寬最大化,在系統內部通過存儲控制單元實現圖像數據的對齊,多個像素灰度值作為一個存儲單元。由于定長突發的操作數據長度可按1~16進行,總線寬度是64 bit,這樣一次突發操作的數據塊長度為4~128 Byte,從而在極大地減小總線應答開銷的同時增強了總線的有效帶寬和利用率。

由于兩次相鄰操作之間有應答開銷,對于訪問同樣數據量,一次操作訪問的數據量越大其總線有效帶寬就越大;同時相鄰操作的異同也決定了總線的有效利用率。設N為突發數據長度,G為相鄰操作之間應答所需的開銷,m為突發操作的平均時鐘數,則單位總線時鐘的數據傳輸量Q(bit/clk)=(64 Nm)/(Nm+G)。圖2給出了64位PLB在不同長度定長突發方式下,分別以讀、寫及間隔讀寫操作方式下的存儲訪問帶寬。

圖2中,橫軸為定長突發數據長度,縱軸為單總線時鐘周期內的傳輸速率。由于系統各級PLB均采用一個主設備結構,

對于各級處理單元總線平均帶寬均為 B=f(PrQr+PwQw)。其中:f為系統總線頻率;Pr和Pw分別為讀寫操作的比重。系統采用的總線頻率f=100 MHz,若各處理單元均采用定長16次操作,取Pr=Pw=0.5,則各級總線帶寬為612 MBps。

2.2 系統并行擴展加速比

圖像精度的增加也就意味著單位時間內要處理更多的圖像數據。考慮到自圖像傳感器如CCD輸出圖像數據類型為順序單行類型,雖然緩沖后輸入的圖像數據在塊內為隨機單點類型,但整體上數據塊仍是按照時間順序輸入的序列[3],因此系統結構采用流水線并行方式進行處理。圖3比較了單處理單元與多處理單元流水線操作在時間開銷上的對比。中間部分為數據處理開銷;1、1表示圖像數據源輸入和結果數據輸出時間開銷;數據塊的大小以處理任務所需要的圖像領域范圍來確定。

由圖3可知,設處理單元PE1、PE2為完全相同的邏輯處理單元,且對數據塊1、2的處理時間均為Tp,則在連續工作狀態下,流水線輸入2N個數據塊的時間開銷比為R=(Tin+Tout+2NTp)/(2Tin+Tout+NTp)。當N→∞時,R→2,即單位時間內雙處理單元處理的數據量為單處理單元兩倍。考慮到更一般的情況,將并行處理單元擴展到P個,連續工作狀態下的時間開銷比將為 Rn→∞=(Tin+Tout+PNTp)/(2Tin+Tout+NTp)=P。即可獲得的加速比為P。應該指出的是,在數據塊以圖3所示流水線方式輸入的情況下,并行處理單元的擴展數目存在上限,即P不應大于Tp/Tin,否則將存在處理單元的冗余,導致系統效率的下降。

3 設計驗證

設計過程中,對設計進行了包括代碼語法檢查、總線行為和時序驗證以及系統功能驗證。通過總線功能仿真工具BFM[2,5]與虛擬存儲設備模型搭建了一個模塊化可配置的驗證系統,快速高效地進行系統邏輯功能驗證。在驗證過程中,采用Xilinx公司IP核FIR[6] (H_taps=V_taps=5)和FFT[7]例化處理單元進行了系統性能驗證。表1給出了系統在不同算法和結構下的仿真結果。

仿真過程主要考察通過總線擴展并行處理單元對系統性能的影響。所以各單元采用相同邏輯結構與算法。原始圖像大小為以流水線方式輸入,大小2K×2K×16 bit。存儲器同步時鐘與總線時鐘均為100 MHz。若在單總線結構SOPC中,在算法FIR(H_taps=V_taps=5)和FFT處理單元總線占用率分別為61.0%和62.5%情況下,單總線的并行擴展將會存在總線競爭而增加系統開銷。由表1可知,通過多級總線擴展由于可以獲得較大的總線帶寬而產生很少的并行開銷,具有較高的并行加速比。

圖4給出了系統進行2D-FIR濾波時的仿真波形。圖示上面部分為PLB總線信號;中間部分為2D-FIR時序信號,下部分為存儲器控制時序信號。同步時鐘為100 MHz情況下SRAM的帶寬為800 MBps[8],操作中采用64位PLB總線128 Byte定長突發方式,能在單總線周期內實現一個存儲單元(64 bit)的讀寫,極大地實現了系統高帶寬存儲。

4 結束語

為了應對圖像精度不斷增長對于圖像處理系統實時性的挑戰,本文設計了一種基于多級SOC總線的可擴展并行圖像處理系統。對比驗證給出的實驗結果表明,該系統能通過靈活高效的并行擴展圖像處理單元來滿足圖像處理對于系統實時性提出的要求。同時由于SOPC可編程邏輯系統的特點,對于不同的圖像處理任務,算法與數據結構可通過系統的可重構特性來減少系統資源開銷,進一步提高系統并行處理效率。

參考文獻:

[1]IBM Inc. 64-bit processor local bus architecture specifications [K].[S.l.]:Research Triangle Park,2001.

[2]IBM Inc. Processor local bus functional model toolkit user’s manual, version 4.7 [K].[S.l.]:Research Triangle Park,2002.

[3]蘇光大. 圖像并行處理技術 [M]. 北京:清華大學出版社,2002.

[4]EL-REWINI H,ABD-EL-BARR M. Advanced computer architecture and parallel processing [M]. [S.l.]:Wiley,2005.

[5]Xilinx Inc. BFM simulation tutorial [EB/OL]. (2006-07-18)[2007-04-16].http://www. xilinx.com.

[6]Xilinx Inc. Two-dimensional linear filtering [EB/OL]. (2006-05-09)[2007-04-10]. http://www. xilinx.com.

[7]Xilinx Inc. Fast fourier transform v3.2 [EB/OL].(2006-01-11)[2007-05-12].http://www. xilinx.com.

[8]FLEx72TM 3.3V 64K/128K/256K x 72 synchronous dual-port RAM [EB/OL].(2006-05-02)[2007-04-18]. http://www.cypress.com.

注:“本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文。”

主站蜘蛛池模板: 91免费国产高清观看| 99国产精品免费观看视频| 久久一色本道亚洲| 国产剧情国内精品原创| 亚卅精品无码久久毛片乌克兰| 丁香婷婷在线视频| 亚洲欧美自拍视频| 亚洲精品天堂在线观看| 天天综合色天天综合网| 日韩无码黄色网站| 亚洲欧美另类日本| 国产精品一区不卡| 久久青草免费91观看| 国产精品一区不卡| 在线a视频免费观看| 五月天天天色| 国产精品久久久久久影院| 亚洲69视频| 亚洲天堂日韩在线| 日韩精品高清自在线| A级毛片高清免费视频就| 久久性妇女精品免费| 88av在线看| 久久九九热视频| 91精品情国产情侣高潮对白蜜| 国产99欧美精品久久精品久久| 一级看片免费视频| 久热这里只有精品6| 国产免费观看av大片的网站| 日韩小视频网站hq| 人妻21p大胆| 国产在线精品香蕉麻豆| 99国产在线视频| 91热爆在线| 国产精品成人不卡在线观看| 亚洲欧美成人在线视频| 91成人免费观看| 一级毛片不卡片免费观看| 四虎影视无码永久免费观看| 日韩欧美国产综合| 国产精品三级av及在线观看| 亚洲人成网站18禁动漫无码| 2021无码专区人妻系列日韩| 国产在线视频导航| 成人亚洲视频| 亚洲侵犯无码网址在线观看| 亚洲VA中文字幕| 国产成人精品一区二区| 欧美a网站| 91福利在线看| 国产精品成人观看视频国产| 欧美高清日韩| 久久久91人妻无码精品蜜桃HD| 亚洲人成成无码网WWW| 天天综合色网| 欧美一区二区福利视频| 国产精品久久久久鬼色| 国产美女无遮挡免费视频网站 | 国产h视频在线观看视频| 亚洲第一极品精品无码| 都市激情亚洲综合久久| 国产日韩欧美在线播放| 在线视频亚洲欧美| 91亚洲免费视频| 国产综合另类小说色区色噜噜 | 亚洲无码高清一区二区| 精品国产黑色丝袜高跟鞋| 免费在线播放毛片| 福利片91| 午夜精品区| 色综合狠狠操| 欧美日韩在线第一页| 亚洲无码熟妇人妻AV在线| 精品国产自在现线看久久| 国产亚洲现在一区二区中文| 国产麻豆91网在线看| 亚洲天堂高清| 国产成人高清精品免费5388| 911亚洲精品| 欧美性久久久久| 日韩国产黄色网站| 国产高潮流白浆视频|