999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

TMS320C6678多核DSP的HyperLink應(yīng)用

2017-02-22 09:02:44盧建章
關(guān)鍵詞:機制

盧建章,劉 洋

(1.中航工業(yè)雷華電子技術(shù)研究所,江蘇 無錫 214063;2. 江南計算技術(shù)研究所,江蘇 無錫 214083)

TMS320C6678多核DSP的HyperLink應(yīng)用

盧建章1,劉 洋2

(1.中航工業(yè)雷華電子技術(shù)研究所,江蘇 無錫 214063;2. 江南計算技術(shù)研究所,江蘇 無錫 214083)

嵌入式應(yīng)用中采用多處理系統(tǒng)所面臨的主要難題是多處理器之間的數(shù)據(jù)通信。通過對Key-Stone架構(gòu)TMS320C6678處理器的HyperLink通信機制進行研究,利用其高速、低延遲、引腳少的特性實現(xiàn)處理器間的高速數(shù)據(jù)交換。從實際應(yīng)用的角度,設(shè)計了HyperLink的映射結(jié)構(gòu),并分析了性能,對多處理器間通信具有一定的參考價值。

TMS320C6678;HyperLink;處理器間通信

0 引言

嵌入式領(lǐng)域的處理器設(shè)計已經(jīng)向多核與多處理器迅速發(fā)展,最典型的是TI公司的KeyStone架構(gòu)的多核處理器。TI公司2010年11月發(fā)布的KeyStone架構(gòu)的8核DSP處理器TMS320C6678,其每個C66x內(nèi)核主頻最高達1.25 GHz,可以提供每秒高達40 GB MAC定點運算和20 GB FLOP浮點運算能力;1片8核的TMS320C6678提供等效160 GB FLOP的浮點運算能力,是TS201S的50倍多[1],適用于諸如油氣勘探、雷達信號處理等對定浮點運算能力以及實時性有較高要求的超高性能計算應(yīng)用。

處理器之間的數(shù)據(jù)交換是多處理器系統(tǒng)所面臨的主要難點,通信機制的優(yōu)劣直接影響系統(tǒng)的處理性能,高效的通信機制是發(fā)揮多處理器系統(tǒng)高性能的重要保障。TMS320C6678采用TI全新KeyStone多核架構(gòu),屬于單芯片多核結(jié)構(gòu)。由于板載多芯片之間的通信相對復雜,因此不同的設(shè)計選取會直接影響通信的效率。TMS320C6678采用基于KeyStone結(jié)構(gòu)的專有外設(shè)接口HyperLink,采用的編碼方式等效于8b9b,相對用于高速SerDes接口的傳統(tǒng)的8b10b編碼方式,其減少了編碼冗余,提高了數(shù)據(jù)傳輸效率。單片提供4個設(shè)計速度為12.5 Gb/s的SerDes通道,所以HyperLink的理論吞吐率能達到44.4 Gb/s。

基于以上分析,本文針對TMS320C6678多核處理器,首先介紹了HyperLink的原理與機制,然后分析芯片之間HyperLink通信的映射原理,給出了通信連接的實現(xiàn)方法,并通過對多種映射關(guān)系進行對比,得出優(yōu)缺點和使用范圍,為嵌入式多處理器系統(tǒng)的設(shè)計提供參考。

1 HyperLink機制

HyperLnik能為兩個KeyStone架構(gòu)DSP之間提供一種高速、低延遲、引腳數(shù)少的通信連接,是TI專有的外設(shè)接口。它使用了類似PCIE的內(nèi)存映射機制,但能為多核DSP提供一些更為靈活的特性,下面從應(yīng)用的角度分析HyperLink的構(gòu)成和配置。

1.1 模塊架構(gòu)

HyperLink是TI公司為實現(xiàn)嵌入式系統(tǒng)中芯片間高效數(shù)據(jù)交互而開發(fā)的一種點對點的全雙工的連接模式,并能提供讀、寫和中斷3種傳輸方式。HyperLink模塊架構(gòu)如圖1所示。其中的PPL負責模塊的時鐘控制,通過合理的倍頻系數(shù)配置生成需要的內(nèi)部時鐘,從而驅(qū)動鏈路上數(shù)據(jù)的傳輸[2]。

1.2 映射機制

TMS320C6678每個核的0x40000000-0x50000000地址空間為HyperLink專屬,相應(yīng)核只有在配置了HyperLink后才能對該地址空間進行讀寫,并通過相應(yīng)的配置實現(xiàn)與遠端存儲空間的映射,包括DDR、SL2和LL2,具有非常靈活的映射關(guān)系。如圖2所示。

圖1 模塊構(gòu)架圖

圖2 HyperLink映射關(guān)系

對于任何一個TMS320C6678,入口映射窗一共64個,每個都可以對應(yīng)不同的遠端地址和長度,比如DSP1的LL2、SL2和DDR。本地出口窗由16個16 MB的地址空間組成,可以映射到遠端入口窗所指向的地址空間。通過圖2的映射配置,DSP0可以訪問DSP1的所有內(nèi)存空間,就像訪問自己的本地存儲空間一樣。為了實現(xiàn)地址映射,必須按照以下方式進行設(shè)置[3]:

(1) 根據(jù)實際的地址映射關(guān)系和地址有效位配置發(fā)送端地址掩碼寄存器(TXIGMASK)、PrivID和安全位域寄存器,接收端配置地址段選擇寄存器(RX_SEG_VAL)和PrivID表;

(2) 配置串行/解串模塊(SerDes)的參考時鐘、數(shù)據(jù)傳輸回路方式和鏈路速率等信息;

(3) 寫鎖相環(huán)寄存器(CFGPLL),啟動HyperLink的訓練序列,并等待物理層返回準備狀態(tài)。

按照上述配置后,DSP0讀寫本地出口窗地址時,HyperLink通過地址轉(zhuǎn)譯,即相當于直接訪問映射的遠端地址。

1.3 地址轉(zhuǎn)譯

處理器核1在通過本地專屬的地址0x40001234 進行讀寫操作時,HyperLink按照地址掩碼寄存器的配置要求,結(jié)合專屬地址和PrivID(core 1)生成發(fā)送端的HyperLink請求地址。例如發(fā)送端配置地址掩碼寄存器(TXIGMASK)為11(即掩碼0x0FFFFFFF),PrivID位域為1(即Bit31:28),那么經(jīng)過轉(zhuǎn)譯后輸出的請求地址為PrivID+0x40001234&0x0FFFFFFF=0x10001234。接收側(cè)根據(jù)段選擇寄存器解析出請求地址映射的目的地址,從而完成數(shù)據(jù)訪問。整個接收端的地址轉(zhuǎn)譯過程如圖3所示。

圖3 地址轉(zhuǎn)譯過程

以圖3的過程為例,從接收到的請求地址的31:28位提取出PrivID索引值1,相應(yīng)表對應(yīng)的值為7,從29:24位提取出地址片段表索引0x10,相應(yīng)表對應(yīng)的地址片段起始地址值為0x0C00,長度為23(即16 MB),通過地址的轉(zhuǎn)換,最后真正訪問的地址為0x0C001234。

2 HyperLink應(yīng)用設(shè)計與性能測試

以上是對TMS320C6678 的HyperLink通信機制及其實現(xiàn)過程的簡單分析,但是要實現(xiàn)TMS320C6678 強大的多處理器功能,必須從系統(tǒng)的角度來設(shè)計良好的拓撲。通信代價、帶寬和功能是評測通信的重要指標,下面介紹一種多處理器通信方式,分析它們的拓撲結(jié)構(gòu),并對不同映射配置做出測試對比。

2.1 拓撲結(jié)構(gòu)

以機載雷達某機箱內(nèi)的多個處理器(6678)之間的通信為例,簡要說明HyperLink如何應(yīng)用在機載雷達設(shè)計中。如圖4所示,某雷達機箱內(nèi)有4個TMS320C6678處理器,每個處理器包含8核,并與一個RapidIO 路由器相連,整個機箱內(nèi)每兩個處理器之間通過HyperLink連成兩組,這就形成了該機箱內(nèi)的處理器拓撲結(jié)構(gòu),各處理器結(jié)合HyperLink和SRIO實現(xiàn)數(shù)據(jù)的高效流轉(zhuǎn)。

圖4 處理器拓撲圖

2.2 性能測試實驗

本節(jié)對HyperLink 訪問遠程存儲空間的性能進行評估,并提供在不同的操作條件下獲得的性能測試數(shù)據(jù)。大部分測試是在最理想的測試條件下進行,以使評估可以獲得最大吞吐量。處理器運行的頻率設(shè)置為1 GHz,DDR配置成64 bit,位寬1 333 MB,采用的編譯環(huán)境是TI 公司的CCSv5.0。

通信測試結(jié)果如表1所示,描述了使用HyperLink 在LL2 與遠程大塊線性存儲空間進行數(shù)據(jù)傳送測試獲得的傳輸帶寬。傳輸塊的大小為64 KB。帶寬是通過計算總的傳輸字節(jié)數(shù)除以傳輸所用的時間獲得。

表1 核通過HyperLink實現(xiàn)讀寫帶寬

表1的數(shù)據(jù)展示了cache 能夠極大地改善DSP 內(nèi)核通過HyperLink 讀取數(shù)據(jù)的性能。但是 L2 cache 卻遏制了通過HyperLink 寫數(shù)據(jù)的性能,這是因為L2 是write-allocate cache。對于使能L2 cache 后的寫操作,它總是會先從將要寫入的存儲區(qū)讀取128 B數(shù)據(jù)到L2 cache,然后在L2 cache 中修改數(shù)據(jù),最后在cache 沖突時回寫到原先的存儲區(qū),或者人為地回寫到原存儲區(qū)。

HyperLink還可以通過TMS320C6678設(shè)定EDMA事件進行傳輸,通信測試結(jié)果如表2所示。

表2 EDMA通過HyperLink實現(xiàn)讀寫帶寬

表2中的EDMA 吞吐率數(shù)據(jù)是通過TC0 (傳輸控制器0)和CC0(通道控制器0)測試得到,其他TCs的數(shù)據(jù)會比TC0 稍低。整個傳輸?shù)钠款i是在HyperLink,不是在EDMA 傳輸控制器上。表2的測試結(jié)果表明,通過HyperLink 進行寫操作的性能會比通過HyperLink 進行讀操作的性能要好。

3 結(jié)論

本文研究了基于TMS320C6678處理器的片間通信,深入分析了HyperLink模塊結(jié)構(gòu)、映射機制(包括寄存器配置以及具體的實現(xiàn)方法)和地址轉(zhuǎn)譯過程,文中以某種機載雷達處理機拓撲結(jié)構(gòu)為例測試了HyperLink的數(shù)據(jù)傳輸性能。對設(shè)計多片DSP 處理器的片間通信具有一定的指導價值。

[1] Texas Instruments Inc.Multicore design overview[Z].2011.

[2] Texas Instruments Inc.TMS320C6678 data manual[Z].2011.

[3] Texas Instruments Inc.KeyStone Architecture HyperLink User Guid[Z]. 2012.

The application of the HyperLink in TMS320C6678 multicore DSP

Lu Jianzhang1,Liu Yang2

(1. AVIC Leihua Electronic Technology Research Institute, Wuxi 214063, China; 2. Jiangnan Computing Technology Research Institute, Wuxi 214083, China)

Inter-processor communication is the main problem of multi-processor system. Based on the study of the HyperLink communication mechanism of TMS320C6678 multi-processor, the high-speed, low-latency, and low-pin-count HyperLink communication interface is realized. From the point of practical application, HyperLink mapping structures are designed and the performance is analyzed. Some reference value is provided for designing inter-processor communication.

TMS320C6678; HyperLink; inter-processor communication

TN915.04

A

10.19358/j.issn.1674- 7720.2017.03.011

盧建章,劉洋.TMS320C6678多核DSP的HyperLink應(yīng)用[J].微型機與應(yīng)用,2017,36(3):36-38,41.

2016-10-03)

盧建章(1984-),男,本科,工程師,主要研究方向:雷達信號處理、嵌入式信號處理系統(tǒng)。

劉洋(1985-),女,碩士,工程師,主要研究方向:信息安全。

猜你喜歡
機制
構(gòu)建“不敢腐、不能腐、不想腐”機制的思考
自制力是一種很好的篩選機制
文苑(2018年21期)2018-11-09 01:23:06
“三項機制”為追趕超越蓄力
當代陜西(2018年9期)2018-08-29 01:21:00
丹鳳“四個強化”從嚴落實“三項機制”
當代陜西(2017年12期)2018-01-19 01:42:33
保留和突破:TPP協(xié)定ISDS機制中的平衡
定向培養(yǎng) 還需完善安置機制
破除舊機制要分步推進
氫氣對缺血再灌注損傷保護的可能機制
注重機制的相互配合
打基礎(chǔ) 抓機制 顯成效
中國火炬(2014年4期)2014-07-24 14:22:19
主站蜘蛛池模板: 国产高潮视频在线观看| 国产精品视频猛进猛出| 亚洲VA中文字幕| 成年女人a毛片免费视频| 日韩精品一区二区三区视频免费看| 亚洲中文字幕在线精品一区| 伊人久久大香线蕉成人综合网| 色婷婷视频在线| 一本大道视频精品人妻| 免费中文字幕在在线不卡| 美女被躁出白浆视频播放| 亚洲国产成人麻豆精品| 国产乱人免费视频| 永久成人无码激情视频免费| 久久中文电影| 在线观看免费黄色网址| 久久久久久午夜精品| 精品少妇人妻一区二区| 老司机午夜精品网站在线观看 | 色噜噜中文网| 久久青草精品一区二区三区| 无码人妻免费| 亚洲一区第一页| 日韩第一页在线| 亚洲午夜片| 国产在线麻豆波多野结衣| 国产a网站| 亚洲六月丁香六月婷婷蜜芽| 色哟哟色院91精品网站| 久久精品人人做人人综合试看| 国产午夜无码片在线观看网站| 18禁黄无遮挡网站| 欧美国产日本高清不卡| 国产jizzjizz视频| 国产伦精品一区二区三区视频优播 | 国产丝袜91| 欧美一级在线| av午夜福利一片免费看| 欧美三級片黃色三級片黃色1| 丁香五月激情图片| 91年精品国产福利线观看久久 | 亚洲无码37.| 成人一区在线| 久久国语对白| 国产玖玖视频| 草草影院国产第一页| 国产杨幂丝袜av在线播放| 亚洲精品视频免费| 一区二区三区成人| 毛片网站在线播放| 666精品国产精品亚洲| 精品少妇人妻无码久久| 日本不卡视频在线| 欧美a级完整在线观看| 国产色婷婷| 夜夜爽免费视频| 欧美一级色视频| 久久久波多野结衣av一区二区| h视频在线观看网站| 国产一区二区三区日韩精品| 夜夜拍夜夜爽| 国产爽爽视频| 亚洲精品在线影院| 麻豆国产精品视频| 欧美中文字幕在线视频| 91丝袜美腿高跟国产极品老师| 亚洲综合天堂网| 国产一区二区精品高清在线观看| 国产一级在线观看www色| 丰满少妇αⅴ无码区| 国产精品视频猛进猛出| 精品无码人妻一区二区| 看国产一级毛片| 国产一国产一有一级毛片视频| 亚洲精品777| 国产精品手机视频| 久久99热66这里只有精品一| 国产成人综合久久精品尤物| 国产精品林美惠子在线观看| 91精品国产无线乱码在线| 在线色国产| 永久在线播放|