999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于TMS320C6678的復(fù)數(shù)求模算法研究

2018-10-11 03:34:18袁子喬
火控雷達(dá)技術(shù) 2018年3期
關(guān)鍵詞:利用效率

楊 剛 杜 力 袁子喬

(西安電子工程研究所 西安 710100)

0 引言

TMS320C6678[1](后文中簡稱C6678)是TI公司于2010年推出的一款具有業(yè)界領(lǐng)先處理能力的多核DSP處理器,其采用的是KeyStone多內(nèi)核架構(gòu),片內(nèi)集成了8個C66x核,每個核都具有定點和浮點運算能力,同時也集成了SRIO(Serial RapidIO),PCIe(Peripheral Component Interconnect Express)等接口,為方便數(shù)據(jù)的搬移,配置了EDMA(Enhanced Direct Memory Access)。TI公司也為開發(fā)人員提供了C6678的mathLib,dsplib等函數(shù)庫。

得益于C6678強(qiáng)大的并行處理能力和接口的高速數(shù)據(jù)傳輸能力,其在信號處理領(lǐng)域應(yīng)用極其廣泛,特別是雷達(dá)信號處理領(lǐng)域,過去的FPGA+DSP的架構(gòu)中,大部分的計算(如DPC算法[2],MTD算法[3]等)是在FPGA中完成,但FPGA調(diào)試效率極低,嚴(yán)重地降低了雷達(dá)信號處理機(jī)調(diào)試的效率。在C6678出現(xiàn)后,現(xiàn)在越來越多的雷達(dá)信號處理算法從FPGA遷移到了DSP中完成,極大地提升了雷達(dá)信號處理機(jī)的調(diào)試效率。然而,雷達(dá)信號處理中許多數(shù)據(jù)都是復(fù)數(shù)形式的,需要進(jìn)行大量的復(fù)數(shù)求模,而傳統(tǒng)的復(fù)數(shù)算法效率極低,嚴(yán)重地影響了整個信號處理機(jī)的效率,因此,對C6678中復(fù)數(shù)求模算法進(jìn)行優(yōu)化有著重要的意義。

本文所有內(nèi)容是針對TMS320C6678進(jìn)行探討,考慮到實際情況中一般是對復(fù)數(shù)向量求模,所以本文的測試數(shù)據(jù)是一個復(fù)數(shù)向量,所討論的每個復(fù)數(shù)對應(yīng)的求模時間為復(fù)數(shù)向量的求模時間除以向量長度。所有測試中,測試數(shù)據(jù)和所求結(jié)果都在LL2中,L1D cache大小為32kB,L1P cache大小為32kB,L2 cache大小為0,編譯器優(yōu)化選項為-O3,測試結(jié)果以MTALAB作為“真值”進(jìn)行誤差分析。

1 常規(guī)的復(fù)數(shù)求模算法

1.1 第一種常規(guī)的復(fù)數(shù)向量求模算法vec_abs1

常規(guī)的復(fù)數(shù)求模公式很簡單,先求實部虛部平方和,然后再調(diào)用math.h中的sqrt函數(shù)求平方根,這是最“正規(guī)”的也是效率最低的,事實上TI針對自身DSP提供的dsplib中的sqrtsp函數(shù)性能優(yōu)于sqrt函數(shù),所以用sqrtsp代替sqrt。因此得到第一種常規(guī)的復(fù)數(shù)向量求模算法的程序如圖2所示。

1.2 第二種常規(guī)的復(fù)數(shù)向量求模算法vec_abs2

TI分別針對C6200,C6400,C6600等提供了許多Intrinsic操作符,這些操作符默認(rèn)是內(nèi)聯(lián)的[4](Inlined),利用這些操作符對復(fù)數(shù)向量求模算法優(yōu)化,主要是對取數(shù)和乘法進(jìn)行優(yōu)化可以得到第二種常規(guī)的復(fù)數(shù)向量求模算法。其中,用到的Intrinsic函數(shù)及含義如下:

1) const double & _amemd8_const (const void *ptr); 從存儲器中讀取8字節(jié)數(shù)據(jù)。

2)double _complex_conjugate_mpysp (double src1, double src2); 復(fù)數(shù)共軛乘法。

3) float _lof (double src); 從double中提取低位float。

4) float _hif (double src); 從double中提取高位float。

第二種常規(guī)的復(fù)數(shù)向量求模算法程序如圖3所示。

1.3 第三種常規(guī)的復(fù)數(shù)向量求模算法vec_abs3

TI提供的dsplib中包括了許多向量、矩陣的處理函數(shù),效率很高。考慮到復(fù)數(shù)向量求模需要計算很多次的實部與實部的乘法,以及虛部與虛部的乘法,所以調(diào)用dsplib中的向量乘法函數(shù)DSPF_sp_vecmul,從而得到第三種常規(guī)的復(fù)數(shù)向量求模算法,程序見圖4。

經(jīng)過實驗對比發(fā)現(xiàn),常規(guī)方法中,第三種效率最高,第一種次優(yōu),第二種最差。第三種的測試結(jié)果如表1所示。

通過表1可以看出,雖然第三種常規(guī)復(fù)數(shù)向量求模算法相對于第一種和第二種效率更高,但每個復(fù)數(shù)點平均耗時仍然約為62個時鐘周期,對于信號處理來說,效率還是很低,不過,因為是最基本的實現(xiàn)方法,所以該方法精度很高,最差的最大絕對誤差百分比為5.564378038394069e-07。

表1 第三種常規(guī)復(fù)數(shù)向量求模算法測試結(jié)果

2 RSQRSP指令vec_abs_noitr

表2 利用RSQRSP指令的復(fù)數(shù)向量求模算法測試結(jié)果

通過表2可以看出,利用RSQRSP指令進(jìn)行復(fù)數(shù)向量求模,效率極高,每個復(fù)數(shù)點平均耗時為2.72119~5.3125個時鐘周期,而vec_abs3中每個復(fù)數(shù)點平均耗時約62個時鐘周期,所以vec_abs_noitr相對于vec_abs3效率提升11.6706~22.7841倍。

從表2中的最大絕對誤差百分比可以看出該算法精度較低,僅可用于對精度要求不高的計算中。

3 利用牛頓迭代的改進(jìn)

x(n+1)=x(n)[1.5-(ν/2)×x(n)×x(n)]

(1)

其中,v為原始數(shù)據(jù)。每迭代一次精度提高2-8,也即迭代一次精度為2-16,迭代兩次精度為2-24。

進(jìn)行一次Newton-Phapson迭代的復(fù)數(shù)矩陣求模算法vec_abs_1itr的程序如圖6所示,測試結(jié)果如表3所示。

表3 一次Newton-Phapson迭代的復(fù)數(shù)矩陣求模算法測試結(jié)果

通過表3可以看出,利用Newton-Phapson迭代一次后每個點平均耗時為9.0703125~13.59375,時間較vec_abs_noitr有所增加,但相對于vec_abs3來說,效率還是提升了4.5609~6.8355倍,而最大絕對誤差百分比已經(jīng)達(dá)到了約1.5e-5,該精度可以滿足大多數(shù)的信號處理算法。

進(jìn)行二次Newton-Phapson迭代的復(fù)數(shù)矩陣求模算法vec_abs_2itr的程序如圖7所示,測試結(jié)果如表4所示。

通過表4可以看出,利用Newton-Phapson迭代二次后每個點平均耗時為16.0698~20.5625,時間較vec_abs_1itr有所增加,但相對于vec_abs3來說,效率還是提升了3.0152~3.8582倍,對比表4和表1中的最大絕對誤差百分比可以看出,vec_abs_2itr的精度和vec_abs3幾乎一致。

4 結(jié)果分析

由前述的測試結(jié)果可以得出,常規(guī)算法中,利用sqrtsp的vec_abs3精度最高,但效率最低;而單純利用RSQRSP指令的vec_abs_noitr效率最高,但精度最差;通過Newton-Phapson迭代一次vec_abs_1itr精度精度較差,效率較高;通過Newton-Phapson迭代二次vec_abs_2itr精度精度最高,效率較差。這四種算法的特點如表5所示。

5 結(jié)束語

本文針對TMS320C6678研究了信號處理領(lǐng)域經(jīng)常使用到的復(fù)數(shù)求模算法,包括最基本的常規(guī)復(fù)數(shù)求模算法,利用RSQRSP指令的復(fù)數(shù)求模算法,以及利用RSQRSP指令的基礎(chǔ)上通過Newton-Phapson迭代一次和二次的復(fù)數(shù)求模算法,并給出了各種算法的測試結(jié)果,分析了各種算法的效率和精度,測試結(jié)果對信號處理設(shè)計師有很重要的參考意義。

猜你喜歡
利用效率
利用min{a,b}的積分表示解決一類絕對值不等式
利用倒推破難點
提升朗讀教學(xué)效率的幾點思考
甘肅教育(2020年14期)2020-09-11 07:57:42
利用一半進(jìn)行移多補(bǔ)少
注意實驗拓展,提高復(fù)習(xí)效率
利用數(shù)的分解來思考
Roommate is necessary when far away from home
效率的價值
商周刊(2017年9期)2017-08-22 02:57:49
利用
跟蹤導(dǎo)練(一)2
主站蜘蛛池模板: 精品国产Av电影无码久久久| 国产精品不卡片视频免费观看| 亚洲天堂网2014| 午夜高清国产拍精品| 国产精品对白刺激| 欧美成人怡春院在线激情| 午夜国产理论| 韩日免费小视频| 久久a级片| 国产麻豆91网在线看| 亚洲最黄视频| 日本一本正道综合久久dvd| 国产av一码二码三码无码| 91欧洲国产日韩在线人成| 人与鲁专区| 91探花国产综合在线精品| 日韩一区精品视频一区二区| 亚洲第一区在线| 特级aaaaaaaaa毛片免费视频| 精品国产自在在线在线观看| 亚洲欧美日韩中文字幕一区二区三区 | 久久久久亚洲Av片无码观看| 欧美啪啪网| 久久久久亚洲Av片无码观看| 久青草免费在线视频| 国产精品不卡片视频免费观看| 国产自视频| 久久精品这里只有国产中文精品| 天天操天天噜| 2048国产精品原创综合在线| 91精品国产一区自在线拍| 色成人亚洲| 另类欧美日韩| 91久久精品日日躁夜夜躁欧美| 国产本道久久一区二区三区| 97在线观看视频免费| 首页亚洲国产丝袜长腿综合| 91国内在线视频| 老汉色老汉首页a亚洲| 国产玖玖玖精品视频| 亚洲Aⅴ无码专区在线观看q| 亚洲日韩在线满18点击进入| 91精品久久久久久无码人妻| 久久综合成人| 特级毛片免费视频| 亚洲成人网在线播放| 国产欧美精品一区aⅴ影院| 在线观看亚洲精品福利片| 国产成人免费| 91在线播放免费不卡无毒| 久久不卡国产精品无码| 激情综合婷婷丁香五月尤物| 国产黄在线免费观看| 亚洲精品国产综合99| 在线免费观看AV| 精品国产成人高清在线| 久久永久精品免费视频| 亚洲一区二区三区中文字幕5566| 欧美成人综合在线| 自拍偷拍欧美日韩| 亚洲欧美h| 三上悠亚在线精品二区| 欧美无专区| 伊人色综合久久天天| 国产美女叼嘿视频免费看| 日韩在线永久免费播放| 久久精品人人做人人爽| 99视频在线观看免费| 久久精品中文字幕少妇| 91成人在线免费观看| 国产又大又粗又猛又爽的视频| 亚洲免费福利视频| 国产成人区在线观看视频| 久久窝窝国产精品午夜看片| 亚洲男女天堂| 国产中文在线亚洲精品官网| 四虎精品黑人视频| 蜜芽一区二区国产精品| 国产精品香蕉在线| 国产美女自慰在线观看| 亚洲中文无码h在线观看| 四虎永久免费地址|