胡東偉
(1.中國(guó)電子科技集團(tuán)公司第五十四研究所,河北石家莊 050081;2.通信網(wǎng)信息傳輸與分發(fā)技術(shù)重點(diǎn)實(shí)驗(yàn)室,河北石家莊 050081)
近年來(lái),由于MIMO系統(tǒng)不但能同時(shí)傳送多路的數(shù)據(jù)流,同時(shí)還能提高每路數(shù)據(jù)流的分集階數(shù),使得系統(tǒng)吞吐率大大提高,因而得到了廣泛的研究[1-4]。研究的焦點(diǎn)集中在高性能、低復(fù)雜度的MIMO 檢測(cè)算法[5-7]。目前研究最為火熱的、最有可能走向?qū)嵱玫娜匀皇莾砂l(fā)兩收(2×2)和四發(fā)四收(4×4)的MIMO系統(tǒng)。2×2的系統(tǒng)已經(jīng)在atheros公司的產(chǎn)品中得以應(yīng)用,但目前采用的仍然是線性檢測(cè)算法,與最大似然檢測(cè)算法的性能差距仍然較大。因此,atheros公司相繼推出了3×2、3×3的MIMO系統(tǒng)以提高性能,但采用的仍然是線性檢測(cè)算法[8]。2×2的最大似然檢測(cè)算法已見報(bào)道,但復(fù)雜度仍然過高[9]。文獻(xiàn)[10]報(bào)道的球形解碼算法,也能實(shí)現(xiàn)最大似然檢測(cè),但吞吐量不確定。本文首先分析現(xiàn)有的2×2系統(tǒng)的檢測(cè)算法,然后提出3種降低2×2最大似然檢測(cè)算法復(fù)雜度的方法。本文的工作將2×2最大似然檢測(cè)算法推向了實(shí)用。
2×2系統(tǒng)的示意圖如圖1所示。2根發(fā)送天線分別發(fā)送信號(hào)s1、s2,對(duì)應(yīng)的2根接收天線接收到r1、r2。設(shè)2根發(fā)送天線和2根接收天線之間的信道衰落因子為h11、h12、h21和h22,則系統(tǒng)的信號(hào)模型為:

式(1)可簡(jiǎn)記為:

式中,n=[n1,n2]T表示單邊帶功率譜為 N0的白噪聲;h11、h12、h21和h22均為方差為2的復(fù)高斯變量;(·)T為轉(zhuǎn)置。

圖1 2×2 MIMO系統(tǒng)
已有的檢測(cè)算法分為線性檢測(cè)算法和最大似然檢測(cè)算法2類。
已有的線性檢測(cè)算法包括代數(shù)消元法和QR分解法2種。
2.1.1 代數(shù)消元法
由式(1),忽略噪聲,代數(shù)消元解方程可得:

式(3)的計(jì)算較簡(jiǎn)單,只需6個(gè)復(fù)數(shù)乘法,一個(gè)復(fù)數(shù)求倒數(shù)即可。復(fù)數(shù)的求倒數(shù)可通過2個(gè)實(shí)數(shù)乘法,一個(gè)實(shí)數(shù)加法和2個(gè)實(shí)數(shù)除法來(lái)實(shí)現(xiàn)。
2.1.2 QR分解法
式(2)的ZF估計(jì)(HHH)-1HHr和MMSE估計(jì)HH(H HH+N0I)-1r可分別通過 H 和[HH,]H的QR 分解來(lái)實(shí)現(xiàn)[10]。其中(·)H為共軛轉(zhuǎn)置。以下只討論ZF估計(jì)的實(shí)現(xiàn)方法。設(shè)

R為上三角矩陣,R-1可通過逆向遞推來(lái)實(shí)現(xiàn)。因此,ZF估計(jì)的實(shí)現(xiàn)復(fù)雜度主要集中在QR分解。H為2×2的復(fù)矩陣,其QR分解可通過3次的Cordic算法來(lái)實(shí)現(xiàn)。主從式Cordic算法可同時(shí)求出一個(gè)復(fù)數(shù)的模和角度的sin、cos值[11]。H 的 QR分解可分以下3步:
①由Cordic算法旋轉(zhuǎn)出h21的模和角度α21,對(duì)式(1)的第 2 行乘以 e-jα21;
②Cordic旋轉(zhuǎn)出h11的模和角度α11,對(duì)式(1)的第 1 行乘以 e-jα11;
包括逆向遞推過程,整個(gè)QR分解算法的計(jì)算復(fù)雜度為3次Cordic旋轉(zhuǎn),9個(gè)復(fù)數(shù)乘法和4個(gè)實(shí)數(shù)除法。顯然,這個(gè)復(fù)雜度比代數(shù)消元法的復(fù)雜度大得多。仿真表明,二者具有相同的性能。
值得一提的是,在寬帶寬應(yīng)用時(shí),檢測(cè)速度的要求很苛刻。因此,上面的除法器和Cordic單元需用組合邏輯或較淺的流水線來(lái)實(shí)現(xiàn)。傳統(tǒng)的Cordic單元每一級(jí)旋轉(zhuǎn)為一級(jí)流水,實(shí)現(xiàn)起來(lái)耗費(fèi)寄存器太多,這時(shí)可合并多級(jí)旋轉(zhuǎn)為一級(jí)流水。
2.2.1 球形解碼算法
球形檢測(cè)算法是一種被廣泛研究的算法[10]。但其存在2個(gè)顯著的缺陷:①球形檢測(cè)算法實(shí)質(zhì)上是一種深度優(yōu)先的搜索算法,其搜索過程較慢,吞吐量受限;② 其計(jì)算時(shí)間不可掌控。在WiFi或LTE系統(tǒng)中,帶寬已經(jīng)達(dá)到20 MHz、40 MHz或以上,球形檢測(cè)算法的吞吐量難以滿足要求。
2.2.2 基于最大比合并的最大似然檢測(cè)算法
(1)算法原理
眾所周知,最大比合并(MRC)是符合最大似然準(zhǔn)則的。假設(shè)s2已知,則s1可通過式(6)估計(jì)出來(lái):

式中,h1為式(2)中H的第1列。仿真表明,該估計(jì)符合最大似然檢測(cè)性能。因此,整個(gè)式(1)的最大似然檢測(cè)可通過對(duì)s2的搜索來(lái)實(shí)現(xiàn)。對(duì)每一個(gè)可能的s2,都需要一次式(6)的計(jì)算。
式(6)的計(jì)算涉及到3個(gè)復(fù)數(shù)乘法和2個(gè)實(shí)數(shù)除法。倘若64QAM調(diào)制,則s2有64種可能,需分成64個(gè)分支來(lái)搜索。每個(gè)分支都需2個(gè)復(fù)數(shù)乘法(可64分支共享,只需一次計(jì)算,可忽略)和2個(gè)實(shí)數(shù)除法。實(shí)現(xiàn)中除法使用量化器實(shí)現(xiàn)。因此,整個(gè)計(jì)算需128個(gè)復(fù)數(shù)乘法器和128個(gè)實(shí)數(shù)量化器來(lái)實(shí)現(xiàn),復(fù)雜度仍然過高。
(2)軟信息的提取
s1、s2估計(jì)出來(lái)之后,可提取每個(gè)比特的軟信息[9]。

求取s1中每個(gè)比特的軟信息,需要將s1、s2的位置交換,假設(shè)s1已知,s2根據(jù)式(6)判決,重新執(zhí)行上述過程。因此,復(fù)雜度又將完全翻一倍。
其他檢測(cè)算法典型的有K-best算法和QRSIC(Serial Interference Cancellation)算法。K-best算法也采用搜索的辦法,在每一級(jí)搜索中,只擴(kuò)展K個(gè)分支,而不管星座符號(hào)集的大小。因此,這不是一種最大似然的檢測(cè)算法。仿真表明,其性能較最大似然檢測(cè)算法要差,其復(fù)雜度也居于最大似然檢測(cè)和線性檢測(cè)算法之間。
QR-SIC算法是又一種典型的檢測(cè)算法,先判決s2,然后代入判決s1,這也不是最大似然檢測(cè)算法。
預(yù)三角化方法首先按照QR分解方法:將矩陣H三角化[11]。三角化后,式(1)變?yōu)?

R11、R22為正實(shí)數(shù)。然后應(yīng)用式(6),

s2確定時(shí),式(10)的計(jì)算只需要2個(gè)實(shí)數(shù)量化器即可。因此,64個(gè)分支只需128個(gè)實(shí)數(shù)量化器。與已有的算法相比,去掉了128個(gè)復(fù)數(shù)乘法器,而增加了一個(gè)QR分解過程。QR分解過程只3個(gè)Cordic旋轉(zhuǎn)和8個(gè)復(fù)數(shù)乘法器。因此,復(fù)雜度大大降低。
式(7)可進(jìn)一步近似,用曼哈頓距離替代歐氏距離[12],即

與式(7)的歐氏距離計(jì)算相比,式(11)的曼哈頓距離計(jì)算省去了復(fù)數(shù)乘法器。因此,求取s2各比特軟信息時(shí),省去64個(gè)復(fù)數(shù)乘法器;s1亦然。一共省去128個(gè)復(fù)數(shù)乘法器。
仿真表明,按照式(11)的近似方法,檢測(cè)性能無(wú)明顯損失。
按照式(7)或式(11)提取軟信息時(shí),倘若是假設(shè)s2已知的64個(gè)分支,則只能提取s2各比特的軟信息;假設(shè)s1已知的64個(gè)分支,則只能提取s1各比特的軟信息。因此,要提取s1、s2各比特的軟信息,需要2套的預(yù)三角化方法、2套的分支判決機(jī)構(gòu)(64分支的式(10)判決)和2套的軟信息提取電路。這2套電路完全相同。
分析第2套電路的目的,完全是為了取出s1各比特的軟信息。此時(shí),s1各比特的硬判決信息其實(shí)已經(jīng)在第1套電路中獲得。因此,倘若不嚴(yán)格按照式(7)或式(11)來(lái)提取軟信息,則第2套電路可以省掉。在第1套電路中獲得s2各比特軟信息的同時(shí),從64個(gè)分支中,估計(jì)出s1,并按照式(11)求得64個(gè)分支的判決誤差。取判決誤差最小的分支,即可求得s1、s2的硬判決。重新按照式(10)得到s1的軟判決。
有了s1的軟判決,可直接搜索s1與64個(gè)星座點(diǎn)的距離。當(dāng)判決s1中第k比特時(shí),將這64個(gè)距離分成2個(gè)集合,分別為C0和C1。其中,C0中所用星座點(diǎn)的第k比特均為0,C1中所用星座點(diǎn)的第k比特均為1。則第k比特的軟信息為:

式(12)是從s1的軟判決^s1中提取軟信息,而不是從對(duì)s1搜索的結(jié)果中提取軟信息。其中的歐氏距離也可以使用曼哈頓距離來(lái)簡(jiǎn)化近似。仿真表明,式(12)的提取方法有2.5 dB的性能損失。
仿真時(shí),采用靜態(tài)塊傳輸信道,64QAM調(diào)制。假設(shè)h11、h12、h21和h22的實(shí)部和虛部均為方差為1的高斯隨即變量,且相互獨(dú)立。每一組數(shù)據(jù)(s1、s2)信道有一次獨(dú)立實(shí)現(xiàn)。圖2示出了已有的2種線性檢測(cè)算法和最大似然檢測(cè)算法的性能比較。可以看出,2種線性檢測(cè)算法的性能相當(dāng),而最大似然檢測(cè)算法的性能要好很多。在誤碼率為10-4時(shí),最大似然檢測(cè)相比線性檢測(cè)算法性能提高10 dB以上。

圖2 線性檢測(cè)和最大似然檢測(cè)的性能比較
圖3和圖4研究3種簡(jiǎn)化檢測(cè)方法對(duì)軟輸出性能的影響。為此,在檢測(cè)模塊之外,采用了(2,1,7)的卷積編碼和維特比解碼。維特比解碼采用延遲深度為30的未量化的解碼形式。圖3中研究了使用曼哈頓距離取代歐氏距離和QR分解2種方法的影響。由圖可見,這2種方法對(duì)軟輸出性能幾乎無(wú)影響。與傳統(tǒng)的檢測(cè)及軟輸出方法相比,這2種方法基本不造成性能的損失。

圖3 簡(jiǎn)化方法對(duì)軟輸出提取的影響

圖4 簡(jiǎn)化的軟信息輸出
圖4研究了采用簡(jiǎn)化的軟輸出方法時(shí)的性能。由圖可見,采用這種簡(jiǎn)化的軟輸出,在誤碼率10-3時(shí),大約有2.5 dB的性能損失。
針對(duì)目前2×2 MIMO系統(tǒng)最大似然檢測(cè)算法實(shí)現(xiàn)復(fù)雜度過高這一問題,本文提出了3種簡(jiǎn)化最大似然檢測(cè)算法復(fù)雜度的方法。第1種方法在檢測(cè)之前,先實(shí)施QR分解,將信道矩陣三角化。這一方法可去掉128個(gè)復(fù)數(shù)乘法器,而性能沒有改變。第2種方法使用曼哈頓距離取代歐氏距離。這一方法亦可去掉128個(gè)復(fù)數(shù)乘法器。仿真表明,這種方法亦不降低性能。第3種方法簡(jiǎn)化軟輸出的提取方法,使復(fù)雜度降低一半,性能亦有所下降。仿真表明,在誤碼率10-3時(shí),性能下降為2.5 dB。本文的第1種和第2種方法很好地解決了2×2的MIMO最大似然檢測(cè)復(fù)雜度過高的問題;而第3種方法在進(jìn)一步降低復(fù)雜度的同時(shí),性能亦有所下降,讀者可根據(jù)使用環(huán)境取舍。本文的工作將當(dāng)前廣泛使用的2×2 MIMO系統(tǒng)的最大似然檢測(cè)方法推向了實(shí)用?!?/p>
[1]GAO X Q,JIANG B,YOU X H,et al.Efficient Channel Estimation for MIMO Single-carrier Block Transmission with Dual Cyclic Timeslot Structure[J].IEEE Transactions on Communications,2007,55(11):2210 -2223.
[2]潘 文,蔣占軍,杜正峰,等.Blast結(jié)構(gòu)ML檢測(cè)簡(jiǎn)化方法分析[J].中國(guó)科學(xué) E 輯,2008,38(8):1277-1283.
[3]TAHERZADEH M,MOBASHER A,KHANDANI K A.Communication over MIMO Broadcast Channels Using Lattice-Basis Reduction [J].IEEE Transactions on Information Theory,2007,53(12):4567 -4582.
[4]GAN Y H,LING C,MOW W H.Complex Lattice Reduction Algorithm for Low-complexity Full-diversity MIMO Detection[J].IEEE Transactions on Signal Processign,2009,57(7):2701 -2710.
[5]HAENE S,PERELS D,BURG A-A Real-time 4-Stream MIMO-OFDM Transceiver:System Design,F(xiàn)PGA Implementation,and Characterization[J].IEEE Journal on Selected Areas in Communications,2008,26(6):877 -889.
[6]HIGUCHI K,KAWAI H,MAEDA N,et al.Experiments on Real-time 1-Gb/s Packet Transmission Using MLDBased Signal Detection in MIMO-OFDM Broadband Radio Access[J].IEEE Journal on Selected Areas in Communications,2006,24(6):1141 -1153.
[7]GUO Z,NILSSON P.Algorithm and Implementation of the K-best Sphere Decoding for MIMO Detection[J].IEEE Journal on Selected Areas in Communications,2006,24(3):491-503.
[8]陳 磊,張 敏,趙瑞弟,等.基于 QR分解的 MIMOOFDM檢測(cè)算法的改進(jìn)[J].無(wú)線電通信技術(shù),2014,40(1):34-36.
[9]LOMNITZ Y,ANDELMAN D.Efficient Maximum Likelihood Detector for MIMO Systems with Small Number of Streams[J].ElectronicsLetters,2007,43(22):120-125.
[10]MA X L,ZHANG W.Performance Analysis for MIMO Systems with Lattice-Reduction Aided Linear Equalization[J].IEEE Transactions on Communications,2008,56(2):309-318.
[11]龔耀寰.自適應(yīng)濾波:時(shí)域自適應(yīng)濾波和智能天線[M].北京:電子工業(yè)出版社,2003.
[12]KOIKE T,SEKI Y,MURATA H,et al.FPGA Implementation of 1Gbps Real-time 4X4 MIMO-MLD[C]∥International ITG Workshop on Smart Antennas,2008:139-146.