戴啟華,劉勤讓,沈劍良,孫淼,吳鳳陽
(國家數字交換系統工程技術研究中心,450002,鄭州)
?
采用集簇方法的片上網絡動態映射算法
戴啟華,劉勤讓,沈劍良,孫淼,吳鳳陽
(國家數字交換系統工程技術研究中心,450002,鄭州)
針對片上網絡(NoC)傳統一一對應映射關系造成的資源節點利用率不高和通信功耗大等缺陷進行了改進,提出了一種采用集簇方法的NoC動態映射算法(DMA)。首先利用分枝界定算法完成通信量大且相連任務節點的集簇,減小了任務圖通信總量;然后在此基礎上借助自適應粒子群算法完成最優映射結果的獲取;最后利用動態遷移策略對最優映射結果中單獨占用資源節點的任務節點進行集簇。仿真實驗表明,與隨機映射、動態螺旋映射算法和最優鄰居算法相比,DMA算法的通信功耗分別下降了73.93%、46.37%和14.55%,NoC面積占用率分別下降了50%、50%和33.3%。
片上網絡;動態映射;粒子群算法;動態遷移;集簇
隨著晶體管尺寸的不斷縮小,單個芯片上集成的元器件數量越來越多[1-3]。基于總線架構的片上系統(System-on-Chip,SoC)受制于時鐘頻率和有限的地址空間,芯片性能提升代價很大[4-5]。片上網絡(Network-on-Chip,NoC)的出現極大地緩解了SoC的困境,有效地支持了IP核之間高效可靠、高吞吐量、低功耗的通信[6]。
合理有效的映射算法能夠使系統整體性能得到提升,降低NoC運行中的代價成本,如功耗、面積需求等等。如何在給定設計約束的基礎上,將已知通信關系的任務節點分配到特征結構圖(architecture characteristic graph,ARCG)中合適的資源節點上,并且使目標函數最小化,已成為NoC領域需要解決的首要問題。NoC映射過程分為靜態映射和動態映射[7]:靜態映射要求在給定任務圖、拓撲結構和帶寬等約束條件下,任務節點到資源節點映射過程中所有的通信特征(如資源節點之間數據傳輸延遲,通信量等)不會變,所有的映射結果不會改變,也不能進行遷移;動態映射指的是任務節點與ARCG上資源節點的對應關系可以隨著通信需求或者ARCG資源占用情況進行改變。然而,NoC任務映射是一個NP問題。為了更有效地利用資源節點,很多學者對NoC動態映射都給予了關注。針對任務節點之間的通信量不同,文獻[8]采用DSMA將通信量最大的任務節點分配至NoC映射平臺中間節點,以螺旋形的順序依次分配其余任務節點直至完成映射。文獻[9-10]采用最優鄰居(NN)策略將具有高通信量的任務節點映射到同一個或者相近的資源節點上,以此減小任務節點之間的跳變數,減小運行功耗。文獻[11-12]結合NoC運行過程中任務節點之間的通信請求和資源節點之間的鏈路負載來進行動態映射。上述算法均存在評價函數單一的缺陷,動態映射結果在功耗、面積和鏈路負載上仍有可繼續優化的空間。
本文針對NoC上傳統一一對應映射關系造成的資源節點利用率不高和任務圖通信功耗大等缺陷進行了改進,提出了一種基于集簇的NoC動態映射算法——DMA。在任務圖映射過程中,利用分枝界定算法將通信量大的父子節點劃分到一個簇中,減小了任務圖通信總量;利用自適應粒子群算法獲取局部集簇后任務圖的最優映射結果;獲取最優映射結果中單獨占用一個資源節點的任務節點集合S和優先遷移集合S內通信量大的任務節點,利用評價函數判斷遷移是否成功。實驗表明:與隨機映射、最優鄰居和動態螺旋映射(DSMA)算法相比,本文所提算法可以有效地減小通信功耗和NoC映射平臺面積需求,提高資源節點利用率。
1.1 問題定義
本文主要研究NoC局部集簇動態映射策略。在介紹問題定義和模型描述之前,提出2個假設并作出說明。
假設1 資源節點最多能夠運行2個任務節點。
假設2 物理鏈路帶寬遠遠超過任務節點之間的通信需求。
本文采用資源節點為異構體的NoC映射平臺,根據文獻[9]可知資源節點在系統約束下可以運行多個任務節點。本文中將每個資源節點的任務節點最高承載量設置為2,既保證簇的映射可能性,又保證簇的集合不會太大,超過資源節點的處理能力。
物理鏈路帶寬不足引起的鏈路競爭會影響最后的功耗計算,而鏈路擁塞造成的功耗損失沒有確切的數學模型,無法獲取其較為準確的功耗值。為減小客觀因素對映射結果造成的影響,設定物理鏈路帶寬遠超任意任務節點之間的通信帶寬,滿足簇與簇之間的通信需求。
在上文2個假設下,給出如下定義。
定義1 任務圖(task graph,TG)是一個非循環有向圖GTG(n,w),頂點ni∈N表示一個任務節點,有向弧wi,j∈W表示任務節點i、j之間的通信量。以實際通信任務圖MPEG-4為例,其TG如圖1所示,任務節點之間連線上的數字即為wi,j。

圖1 MPEG-4任務圖
定義2 NoC映射平臺可以看成是一個特征結構圖GARCG(p,h),由資源節點、路由節點、網絡接口和資源節點的物理鏈路組成。其中頂點pi∈P表示NoC規則映射平臺上的一個資源節點,有向弧hpi,pj為節點pi、pj間的物理鏈路,其值為資源節點pi、pj之間的曼哈頓距離。NoC是一個參數化,二維網格結構的模型,假設其處于一個xy坐標軸中,1號路由節點處于坐標原點,則hpi,pj大小為|xi-xj|+|yi-yj|。資源節點編號自下往上、從左往右均依次增大,如圖2所示。
定義3 TG映射結果用1個一維數組表示,數組元素值為對應任務節點占用的資源節點編號。任務圖的映射結果如圖3所示,1號任務節點占用9號資源節點,2號任務節點占用5號資源節點。任務圖通信矩陣為C,大小為N×N,如式(1)所示。

圖2 NoC 4×4特征結構圖

(a)任務圖 (b)映射結果圖3 任務圖及映射結果

(1)
1.2 模型描述
(1)功耗模型。由文獻[13-14]可知,單位比特數據從資源節點pi傳輸到pj所消耗的能量為
(2)
式中:ES為單位比特數據在路由結構所消耗的能量;EL為單位比特數據在物理鏈路上傳輸所消耗的能量。TG任務節點數為M,映射結果所消耗的總能量為
(3)
式中:Wni,nj為任務節點ni到nj之間的通信量;pi、pj分別是任務節點ni、nj在ARCG上的映射資源節點。
(2)鏈路負載模型。鏈路負載是ARCG物理鏈路承載的通信量,合理的鏈路負載可以有效提高鏈路帶寬的利用率,減小數據傳輸中因鏈路競爭所產生的擁塞概率,故將鏈路負載方差作為評價映射結果好壞的一個指標,其計算公式為
(4)

(3)面積模型。相同任務圖在更小面積的NoC映射平臺上成功運行,表明該映射平臺上資源節點利用率更高。任務圖的面積模型可以用已映射資源節點的多少進行表征,故將映射結果資源節點需求量作為衡量映射結果優劣的一個指標,其計算公式為
(5)
式中:NR為已映射資源節點數;NT為單個任務節點映射對應的資源節點數;NC為任務節點簇映射對應的資源節點數。
2.1 局部集簇
在任務圖與NoC映射平臺產生映射關系之前,首先對任務圖進行預處理,采用分枝界定算法,按照任務節點之間的通信量關系和連接關系將各任務節點劃分到各層上,具體流程如下。
步驟1 計算TG各任務節點通信量,找到通信量最大的任務節點A作為根(父)節點。
步驟2 選擇與上層父節點相連的任務節點作為子節點,子節點可能與多個父節點相連,選擇與其相連且通信量最大的上層節點作為父節點。如任務節點7同時和父節點10和11相連,由于C10,7>C11,7,故選擇任務節點10作為節點7的父節點。
步驟3 重復步驟2,直至所有任務節點都劃分完畢。
根據上文假設可得,每個資源節點可運行2個任務節點。為提高資源節點利用率,需要對部分任務節點進行局部集簇。從根節點向下尋找任務節點,由于每個節點都可能連接多個任務節點,需要找出每一層中具有最大通信量的父節點和子節點,將兩者劃分到一個簇中。如圖4b所示,節點5是多個分枝的父節點,對比多個與其相連子節點的通信量,節點5和節點10的通信量最大,故將兩者劃分到一個簇中。第1層根節點已經集簇,以第2層任務節點為父節點,尋找通信量最大的父子節點劃分到一個簇中,直到第2層所有任務節點都遍尋完畢。依次類推,直至找到最后一層,局部集簇結果如圖4b虛線框所示。集簇造成任務節點數量及連接關系改變,通信矩陣C也相應改變為
C=

(6)

(a)任務圖 (b)集簇結果圖4 分枝界定流程圖
2.2 映射結果獲取
利用自適應粒子群算法獲取預處理任務圖在NoC映射平臺上的最優映射結果。粒子群算法(particle swarm optimization,PSO)是一種群體智能的優化算法,最早由Kennedy和Eberhart在1995年提出[15],快速的收斂速度和簡單易實現的特點使其迅速成為解決NoC映射問題的一個重要方法。標準粒子群算法無法隨著解空間的縮小進而動態調整收斂速度,易陷入早熟陷阱。本文構建了一種自適應粒子群算法,根據迭代次數的增加動態調整粒子速度的慣性權重值,消除了尋優過程中粒子速度慣性分量的不良影響,減少了算法的迭代次數。
自適應粒子群算法利用粒子自身歷史最優位置zi和群體最優位置gi來更新下一代粒子的速度和位置。用t表示算法的迭代次數,粒子根據下式完成速度和位置的更新
(7)
(8)
(9)
式中:c1、c2為非負常數,稱為加速度因子;r1、r2是分布在[0,1]之間的隨機數;ω為慣性權重,表示當前粒子繼承先前粒子速度的能力;ωs為初始慣性權重;ωe為迭代次數最大時的慣性權重;Tm為最大迭代次數。ω隨著迭代次數變化而變化,算法前期ω較大,維持算法較好的全局搜索能力;算法中期,ω變化較快,粒子迅速靠近最優解區域;算法后期,ω較小且變化緩慢,極大的提高了算法的局部尋優能力,從而取得了很好的求解效果。算法主要包括以下步驟。
步驟1 相關參數設置,粒子速度和位置初始化,并且計算粒子適應值。
步驟2 根據式(7)(8)更新粒子速度和位置,并計算適應值。
步驟3 對比新粒子適應值,更新z和g。在連續50次算法迭代中,z未更改,則最優解已尋到并顯示結果,否則轉步驟2。算法最大迭代次數為200。
預處理任務圖映射結果如圖5所示。

圖5 預處理任務圖映射結果
2.3 映射遷移

步驟1 找到自適應粒子群算法最優映射結果中一一對應映射的任務節點集合S。
步驟2 在S中找到通信量最大的任務節點,依次遷移到集合S中剩余的任務節點映射資源節點上。
步驟3 若遷移過后的R小于等于遷移之前的R,遷移成立。同一個任務節點若有多個遷移成立,選取R最小的作為本次遷移路徑。遷移成功,S集合減去集簇成功的2個任務節點;遷移失敗,S集合減去該任務節點。重復步驟2、步驟3,直至遷移結束。
遷移結果如圖6所示,任務節點8、1、2進行了映射遷移,任務節點811、13、29分別映射到一個資源節點上。自適應粒子群算法映射結果占用9個資源節點,遷移過后的映射結果占用6個資源節點,大大減小了資源節點需求量,既減小了映射結果對于NoC映射平臺的面積需求,同時也提高了資源節點的利用率。

圖6 任務節點遷移
利用自適應粒子群算法獲取MPEG-4原任務圖和局部集簇后任務圖映射結果,并與動態遷移結果進行對比,如表1所示。可以看到,動態遷移操作相對于原任務圖和局部集簇后映射結果在通信量、資源節點需求量和跳變數方面都有不同程度的減小。

表1 自適應粒子群算法對3種任務圖映射結果對比
為了驗證上文中的結論,本文的映射算法程序源代碼用C++編寫,在Linux環境下進行編譯和仿真。為體現算法的實用性,將實際任務通信圖MPEG-4作為測試樣本,實驗基于4×4NoC系統級模型展開,其特性如1.1節所述,同時借助1.2節所提模型獲取映射結果相關測試參數。由于采用啟發式智能算法,實驗結果不可避免地有一定的隨機性,以下數據均為3次實驗結果的平均值。
圖7為自適應粒子群算法迭代過程中慣性權重ω的變化過程。可以明顯地看到,在算法的起始階段ω較大,確保了算法前期較強的全局搜索能力,收斂速度快,求解精度低;在算法的過渡階段,慣性權重ω隨著迭代次數的增加,逐漸減小,表明粒子向全局最優區域靠近,空間距離越近,ω越小;在算法后期,慣性權重值ω減小,速度變緩,在0.2~0.3趨于一個較小的穩定值。此時算法全局搜索能力弱,收斂速度變慢,局部搜索能力強,利于算法跳出局部最優而求得全局最優。圖8為自適應粒子群算法映射結果適應度變化過程,以功耗值為適應度,適應度越小,映射結果越好。可以看到,自適應粒子群算法映射結果適應度值收斂速度快,下降趨勢明顯,在較小的迭代次數里就能找到最優映射,算法性能較好。圖9是自適應粒子群算法運算過程中遷移評價函數R的變化過程。對比圖8和圖9可以發現,適應度和R變化保持一致,R越小映射結果越好,任務節點在NoC映射平臺上布局越合理,這也證明了R作為任務節點遷移評價函數的有效性。

圖7 自適應粒子群算法慣性權重ω的變化過程

圖8 自適應粒子群算法映射結果適應度的變化過程

圖9 遷移評價函數R的變化過程
定義θ為各算法映射結果占隨機映射結果比例。圖10為上述4種算法在功耗值、映射面積和鏈路負載方差的仿真結果,其中DSMA、NN算法的映射結果是根據原文獻算法的描述,在同一實驗環境下自行建模獲取的。

圖10 4種算法仿真結果對比
(1)功耗代價。NN和DMA算法在映射策略中允許通信量大且連接的任務節點能夠集簇并映射到同一個資源節點上。在NoC映射平臺上運行的時候,同一個簇內的任務節點通信不需要通過交換開關和資源節點之間物理鏈路,大大減小了任務運行時消耗的功耗,故功耗下降優勢比較明顯。DMA算法相對于NN算法,更深層次地考慮了無通信關系任務節點之間的集簇可能,構建R評價函數,擴大了任務節點集簇范圍,且自適應粒子群算法尋優效果較好,進一步減小了通信功耗。相對于隨機映射、DSMA和NN映射算法,本文DMA算法映射后通信功耗下降了73.93%、46.37%和14.55%,本文DMA算法在功耗代價上優勢明顯。
(2)面積代價。DSMA采用一一對應的映射關系,相同的任務圖運行比NN、DMA算法需要更多的資源節點。集簇策略使得單個資源節點利用率提高,減小了資源節點的需求量。相對于Random、DSMA和NN映射算法,DMA算法映射后資源節點需求量減少了50%、50%和33.3%。
(3)鏈路負載方差。DSMA、NN和DMA算法鏈路負載方差明顯小于隨機映射,其中NN鏈路負載方差最小。NN映射策略減小了通信量大且相連的任務節點對物理鏈路的需求量,集簇的任務節點不需要物理鏈路為載體來傳遞數據信息,直接在資源節點中進行了交互和處理。DMA算法利用R評價函數將無連接關系的任務節點映射到同一個資源節點上,增大了某條物理鏈路上通信負載。相對于集簇之前的鏈路負載方差,集簇之后鏈路負載方差可能會增大或減小。DMA與NN算法相比,MPEG-4鏈路負載方差提升了6.93%。由上文假設可知,物理鏈路帶寬滿足簇與簇之間的通信需求,物理鏈路負載的增加不會造成物理鏈路競爭堵塞。
針對現存映射算法大都是基于一一對應的靜態映射,無法根據資源節點利用情況而對映射關系進行動態的調整,本文提出了一種基于集簇的NoC動態映射算法——DMA,完成了任務圖與NoC映射平臺資源節點新型映射關系的設計,減小了NoC映射面積需求和通信功耗輸出,優化了硬件資源配置。本文算法利用分枝界定算法完成通信量大且相連任務節點的集簇,接著利用自適應粒子群算法完成最優映射結果的獲取,最后利用動態遷移策略完成最優映射結果中單獨占用資源節點的任務節點的集簇。與隨機映射、DSMA和NN算法相比,DMA算法雖然在鏈路負載方差考量上稍有欠缺,但是在功耗和NoC面積占用率上都有較大的提升。綜合考慮來看,DMA算法的優化優勢明顯,為NoC映射高性能實現提供了新的數學模型和努力方向。
[1] BENINI L, MICHELI G D. Networks on chips: a new SoC paradigm [J]. IEEE Transactions on Computer, 2002, 35(1): 70-78.
[2] KUMAR S, JANTSCH A, SOININEN J P, et al. A network on chip architecture and design methodology [C]∥Proceedings of IEEE Computer Society Annual Symposium on VLSI. Los Alamitos, CA, USA: IEEE Computer Society, 2002: 117-124.
[3] BJERREGAARD T, MAHADEVAN S. A survey of research and practices of network-on-chip [J]. ACM Computing Surveys, 2006, 38(1): 1-51.
[4] 楊盛光, 李麗, 高明倫, 等. 面向能耗和延時的NoC映射方法 [J]. 電子學報, 2008, 36(5): 937-942. YANG Shengguang, LI Li, GAO Minglun, et al. An energy- and delay-aware mapping method of NoC [J]. Acta Electronica Sinica, 2008, 36(5): 937-942.
[5] 白海. 片上網絡映射算法研究和設計 [D]. 成都: 電子科技大學, 2009.
[6] MAQSOOD T, ALI S, MALIK S U R, et al. Dynamic task mapping for network-on-chip based systems [J]. Journal of Systems Architecture, 2015, 61(7): 293-306.
[7] 楊鵬飛, 王泉. 片上網絡異構多核系統任務調度與映射 [J]. 西安交通大學學報, 2015, 49(6): 72-76. YANG Pengfei, WANG Quan. An effective scheduling and mapping algorithm of tasks for heterogeneous NoC based MPSoC [J]. Journal of Xi’an Jiaotong University, 2015, 49(6): 72-76.
[8] MEHRAN A, KHADEMZADEH A, SAEIDI S. DSM: a heuristic dynamic spiral mapping algorithm for network on chip [J]. IEICE Electronics Express, 2008, 5(13): 464-471.
[9] CARVALHO E, CALAZANS N, MORAES F. Heuristics for dynamic task mapping in NoC-based heterogeneous MPSoCs [C]∥Proceedings of 18th IEEE/IFIP International Workshop on Rapid System Prototyping. Piscataway, NJ, SUA: IEEE, 2007: 34-40.
[10]SINGH A K, SRIKANTHAN T, KUMAR A, et al. Communication-aware heuristics for run-time task mapping on NoC-based MPSoC platforms [J]. Journal of Systems Architecture, 2010, 56(7): 242-255.
[11]FALAHATI H, KOOHI S, HESSABI S. Application-based dynamic reconfiguration in optical network-on-chip [J]. Computers & Electrical Engineering, 2015, 45: 417-429.
[12]CARVALHO E, CALAZANS N, MORAES F. Dynamic task mapping for MPSoCs [J]. IEEE Design and Test of Computers, 2010, 27(5): 26-35.
[13]YE T T, MICHELI G D, BENINI L. Analysis of power consumption on switch fabrics in network routers [C]∥Proceedings of the 39th Annual Design Automation Conference. Piscataway, NJ, USA: IEEE, 2002: 524-529.
[14]HU J, MARCULESCU R. Energy- and performance-aware mapping for regular NoC architectures [J]. IEEE Transactions on Computer-Aided Design of Integrated Circuits and Systems, 2005, 24(4): 551-562.
[15]BETHART R, KENNEDY J. A new optimizer using particle swarm theory [C]∥Proceeding of the 6th International Symposium on Micro Machine and Human Science. Piscataway, NJ, USA: IEEE, 1995: 39-43.
[本刊相關文獻鏈接]
馬亞燕,王保云.采用博弈論的認知無線網絡主用戶和不可信任次用戶的協作策略.2016,50(2):61-67.[doi:10.7652/xjtuxb201602011]
楊鵬飛,王泉.片上網絡異構多核系統任務調度與映射.2015,49(6):72-76.[doi:10.7652/xjtuxb201506012]
任向隆,安建峰,高德遠,等.低功耗片上網絡映射的遺傳及螞蟻融合算法.2012,46(8):65-70.[doi:10.7652/xjtuxb 201208012]
唐軼軒,吳俊敏,陳國良,等.并行片上網絡仿真器ParaNSim的設計及性能分析.2012,46(2):24-30.[doi:10.7652/xjtuxb201202005]
張瑤,張鴻,李梁,等.時鐘數據恢復電路中的線性相位插值器.2016,50(2):48-54.[doi:10.7652/xjtuxb201602009]
張尚偉,曾平,羅雪梅,等.具有細節補償和色彩恢復的多尺度Retinex色調映射算法.2012,46(4):32-37.[doi:10.7652/xjtuxb201204006]
魏倩,蔡遠利.一種基于神經網絡的中制導改進算法.2016,50(7):125-130.[doi:10.7652/xjtuxb201607019]
姜濤,黃偉,王安麟.多路閥閥芯節流槽拓撲結構組合的神經網絡模型.2016,50(6):36-41.[doi:10.7652/xjtuxb201606 006]
孫立遠,周亞東,管曉宏.利用信息傳播特性的中文網絡新詞發現方法.2015,49(12):59-64.[doi:10.7652/xjtuxb201512 010]
王安麟,孟慶華,曹巖,等.液力變矩器的葉片數神經網絡模型.2015,49(7):11-16.[doi:10.7652/xjtuxb201507003]
王麗霞,曲樺,趙季紅,等.軟件定義網絡中應用二值粒子群優化的控制器部署策略.2015,49(6):67-71.[doi:10.7652/xjtuxb201506011]
吳杰,馮祖仁,劉恒,等.水下目標多元聲傳感陣列網絡定位方法.2015,49(4):40-45.[doi:10.7652/xjtuxb201504007]
孟憲佳,馬建峰,王一川,等.面向社交網絡中多背景的信任評估模型.2015,49(4):73-77.[doi:10.7652/xjtuxb201504 012]
董恩清,劉偉,宋洋.采用三角形節點塊處理無線傳感器網絡節點定位中節點翻轉歧義的迭代方法2015,49(4):84-90.[doi:10.7652/xjtuxb201504014]
李季碧,鄧科,任智,等.機會網絡中高效低時延多擺渡節點路由算法.2015,49(4):91-97.[doi:10.7652/xjtuxb201504 015]
李劉強,桂小林,安健,等.采用模糊層次聚類的社會網絡重疊社區檢測算法.2015,49(2):6-13.[doi:10.7652/xjtuxb 201502002]
李季碧,李賓,任智,等.自適應動態功率控制的機會網絡節能高效路由算法.2014,48(12):49-56.[doi:10.7652/xjtuxb 201412008]
(編輯 劉楊)
A Dynamic Mapping Algorithm for Network-on-Chip Based on Cluster
DAI Qihua,LIU Qinrang,SHEN Jianliang,SUN Miao,WU Fengyang
(China National Digital Switching System Engineering & Technological R&D Center, Zhengzhou 450002, China)
A dynamic mapping algorithm (DMA) for network-on-chip (NoC) based on cluster is proposed to solve the problems that the traditional one-to-one mapping relationship causes low utilization ratio of resource nodes and high communication power. Firstly, connected task nodes with high traffic load are clustered using a branch-and-bound approach to reduce the total communication volume of task graphs. Then an adaptive particle swarm algorithm is used to obtain the optimal mapping results. Finally, the dynamic migration strategy is used to cluster the task nodes that occupy an individual resource node in the optimal mapping results. Experimental results and comparisons with the random mapping, the dynamic spiral mapping algorithm (DSMA) and the nearest neighbor (NN) algorithm show that the proposed algorithm respectively reduces the communication power of the task graph by about 73.93%, 46.37% and 14.55%, and the occupancy rate of the NoC area by about 50%, 50% and 33.3%.
network-on-chip; dynamic mapping; particle swarm algorithm; dynamic migration; cluster
10.7652/xjtuxb201608009
2015-12-18。 作者簡介:戴啟華(1990—),男,碩士生;劉勤讓(通信作者),男,研究員。 基金項目:國家自然科學基金資助項目(61572520)。
時間:2016-05-17
http:∥www.cnki.net/kcms/detail/61.1069.T.20160517.1725.004.html
TN409
A
0253-987X(2016)08-0052-07