
仰仗經驗,對產品優劣進行判斷的用戶往往對不斷推陳出新的產品形態和應用后知后覺,以表面規格判斷形勢,但這些簡單的參數對比并不能體現出產品的最終價值。CHIP在面對APU以及SoC變化時對平臺性能測試方案調整持謹慎的態度,因為僅憑現有經驗,倉促地給出一款新目標定位的產品“好”或“差”的評價太過草率。
新前景
當x86面臨ARM強力挑戰之時,x86內部的兩大廠商AMD和英特爾的競爭也仍未停止。雖然在很長的一段時間里,英特爾憑借有節奏地推出新產品和領先的制程工藝,壓得AMD喘不過氣來。但是堅持了數年之后,AMD堅持投入的全新APU概念,逐步從去年第一代的花開花落,走向第二代Trinity產品的瓜熟蒂落,不僅讓融合的概念從簡單的CPU+GPU走向成熟的統一加速,還解決了困擾PC架構30余年的Process(處理器)和Coprocessor(協處理器)協同工作、合并計算的問題,這就是前景更加誘人的異構計算架構(Heterogeneous Computing Architecture,HCA)。
由于指令集及軟件編譯架構的限制,初期的x86系統支持多個不同類型處理單元的機制并不完善,只能依賴CPU在進程執行前,一次性分配任務和資源給不同的協處理器,以實現協同工作。這就意味著CPU的分配機制要非常完善,即便如此,也難以避免將某些特殊計算任務分配給不擅長于此的協處理器。理論上,CPU在ALU(數邏運算單元)的基礎上,陸續增加FPU(浮點處理單元)、GPU(圖形處理單元)和APU(音頻處理單元)等組件后,它們在CPU的分配下,能各自進行著最擅長的工作。但是隨著計算復雜度的加深,多個協處理器之間的工作協調與再分配以及多個同功能協處理器的任務平衡的矛盾逐步顯露,于是就出現了“計算時CPU累死、GPU閑著”以及“游戲時GPU累死、CPU閑著”的現象。
借助HCA,新一代APU內的各個處理器特性對等,相互之間可以自我協商并協調工作;同時,各處理器在執行任務時也非常容易相互交付,這種交付是動態實時的,從而可以讓進程的每個環節跑在不同的最佳處理器上,實現最優的整體表現。
生態系統建立
在優化硬件結構設計的同時,AMD痛下決心提高軟件水平。軟件的優化,對提高硬件表現的作用至關重要,甚至超過硬件架構升級本身。在一直采用英特爾編譯器而被掣肘多年后,AMD借助HCA和OpenCL的開放性,終于完善了針對APU特性的編譯器,并且將老對手拖入了由其力推的OpenCL發展路線中。
特別是隨著Trinity推出,APU實現了直接C++編譯,這樣程序員不用再重新學習高難度的OpenCL編程方式,轉而采用他們再熟悉不過的C++代碼。支持C++可謂是APU的一大提升,不僅是在Windows下,在Linux、iOS/Mac OS亦或是Android中,主要的編程語言都是C++。C++編譯器的存在,意味著無窮無盡的應用,可以極為便利地被重新編譯為APU的優化版本,而且是跨平臺的,便于移植。
因此,在Trinity發布伊始,就有包括Adobe CS6在內的100多款重頭軟件宣布支持它也就不難理解了。隨著軟件生態系統的建立,APU的生存環境逐漸走向良性發展。
廣泛布局
在成功推出Trinity之前,AMD一直對其進入平板電腦市場以及推出ARM架構產品三緘其口。直至4月,在美國奧斯汀的Trinity Reviewers Day上,CEO羅瑞德(Rory Read)才正式透露了AMD已正式涉足以上兩個領域,其中Trinity集成了基于ARM的安全協處理單元,而基于APU架構的平板產品也初露端倪。
即便是在傳統的PC領域,Trinity的覆蓋范圍也較前代產品Llano增加了很多,最具代表性的例子莫過于主流性能的A系列產品推出mBGA(小型球柵)封裝的最低17W TDP的低功耗版本,從物理厚度到功耗,兩個維度的下降搶占了頗具商機的超薄筆記本電腦市場,即Ultrathin產品類別。
考慮到移動市場產品更新的迫切性,AMD首先推出了新款移動版APU,包括了旗艦級的A系列和入門級的E系列。其中首發包括A10-4600M、A8-4500M和A6-4400M等3款標準功耗產品,而低功耗的A10-4655M和A6-4455M面向更輕薄的產品并保持主流性能。值得一提的是,A10-4655M的TDP僅為25W,它是唯一一款面向超薄筆記本電腦的四核處理器,內置的圖形核心級別也較高,這令超薄筆記本電腦在輕薄的同時能保持性能競爭能力。
在Trinity APU之后,AMD將于10月前后推出代號為Vishera的APU/CPU,歸屬FX系列,主打高性能領域。其中FX-6300、FX-4320 TDP約為95W,而頂級的八核FX-8350采用了16MB的緩存,頻率高達4.0GHz,TDP為125W左右。
再接再厲
“集顯”、“獨顯”和“雙顯”是APU帶來的超靈活圖形顯示解決方案,其命名方式在前代APU上就已令人頭暈腦脹,而新的Trinity并未做出改變,繼續延續了這一特征。
在最頂級的A10-4600M平臺測試中,編號為Radeon HD 7660G的集成圖形核心表現十分彪悍。單從編號上來看,“7600”級別的GPU已經高過很多直接配備獨立顯示卡的筆記本電腦,而與“7600”級別的獨立顯示卡“交火”后,其編號更升至“7700”級別,儼然稱為高圖形性能的產品,實際測試表現也印證了這一點。
AMD在GPU領域中的成功有目共睹,而放入APU中的GPU型號更是擁有絕佳性價比的產品。Trinity的圖形部分并未經過大幅革新,而是像獨立顯示卡HD 7000升級至HD 6000一樣,僅僅在制程和個別規格上略有提升,Trinity著重提升的是處理單元的性能。即便如此,一年前的Llano A8-3500M中的
HD 6620G也足夠與英特爾最新的Ivy Bridge集成的HD 4000打個平手,而經過簡單升級的HD 7660G,更可在主流3D應用中再提升30%~200%,性能直指中檔獨立顯示卡。這樣的表現完全可以讓用戶打消對APU圖形能力的顧慮,而且在使用集成核心與獨立顯示核心混合交火的方案后,整體圖形性能還會有更大幅度的提升。考慮到目前3D應用的片面性,未來APU的HCA優勢若得以發揮,更是前途廣闊,而且越小的設備這一現象越為明顯,這足以成為英特爾SoC的勁敵。
除了依舊的出色圖形性能,Trinity著力提升的計算性能方面也碩果累累。同為頂級,同為四核,A10-4600M與Core i7-3720QM互有勝負,隨著測試負載的提高,兩者的差距逐漸縮小。而其功耗水平上的表現,更是令人興奮:在空閑模式下,A10平臺待機功耗僅為Core i7的一半,高CPU負載時為競品的80%,由此所反映出的是待機時間近1小時的差距。
針鋒相對
有了好的硬件架構和軟件的優化,我們對Trinity性能的疑慮已經打消,那么在日漸流行的輕薄產品領域,該產品表現又如何呢?
在Ultrabook產品上,為了提高用戶體驗,英特爾加入了快速啟動、超長待機等特性,AMD也推出了類似的技術,并推廣到整個APU產品線,其中包括應用多年的AllDay全天運行、Start Now(快啟)、Turbo Core自動超頻等技術。
針鋒相對的技術,加上針鋒相對的市場,Trinity所要迎接的挑戰也是巨大的。考慮到錯位競爭的需求,即便是最高端的A10也沒有瞄準Core i7這樣的旗艦產品,而是直接面向Core i5的市場,以圖形的優勢、四核的規格、OpenCL的全面支持挑戰市場的主流產品。