

NVIDIA召開專場發布會,發布了自家的第四代Tegra處理器,并且在CES展覽中展示了Tegra 4的具體開發機和實際產品。作為全球首款四核心A15架構的移動處理器,Tegra 4究竟有何過人之處呢?
Tegra是NVIDIA進入移動計算領域后推出的SoC(即System on a Chip,系統級芯片)芯片品牌。從為微軟設計的Tegra APX芯片開始,到首款雙核心Cortex- A9架構的Tegra 2,再到首款四核心Cortex- A9的Tegra 3,Tegra從無到有,發展得非常迅速。不過之前的Tegra處理器存在一些軟肋,比如功耗表現不夠理想、GPU性能較弱等等,但總體而言,它也算得上是ARM架構處理器中的一員悍將。而在全新的Tegra 4上,NVIDIA則顯得更具信心。
強大的四核心A15處理器
目前市場上主流的處理器使用的是Cortex- A9架構處理器。典型的Cortex- A9架構每個核心配置了兩個解碼引擎,一個VFPv3浮點引擎和一個NEON多媒體指令引擎,整數單元方面則是兩個ALU單元、一個地址單元和一個乘法單元,緩存配置使用了32KB L1指令緩存和32KB L1追蹤緩存,以及1MB L2緩存。根據ARM官方說明,一個標準的Cortex- A9核心的性能大約是2.5DMPS/MHz。
而Cortex- A15架構就要強大很多了。根據ARM的數據,Cortex- A15在CPU理論性能上最高可以提升40%,達到3.5DMIPS/MHz。Cortex- A15解碼性能提升了33%,解碼單元增加到3個,浮點單元升級到全新的VFPv4,并且數量也增加到2個,大幅度提升了系統的浮點計算能力。此外,NENO引擎在Cortex- A15中也提升到2個,比Cortex-A9增加一倍,數據指令寬度也提升到128bit。諸多改進帶來了Cortex- A15強大的性能,在之前對雙核心Cortex- A15處理器的測試中,雙核Cortex- A15 ARM處理器性能相比移動平臺的X86 ARM核心性能不落下風甚至還有明顯勝出。
Tegra 4是首個配置了四顆Cortex- A15核心的處理器,從參數來看,也肯定是目前最強大的ARM移動處理器。并且在其他的參數上依舊維持高水準。比如工藝方面采用了TSMC的28nm HPL工藝,兼顧高性能和低功耗;Tegra 4的芯片核心面積也被成功控制在80mm2左右,并沒有由于晶體管增加而帶來特別明顯的面積增長;在頻率方面,四個核心頻率最高可達1.9GHz,雖然和ARM當初預計的2.0~2.5GHz相比還略有差距,但相差不遠,在工藝進一步調整后還有希望在頻率上更進一步;在內存支持方面,Tegra 4內存支持雙通道LPDDR3、DDR3L或LPDDR2,使得數據帶寬不再成為瓶頸,分辨率支持也進一步提升到超清晰的4K規格。
總的來看,Tegra 4的CPU部分物理規格是非常強大的,只要功耗控制得當,Tegra 4就可以毫無疑問的成為移動平臺的最強音。
第二代4 plus 1節能架構
在Tegra 3上,NVIDIA就采用了伴核來實現高性能和低功耗,并將這個技術命名為“4 plus 1”。由于使用情況不錯,節能也比較明顯,因此在Tegra 4上,NVIDIA進一步將這個技術發揚光大。
在Tegra 4的內部,除了傳統的4核心外,還有一顆隱藏的節能核心。這顆節能核心依舊采用Cortex-A15架構,但是頻率最高只有800MHz,電壓和功耗都低很多。這第五個核心是隱藏起來的,基于硬件工作,不受軟件系統的控制。當系統處于低性能要求時,Tegra 4會優先使用伴核進行處理,功耗也會大幅度降低,電池壽命也會得到保證。一旦計算任務加重,Tegra 4就會停止伴核而開啟原生核心,并且會根據應用對硬件的需要,來自動調整、切換一個、兩個或者三個、四個核心。在工作任務完成后,空閑核心會迅速降低電壓和功耗,進入休眠狀態。如果系統性能需求進一步降低,那么四個核心都會被關閉而啟用伴核。在系統進入待機或者休眠狀態時,伴核也會進入休眠狀態,最大限度節約電能消耗。
NVIDIA還在Tegra 4上采用了一些新的節能技術,比如電源管理更為嚴格、敏銳,切換時間縮短等。在所有節能技術的努力下,Tegra 4的功耗終于被控制在非常恰當的范圍內。雖然目前NVIDIA沒有公布Tegra 4的具體功耗情況,但是根據NVIDIA發布的“Project Shield”來估計,Tegra 4的最高滿載功耗大約在5W左右,平常使用時還會進一步大幅度降低。對于一顆高性能ARM處理器來說,這樣的功耗表現是足夠令人滿意的了。
72個處理單元 集顯再提速
在之前的Tegra 2和Tegra 3上,NVIDIA設計的GeForce ULP集成顯卡無論理論性能還是實際表現都不是很令人滿意。因此在Tegra 4上,NVIDIA決定進一步提升Tegra 4繼承的GeForce ULP的實力。
根據NVIDIA的數據,Tegra 4的GPU部分擁有72個處理單元,其中24個是頂點處理單元,48個像素處理單元,另外還配有一定數量的紋理單元。在軟件方面,NVIDIA沒有說明Tegra 4的GPU是否支持OpenGL ES 3.0,很可能支持比較老的OpenGL ES 2.0,但是NVIDIA已經說明Tegra 4的GPU可以執行諸如MSAA、幀緩沖壓縮、百分比漸進過濾以及24-bit Z/Stencil ROP等全新功能,因此其功能性還是有保障的。硬件方面,相比上代Tegra 3的4個頂點單元、8個像素單元的設計而言,Tegra 4的規模擴大了6倍之多。就算Tegra 4的GPU部分頻率維持Tegra 3的520MHz不變,GPU理論計算能力也達到了75GFlops左右,超過了蘋果A6X的71GFlops的水平,堪稱目前理論性能最強的移動處理器。
不過由于功耗控制等因素的考慮,NVIDIA沒有在Tegra 4上使用傳說中源自開普勒架構的統一渲染流處理器設計,而是繼續維持了技術基礎源自NV40系列的分離式渲染架構,并且在像素處理管線部分作了大幅度的弱化。從目前的晶體管制造工藝來看,全功能、高性能的統一渲染管線設計還不太現實,目前PowerVR和Adreno 320雖然支持統一渲染架構,但是整體設計都比較簡單,架構設計上也盡可能考慮了移動設備對功耗的嚴格限制。
因此,即使目前Tegra 4的GPU部分使用了分離式渲染架構,玩家也完全沒有必要擔心。對于一個理論性能和GeForce G210相當的移動GPU,重點關注游戲優化情況反而更重要一些。因此NVIDIA才重點在游戲環境和游戲工具上下了大力氣,Tegra Zone和“Project Shield”就是NVIDIA這一次發布的又一個亮點。
Project Shield 閃亮登場
發布Tegra 4的同時,NVIDIA還發布了一款以Tegra 4為處理器,5英寸720p分辨率屏幕,原生Android操作系統,并配有游戲按鍵設計的全新設備——研發代號為“Project Shield”的掌上游戲設備。
“Project Shield”除了能運行目前所有的Android游戲外,還能配合NVIDIA長期以來打造的Tegra Zone,推廣自己專門為Tegra處理器優化的THD游戲。相比普通游戲而言,THD游戲在維持游戲內容的情況下,圖形更為精美,畫面特效更豐富,甚至部分THD游戲有特殊關卡存在,進一步增強了游戲的娛樂性和可玩性。
當然,“Project Shield”如果只能玩安卓游戲,那就和普通手機平板沒什么差別了。實際上“Project Shield”還有一個重要功能就是配合PC上的NVIDIA GFE功能,利用Wi-Fi將PC上的游戲經過PC渲染后實時傳輸到“Project Shield”上來,讓用戶可以在家中任何地方都無拘無束的享受移動娛樂的快感。“Project Shield”不僅僅支持單人游戲,還能和好友一起支持多人對戰。當然,除了“Project Shield”外,未來也將有更多的平板電腦和智能手機產品采用最新的Tegra 4。
新時代 新起點
NVIDIA在移動計算大潮中可謂布局已久。從第一代Tegra與微軟合作開始,NVIDIA就一直試圖在移動計算市場中分一杯羹。在經歷了Tegra 2的風光后,后繼的Tegra 3處理器雖然作為全球首款四核心產品吸引了不少眼球,但較弱的規格和40nm制程令其失色不少。現在NVIDIA終于再一次把握住了先機,搶先發布了Tegra 4和“Project Shield”,希望以強大的硬件規格和更為多樣化的娛樂方式進一步拓展移動計算市場,奪取更多份額。Tegra4對NVIDIA來說是一個新起點,對移動計算來說,或許是一個新時代的開端的標志吧!