謝列琴
近日,英特爾宣布推出面向筆記本電腦的英特爾銳炫A獨立顯卡系列。這是英特爾銳炫A系列顯卡產品組合中率先發布的獨立顯卡。所有搭載英特爾銳炫A系列獨立顯卡的產品均基于英特爾全新Xe HPG微架構而打造,專為游戲玩家和內容創作者量身設計。此外,英特爾公司也表示將于今年發布面向臺式機和工作站的產品。
此次推出的英特爾銳炫A系列獨立顯卡將應用于廣泛的移動設備中,其中多款搭載銳炫3系列顯卡的首批機型還將通過英特爾Evo平臺認證,并采用英特爾最新第12代酷睿處理器,包括針對超薄本設計的A350M以及為兼顧性能和輕薄而設計的A370M,同時還兼具WiFi 6、即時響應和超長續航等特性。
英特爾公司副總裁兼顯卡與游戲團隊總經理Roger Chandler表示:“數十年來,英特爾一直致力于推動PC平臺的創新。通過推出歷代CPU處理器,我們為全球數十億用戶提供了強大的計算能力。我們通過USB、Thunderbolt和WiFi等特性不斷推動連接技術的演進,并與PC生態系統合作開發突破性的PCI架構、推出英特爾Evo平臺,不斷拓展移動設備的更多可能性。英特爾在推動PC平臺創新方面擁有得天獨厚的優勢,旨在滿足全球商用用戶、消費者、游戲玩家和內容創作者對于算力日益增長的需求。”
據英特爾表示,此次推出的英特爾銳炫3系列獨立顯卡能夠提供1 080 p主流游戲和內容創作體驗。在運行多款熱門游戲時,搭載銳炫A370M的筆記本電腦可以提供1 080 p 60 fps以上的畫質。英特爾銳炫5系列和銳炫7系列均可提供領先的內容創建性能,以及更強大的圖形與計算性能。與銳炫3系列相比,銳炫5系列和銳炫7系列內置更多Xe內核、更多光線追蹤單元和更高GDDR6顯存。
據悉,首款搭載英特爾銳炫3系列獨顯的筆記本電腦———三星Galaxy Book2 Pro已于海外市場上市,搭載銳炫5和銳炫7系列顯卡的筆記本以及面向臺式機的英特爾銳炫A系列顯卡的產品,預計在2022年夏天上市。
基于Xe HPG微架構設計
搭載英特爾銳炫A系列獨立顯卡的產品均基于英特爾全新Xe HPG微架構而打造,提供了出色的性能、能效和可擴展性。Xe HPG微架構包括了強大的AI引擎和支持下一代編解碼器標準的增強媒體引擎。除此以外,還有下一代Xe顯示引擎和新的圖形管線,用來處理各種不同的顯示任務。
在Xe HPG微架構里,每4個Xe內核組成了一個渲染切片(Rendering Slice)。每一個Xe內核中都配備了數量可觀的運算單元,比如矢量引擎XVE,矩陣引擎XMX。此外Xe HPG也集成了其他主流的圖形技術,比如網格著色,采樣器反饋等。Xe HPG架構最大的特點就是靈活性,通過疊加渲染切片來構建不同的SoC,最小兩個,最大八個。這樣的結構最主要的特點就是可擴展性很強,根據渲染切片數量的不同,可以打造更豐富的產品線,為用戶提供更多選擇。
與上一代的Xe LP微架構相比,Xe HPG微架構的每瓦性能提升了1.5倍。此外,渲染切片還支持DX12 Ultimate,其中包括對所有圖形固定功能塊的改進,當然還有支持微軟DXR和Vulkan RT的專用硬件光追單元。每個切片還配備了4個硬件光追加速器,用來支持實時的光線追蹤技術,能夠顯著提升3A大作的游戲畫面和光影效果。
Xe Core核心方面,現在Xe內核已經取代了此前集成顯卡架構中EU的概念,成為Xe HPG架構中最基礎的執行單元。它包括16個256位寬的SIMD矢量引擎,并為傳統圖形著色器執行大部分的運算。矢量引擎主要負責傳統圖像處理的計算任務。由于AI的算法核心幾乎完全圍繞著一系列大型的矩陣乘法和累加算法,在每個Xe內核中構建了專用的矩陣引擎,來進行硬件加速。Xe內核包含16個矩陣引擎,每個引擎都是1 024位寬。矩陣引擎就是為了加速AI運算用的。為了滿足矩陣、矢量和光線追蹤單元的高帶寬需求,在每個Xe內核中構建了一個192 KB的大型本地內存,它可以根據每個工作負載的需要在L1緩存和共享本地內存(SLM)之間動態分配。
其中矩陣引擎的一個主要應用是在實時渲染過程中使用AI。這一算法稱為XeSS,它是一種超級采樣技術,與傳統的高分辨率渲染相比,可在游戲中提供更高的性能。它使用神經網絡輔助運動矢量,從低分辨率渲染中生成精美的高分辨率圖像。英特爾還展示了14款支持XeSS技術的游戲,并表示未來將繼續深化與頂級游戲工作室的合作,以增加對這種強大并開放的AI超分技術得到廣泛的使用,為游戲玩家提供更好的游戲體驗。
2種不同的芯片設計
英特爾銳炫A系列獨立顯卡的芯片代號有2個———ACM-G10和ACM-G11。ACM-G10包含多達32個Xe內核和光追單元,16 MB的L2緩存,256位GDDR6接口,16路PCIE4接口;ACM-G11包含多達8個Xe內核和光追單元,4 MBL2緩存,96位顯存接口,8路PCIE4,2種芯片設計都包含2個Xe多功能編解碼引擎,和4路顯示輸出引擎。
在芯片設計中,頻率是必不可少的一個因素。但是,頻率的提升會要求電壓的升高,從而帶來功耗的增加。通過實時監控獨立顯卡的性能指標,例如功耗,溫度和使用率,并且動態調節時鐘頻率來與之適配。此外,在顯卡運行各種不同負載的時候,或者運行同一個負載但不同階段的時候,顯卡的占用率等指標是不一樣的,從而時鐘頻率會在一個范圍內動態調整,而且這個范圍的分布也是有規律的,在分布內,一些接近中部的頻率出現的概率會高一些。
考慮到這種分布的情況,在制定獨立顯卡參數配置的時候,先標定一個有代表性的負載,然后在這個負載運行的時候,全程測量并統計時鐘頻率的分布,最終在整個負載完成后,把平均時鐘頻率作為參數配置中的定義。當然,對于不同的平臺,有著不同的TDP,即基于散熱的設計功耗。更寬松的TDP限制下,時鐘頻率的分布范圍也會整體提升。
英特爾銳炫A系列移動端獨立顯卡
產品方面,英特爾銳炫A系列移動端獨立顯卡首發2款型號,包括針對超薄本設計的A350M以及為兼顧性能和輕薄而設計的A370M,搭載銳炫5和銳炫7系列的產品,會在2022年夏天面市。
A370M有8個Xe內核和光追單元,64 bit位寬,時鐘頻率1550,4 GB顯存,功耗設計在35~50 w。A550M的Xe內核數和顯存位寬等參數上,基本是A370M的2倍。銳炫7系列有A730M和A770M兩款產品,最高可達32Xe內核,16 GB內存,256 bit位寬。
英特爾銳炫A系列獨立顯卡均全面支持DirectX 12 Ultimate和領先的游戲技術,例如硬件加速的光線追蹤和Xe超級采樣(XeSS),XeSS將在今夏發布,并有望得到超過20款游戲的支持。為了讓業內更多軟件和硬件支持該技術,英特爾計劃面向所有人開放XeSS SDK和工具包。
性能
首先是與集顯對比,相對于第12代酷睿移動處理器搭載的集顯,最多可達兩倍的性能提升。同時這些游戲都能在1 080 p 60 fps運行,能給用戶不錯的體驗。
對比12代酷睿i7-1280P中集成的96個執行單元、1 450 MHz頻率的銳炬Xe核顯,綜合游戲性能高出一倍左右。
在運行包括《GTA V》、《堡壘之夜》等游戲時,A370M顯卡能在1 080 p下達到90幀/秒,而且這是在開了中等或者高畫質下測量的結果。
內容創作方面,相比第12代酷睿的集成顯卡,搭載A370M獨立顯卡的平臺在視頻編解碼方面,以Davinci為例,4K H.264轉H.265的性能可多達60 %的提升。而在AI相關功能上,例如Adobe PR里的兩個應用場景,更是有翻倍的性能提升。

值得注意的是,性能的提升并不僅來自于獨立顯卡,同樣得益于基于整個系統的Deep Link技術的加持。Deep Link涵蓋了不同的技術,例如:動態功率共享,超級編碼和超級算力。
首先是動態功率共享,該技術能在系統功耗的限制范圍內,盡可能最大化釋放CPU或GPU的性能。所有搭載英特爾12代酷睿和銳炫的筆記本電腦,都能啟用這項技術。
第二個是超級編碼技術。在之前的編解碼流程里,通常把編碼工作放在一個顯卡的編解碼器上,編碼效率成為了整個流程的性能瓶頸;而現在的筆記本系統,例如搭載了12代酷睿處理器和銳炫A系列獨立顯卡的系統,集成顯卡和獨立顯卡都有硬件編碼能力。所以超級編碼技術,就是同時運用2個顯卡的編解碼引擎,來大大提升編解碼效率。這種協作是通過OneVPL(一個跨平臺的開放性框架)的API接口來實現的。當超級編碼開始工作時,一組組解碼后的原始幀通過特定的API函數被交給oneVPL,進而按組被分配到不同的多媒體引擎上,拷貝到相應的內存中緩存起來。不論每一組有多少幀,相應的集顯或者獨顯的多媒體引擎會開始按照設定的格式編碼。而OneVPL會完成后續的打包工作,把編碼后的幀一組組拼接成最終視頻來輸出。這種并行處理,編碼效率比單一顯卡提升非常顯著。
三是超級算力。每一個搭載英特爾銳炫獨立顯卡的筆記本,都可以從獨立顯卡的算力中獲益,但是不要忘記,英特爾CPU的集成顯卡中同樣也提供了計算引擎。為了把負載合理的分配給不同的計算引擎,就設計一個基于機器學習的服務———MLS。
MLS是OpenVino中的一個框架,把負載分配給不同的算力模塊。根據當前應用或負載的特征,例如延遲敏感度、吞吐量、性能要求、功率消耗等等。這些因素幫助MLS做出決策,把負載分配給獨立顯卡,集成顯卡,或者CPU。
舉個例子,當想對一段視頻做處理,例如去噪點、超分、銳化等,導入畫面會逐幀傳遞給MLS框架,每一幀還會拆成若干塊,這些塊排在工作隊列里,MLS啟動一個個工作線程,把這些塊根據需求自動分配到不同的算力模塊中,一部分分配到集顯的計算引擎,一部分分配到獨顯的矩陣引擎。隨著顯卡完成當前任務,MLS會不斷派發新的任務,直到最后完成所有塊的處理,打包這些增強后的畫面作為輸出。
正是因為全新Deep Link技術的加持,在內容創作上,動態功率共享、超級編碼、超級算力可以分別帶來最多30%,60%,24%的性能提升。
Xe媒體引擎:提供最廣泛的編/解碼器首發支持AV1
媒體引擎方面,提供了對H.265 / HEVC、H.264 / MPEG-4/ AVC、VP9的支持,以及業界首個對AV1編碼和解碼的硬件加速支持。
開放媒體聯盟主席Matt Frost先生指出,AV1的效率比最常見的編解碼器H.264高了50 %,比HEVC高了20 %,能夠以更低的帶寬和更小的文件大小提供更高的畫面質量,而且它是開放的且沒有版權費。目前,FFMPEG、Handbrake、Adobe和XSplit都已經集成了對銳炫AV1的支持。
Xe顯示引擎:加入全新Smooth(平滑同步)Sync
在顯示方面,Xe已經支持HDMI 2.0b和DP1.4a的規格,游戲玩家可以享受高達1080p360Hz、或者4臺具有4k120Hz HDR的顯示器連接。
在同步技術方面,英特爾支持VESA標準的Adaptive Sync,可提供流暢的游戲而不會撕裂。此外還有Speed Sync可以適用于任何顯示器并解決不同的問題。
此次全新推出的Smooth Sync技術,運用了模糊化2個撕裂幀之間的邊界,來減少視覺失真,使圖像看起來更加連貫。之后所有銳炫顯卡都會支持Smooth Sync功能。
產品上市與相關生態
無疑問,得益于Evo平臺更快的處理器速度、超長的續航時間、輕薄便攜時尚的外觀設計,很多OEM都將優先推出銳炫配置在Evo設計上,在英特爾銳炫顯卡的加持下,將讓游戲和內容創作在Evo平臺上有更好的使用體驗。據英特爾介紹,從第二季度開始,采用銳炫3系列的筆記本產品有望國內面市,銳炫5和銳炫7系列的產品有望在今年夏天發布。
在此次英特爾銳炫A系列獨立顯卡的解析會上,英特爾還發布了新的顯卡控制界面———Arc Control英特爾銳炫控制面板。
Arc Control提供了一站式與銳炫顯卡相關的設定或者信息接收,包括可以讓用戶快速升級驅動,及時看到顯卡性能的工作負載、虛擬攝像頭設定、自動生成游戲高光時刻、還有讓每個人都能成為像是專業主播一樣的軟件設定等。
目前,Arc Control控制面板已經可以下載。需要注意的是,Arc Control控制面板適用于所有英特爾顯卡,也因此不只有英特爾的獨立顯卡能用,英特爾的集成顯卡也能用。值得一提的是,Arc Control控制面板不需要登錄,這一功能大大提升了用戶體驗。
英特爾銳炫A系列移動端獨立顯卡的推出,首先是進一步完善了英特爾移動平臺,也為用戶和游戲玩家帶來更多一項選擇。隨著相關產品的上市,相信可以緩解目前“一卡難求”的市場局面。對于另外2家顯卡廠商,到底是挑戰,還是在競爭中創新、進步,那就敬請期待吧。