戴寅

在之前的測試中我們已經(jīng)對NVIDIAAdaLovelace架構(gòu)進行過全面的解析,這里簡單概括一下重要的技術(shù)亮點。
●NVIDIAAdaLovelace架構(gòu)中全新設(shè)計的流式多處理器具有最高83TFLOPS的著色能力,吞吐量超過上代產(chǎn)品2倍。
●第三代RTCores有效光線追蹤計算能力達到191TFLOPS,是上代產(chǎn)品的2.8倍。
●第四代TensorCores新增FP8引擎,具有高達1.32PFlops的張量處理性能,超過上代5倍。
●支持著色器執(zhí)行重排序(SER),通過即時重新安排著色器負(fù)載來提高執(zhí)行效率。SER可為光線追蹤帶來最高3倍的性能提升,整體游戲性能可最高提升25%。
●新增Ada光流加速器帶來2倍的性能提升,使DLSS3能夠預(yù)測場景中幀和幀之間的運動變化,讓神經(jīng)網(wǎng)絡(luò)能夠在保持圖像質(zhì)量的同時提高幀率。
●架構(gòu)進行大幅改進,采用TSMC4NNVIDIA定制工藝,此工藝專為GPU優(yōu)化,實現(xiàn)高達2倍的能效飛躍。
●12GB顯存及以上型號提供雙NVIDIA編碼器(NVENC),可最多縮短一半的視頻導(dǎo)出時間,并提供了對AV1的硬件編碼支持。

作為RTX40系列第三位登場的成員,從核心圖上可以看到,RTX4070Ti換上了規(guī)模更小一點的AD104核心。晶體管數(shù)量從AD103的459億個減少到了358億個,相較于完整的AD103,AD104精簡了一組完整的GPC和一組“不完整”的GPC,因此總共具備5組GPC。
RTX4070Ti擁有30組TPC,比RTX4080少了8組,CUDA核心從4080的9728個縮減到了7680個,綜合來看它擁有了RTX4080近8成的核心規(guī)模,理論性能定位其實也比較清晰了。此外,RTX4070Ti擁有80個光柵單元,雖說比RTX3070Ti少16個,但它還具備60個第三代光追單元和240個第四代張量單元,比RTX3070Ti多出不少。
RTX4070Ti同樣也采用TSMC4NNVIDIA定制工藝,GPU加速頻率可以達到2610MHz(公版),游戲加速頻率則更高。……