





写在开头
就在1星期前,大众已然见识过GeForce RTX 50系显卡的顶级旗舰RTX 5090/RTX 5090 D的表现,卡皇一出场,每项都是王炸级别!性能再度刷新记录!同期还换装了全新服务器级别的Blackwell架构,TSMC N4工艺打造,还有DLSS 4、Reflex 2等许多黑科技集于一身!各方面堪叫作极致,给极客玩家带来极致的体验,不外价格方面亦是极致的。那有无价格“亲民”一点的选取?

那就要看一样表率了旗舰级性能,但价格却要便宜不少的次旗舰制品GeForce RTX 5080了。不知极致的性能表现,加上相对亲民有些价格,会不会让你更加心动?这次咱们在第1时间上手GeForce RTX 5080 Founders Edition。因为众所周知的原由,国内无RTX 5090显卡,因此呢咱们在首发RTX 5090时仅有AIC厂商的RTX 5090 D,而公版FE的设计始终可望而不可即,不外这次不同样了,下面就给大众带来这款公版显卡的全世界首测!
规格介绍
起始前,按例讲讲新显卡的规格。GeForce RTX 50系显卡采用了此前NVIDIA在AI行业推出的Blackwell架构,以大卫·布莱克威尔命名,其是一名受人尊敬的数学家和统计学家,在博弈论和统计学行业留下了不可磨灭的贡献,NVIDIA用其名字命名这一架构反映了新平台的开创性和先进的计算能力。Blackwell能够说是NVIDIA近年来更新幅度最大的GPU架构了,相比起之前的架构来讲,划时代的引入了神经网络着色器,力图为游戏开创先进、有效更有逼真的渲染方式,带给玩家全新的游戏体验。

相比前代Ada架构,Blackwell的升级聚焦于四大方向:分别是AI算力的爆发、光线跟踪技术的革新、显存能效的提高以及划时代的神经网络渲染。
第五代Tensor Core
其中AI算力的爆发就不得不说到Blackwell架构上的第五代,新一代Tensor Core添加了对FP4浮点运算精度的支持。FP4是一种较低的量化办法,类似于文件压缩,能够减小模型推理过程中数据存储和计算量体积,加强计算效率,降低该过程对显存的需求。与大都数模型默认使用的FP16相比,FP4运用的显存不到其一半,并使GeForce RTX 50系列GPU的性能相比上一代提高高达2倍。


第四代RT核心
而光线跟踪技术的革新则仰赖于第四代RT核心的加持,相较于第三代RT核心来讲,Blackwell架构的第四代RT核心重点提高了检测光线、路径与三角形相交的效能,过往在检测时常常只能检测单个三角形,一旦场景繁杂,检测能力不足就容易引起渲染出错等问题,而此刻检测能够以簇集方式进行,检测效率更高。同期还有三角形簇集解压缩引擎加持,其新增了Linear-swept Spheres(LSS)功能,能够减少渲染毛发所需的几何图形数量,并运用球体代替三角形以得到更准确的毛发形状拟合,能够让显卡发挥更好的性能但只消耗较小的显存占用。

综合来看,Blackwell架构的光线跟踪多边形相交效率是上一代Ada架构的2倍,是Turing架构的8倍,同期还能够节省25%的显存运用率。

第四代RT核心的改进重点是为实现更好的光追效果。其中有两项新技术能够受益,第1项是RTX Mega Geometry技术。随着光线跟踪游戏场景的几何繁杂性持续增多,游戏画面中几何图形的计算量亦呈现出快速增长的趋势。而RTX Mega Geometry技术能够加速构建边界体积层次结构(BVH),使得在实时渲染中能够处理多达100倍的三角形数量。
该技术的显现,亦使得研发者能够在游戏场景中运用更繁杂的几何图形,而不会影响游戏帧率。过去需要一个个算BVH,此刻RTX Mega Geometry能够智能地在GPU上批量更新三角形簇,减少了CPU的包袱,既保准了性能,亦兼顾了图像质量。相信随着这些技术的持续发展和应用,将来的游戏将能够呈现出更加逼真和细腻的视觉效果,同期保持有效的性能表现。

另一一个能够受益的技术则是Curve Primitive,方便光追在曲面中的应用,例如一位男士的头发可能需要多达400万个三角形,再加上光线跟踪技术,画面所需要的运算负载极重。NVIDIA则经过第四代RT核心中的Linear- Swept Spheres(线性扫描球体)技术有效减少了渲染头发所需的几何体数量,以球形代替多边形,更贴合头发的形状,从而将内存占用量大幅缩减至三分之一,并进一步提高了实质帧数,让头发的渲染效果更加自然流畅。

GDDR7显存
第三点改变则是显存效率的提高,Blackwell架构中还首次加入了对GDDR7显存的支持,此前GDDR6显存的信号编码为NRZ/PAM2,而RTX 40系上的GDDR6X则是PAM4编码。最新的GDDR7显存,信号编码改成为了PAM3,NRZ/PAM2每周期供给1位的数据传输,PAM4每周期供给2位的数据传输,而PAM3每两个周期的数据传输为3位。说人话便是,新的编码机制能够使杂讯失真比减小,信号品质更清晰,同期还能带來更高的显存运行频率以及更低的电压,按照NVIDIA的介绍,运用GDDR7显存后,数据传输速率达到GDDR6时的2倍,并且功耗接近GDDR6的一半,经典加量还减价。

神经网络着色器
接着咱们再细说一下这一代架构最大变化,NVIDIA这次将Blackwell架构的SM单元直接叫作为神经网络着色器。相比较于之前的可编程着色、CUDA统一着色、通用计算着色来讲,其最大的变化便是引入了AI,AI将会彻底改变GPU的着色方式。

在Blackwell架构中,NVIDIA 进一步拓展了神经网络渲染的范畴,引入了许多创新元素,包含RTX神经网络纹理压缩(RTX Neural Texture Compression)、RTX神经网络材质(RTX Neural Materials)、神经网络体积(Neural Volumes)、神经网络辐射场(Neural Radiance Fields)以及RTX神经网络辐射缓存(RTX Neural Radiance Cache)等,这些元素一起构成为了神经网络渲染中神经网络着色的重要呈现方式。
这儿举个例子让大众能够更简单的理解神经网络渲染,过去繁杂的物品或海量异材质的贴图常常会占用相当大的内存空间,倘若叠加光追的话,计算量将会更大。然而,得益于神经网络渲染技术中的RTX神经网络材质功能,这一问题得到了明显改善。研发者能够先在离线渲染出物品的光照数据,而后再用这些数据训练一个小的AI模型,游戏运行时只要实时调用这个AI模型就地推理就好了,这般就能还原出想要的光照效果了,再协同RTX神经网络纹理压缩技术,就能明显降低实质生成的材质数据量,从而在占用更少表示内存的同期,实现了细节更丰富的材质表现,达到了实时生成如电影般细腻素材的效果。

日前神经网络渲染技术已然得到了微软的大力支持,将来亦将会加入到DirectX中,玩家能够体验到更真实的游戏世界。

而在硬件层面,因为神经网络渲染的加入,Blackwell架构的SM单元相较于RTX 40系的Ada架构还是有不小变化的,Ada架构内的SM内,SM单元会拆分成一半的CUDA核心专门用于处理FP 32(单精度浮点数),另一半则依需要动态调节去处理FP32和INT32(32位整数)。而在Blackwell架构上,SM单元则改成为了CUDA核心能够完全依需要动态处理FP32和INT32的形式。

另一一个改进是,过往的着色工作常常仅有SM单元的Shader在处理,而Blackwell架构上引入了神经网络渲染以后,使得Blackwell架构上的第五代Tensor Core亦能一起分担着色工作,大大加强了着色效率。

这般改进的好处是,Blackwell架构能够进一步针对神经网络渲染工作进行排序,即把传统的着色工作分配给Shader,而需要动用神经网络渲染的工作负载则能够给到Tensor Core上,两种核心同期运用,效率最高能够提高2倍之多。并且得益于Tensor Core亦加入了可编程渲染管线,此刻研发者或API亦能更好的调用Tensor Core,将来游戏内咱们能见到的AI技术势必越来越多。

先进的AI管理处理器
另外,AI的应用亦越来越多,不仅游戏中应用AI技术,此刻连可编程渲染的过程里亦引入了AI,因此呢怎样去分配显卡内部多样化工作就成为了一个问题。如过往显卡在开启DLSS玩游戏时,其中应用到的语言模型和游戏引擎需要同期与GPU的区别核心交互,生成游戏帧,然则常常很难做到每一帧都有一致的生成时间,也或是游戏AI对话的响应不足即时,这些状况都会导致游戏体验不友好。

而Blackwell架构为认识决这一问题,引入了AI管理处理器(AMP)。它能够实时调度资源,保证在神经网络渲染、帧生成和 AI 驱动的游戏交互中实现智能化的任务分配。这种设计不仅带来了更有效的性能输出,还让显卡在游戏渲染和 AI 运算之间实现了绝佳的平衡,保证帧的间隔均匀,对话类型的AI能够即时响应,玩家的游戏体验一致性能够比较好的保证。

GeForce RTX 5080规格
说了这么多,接下来给大众介绍一下GeForce RTX 5080的硬件规格,区别于老大哥采用的GB202核心。GeForce RTX 5080采用的是GB203,核心代号为GB203-400-A1。在架构上持有7个GPC,其中每一个GPC包括的TPC数量并不相同。因此呢GeForce RTX 5080上总共集成为了42个TPC,84个SM单元,336个TMUs纹理单元,112个ROPs光栅化处理单元,10752个CUDA核心。

在工艺制程方面,GB203核心沿用了TSMC 4nm 4N NVIDIA Custom Process工艺。核心面积为378mm2,内部晶体管数量则有456亿,在这么小的空间内堆下如此之多的晶体管,能够说是绝对工业艺术品的集大成之作了!早前看过咱们RTX 5090 D的玩家应该都晓得它的功耗达到了前所未有的575W,不外做为次旗舰的GeForce RTX 5080就保守有些了,仅比上代提高了40W,TDP设定为360W,玩家选购时配备一个850W的电源绝对是绰绰有余了。

除此之外,GeForce RTX 5080还配备了全新的GDDR7显存,显存等效频率达到32Gbps,同期16GB的大容量显存亦能为玩家供给高分辨率下的极致帧率,同期还能兼顾大部分AIGC用户的应用需要,多重黑科技加持下,高分辨率出图亦可更加有效。同期视频输出接口亦进行了升级,能够兼顾高分辨率与高刷新率,后续开箱显卡时咱们会仔细介绍。

最后一个变化则是售价了,上代RTX 4080的售价为9499元,近万元的售价还是让不少玩家望而却步的,而全新的GeForce RTX 5080售价直接来了一波“加量还降价”,国行仅售8299元!相当于在前代的售价上打了88折,这么一看,再结合一下新架构新技术,瞬间就有性价比了,而该显卡的详细上市时间则是1月30日,感兴趣的玩家不妨关注一下,下面咱们就给大众揭晓一下这张显卡的真面目。
外观赏析
在外包装上,GeForce RTX 5080 FE延续了过往RTX 40系的设计风格,全部外包装的箱子不仅在设计上有种“果味”,乃至在开箱上的有些细节亦做得非常到位。

除此之外,让我比较吃惊的是这次的GeForce RTX 5080的包装盒非常小巧,对比RTX 40系的话,完全便是瘦身成功。

拆开包装后,第1眼就能看到“Inspired by Gamers,Enhanced By AI,Built by NVIDIA“。认识是NVIDIA专为游戏玩家以及AI打造,同期在包装盒的另一边还专门写明了“GEFORCE RTX 5080“,辨识度拉满了。

继续拆开包装就能看到显卡被放在一个充满设计感的包装盒中。包装盒表面再度注明了“GEFORCE RTX 5080“字样。

显卡包装盒之下是说明书以及3×8Pin转16Pin的电源转接线,还没升级ATX3.0电源的玩家亦能第1时间用上GeForce RTX 50系显卡。

值得重视的是,这次搭配的这个电源转接线改为了极软的材质,同期外层还有绳套包裹,质感非常不错,接口内部更加是直接采用注塑处理,最大限度的避免接触不良而烧显卡的状况。

让咱们将视线回到显卡,内部包装盒无任何装饰性的图案,并且外边能够看出它是由于瓦楞纸板堆叠而成,主打一个环保。并且这个包装盒的形状神似显卡,这一点还是非常有意思的。

打开包装盒以后,显卡就安静的躺在其中,颇有种开箱奢侈品的感觉。

整张GeForce RTX 5080非常低调,设计语言延续了RTX 30系以及RTX 40系,正面是8字形的铝框,环绕着整张显卡,两边则是散热风扇,不外一改之前的前后双风扇设计,这回风扇全都安装在正面,气流可以直接吹透整张显卡。

再细看显卡,表面采用黑化处理,由阳极氧化工艺打造,与RTX 40系的比较接近,对比RTX 30系的话,颜色偏灰黑色有些,整体更加沉稳低调。并且正面无了RTX 40系的鳍片,而是改成为了金属遮罩,观感更佳。

其次,整张显卡最直观的变化便是厚度了,尤其是从这个方向看,非常显著。对比RTX 40系的大砖头,这一代的GeForce RTX 5080能够说是眉清目秀了许多,仅有双槽的厚度,完完全全是符合NVIDIA自家的SFF-Ready(适用于SFF小尺寸)标准尺寸,外观上已然与RTX 30系相当。

散热部分,GeForce RTX 5080采用的是「Double Flow Through」的散热器设计,按照NVDIA介绍,该设计能够更有效的将积热带离显卡,同期还能维持较低的风扇转速。

内部散热设计则是由于均热板+复合热管构成,能够明显提高导热性能。

另一,倘若你仔细看背部的散热鳍片的话,你还会发掘这两处的鳍片其实在造型上做了内凹的设计,在视觉效果上能够让整张显卡看起来更加纤薄。同期PCB的位置亦移到了散热器的中间,因此呢正面的双风扇才可吹透鳍片,快速带离热量,这个设计还是非常有创造性的。

风扇部分,查找得知其采用的是NIDEX直流无刷风扇,体积已然几乎快撑破全部导风罩了,不外大风扇能够起到加强散热效能,加快机箱内部风道气流的功效。

继续开箱,这代FE显卡还有不少小设计,例如经典的浮雕刻印装饰无缺席,RTX 5080 字样出此刻背面中央靠外侧的黑色金属遮罩上,同期正面的8字形铝框上亦有类似的落款,设计感满满。


显卡顶部则是电源接口,与上代RTX 40系列同样,GeForce RTX 5080采用的是12VHPWR接口,亦便是咱们常说的16Pin,单口能够供给最高600W的供电能力。并且改回了如RTX 30系显卡时的斜插形式,这般不易引起线材弯曲,从而亦能降低烧显卡的危害。

电源接口旁边则是标志性的“GEFORCE RTX“字样,并且在上机之后还能点亮,无论是质感还是观感都更进一步。


同期,倘若你仔细观察,正面的8字型铝框之下还隐匿了灯带,一样上机之后能够点亮。给低调的正面又新增了一丝律动。

顶部还有有些小设计,这一代的GeForce RTX 5080仅在两侧留下了两条线形通风口,相较于之前显卡外露鳍片的设计风格,显著收敛了许多。

看完顶部再瞧瞧显卡底下的PCIe金手指,这一代的PCIe接口升级作为了5.0速率,这亦是首次在RTX 50系显卡上应用,能够带来更高的传输速率,并且金手指的形状和上一代的显卡有些微的变化。

显卡I/O接口部分,视频输出接口还是常规的3个DP加1个HDMI的配置,不外规格上有了升级,GeForce RTX 5080采用的是DP 2.1b与HDMI 2.1b规格。理论上,这一代显卡的视频输出接口能够容易实现4K 480Hz和8K 240Hz超高分辨率与超高刷新率的需要。

同期因为散热的改进,I/O接口处亦再也不设置通风窗口,一体性更强的同期,整张显卡的颜值亦更高了。
测试平台介绍
起始性能测试前介绍一下这次的测试平台, CPU运用的是日前毫无争议的游戏神U——AMDRyzen R7-9800X3D,主板则是来自微星的MPG X870E CARBON WIFI 暗黑主板。内存为T-FORCE XTREEM ARGB 幻镜DDR5内存,在这块主板上直接开启AMD EXPO即能容易达成DDR5-8000 C38的成绩,并且咱们这次选择的是24G×2的套条,保证这张显卡能够释放所有性能。

表示器部分咱们则采用的是Evnia 出品的Evnia 32M2N8800,其配置非常出色,持有31.5英寸大屏,更大尺寸自然能够带来更加震撼的视觉体验。另一这款制品还采用了QD-OLED面板,OLED 的自发光特性让 O8 可实现近乎 0nit 的暗场与最高 1000nit 的峰值亮度,可实现极高的对比度。

除了“绚丽”, 32M2N8800亦一样善于“流畅”。 32M2N8800支持最高 240Hz 的高刷新率,是传统 60Hz 表示器的 4 倍,协同“零感同步加速”黑科技,其响应时间更低至 0.03 msGTG,且 OLED 面板子像素独立控光特性让“拖影”问题从底层被完全处理。240Hz 高刷新率 + HDR 高对比度之下,游戏画面在EVNIA电竞表示器32M2N8800中,就仿佛画通常,生动传神。

完整测试平台配置如下:

理论性能测试
起始测试前,按例还是要“认识”一下这张显卡。因为GPU-Z还没适配最新的显卡,因此呢部分信息还不可表示,不外从日前的信息中能够看到GeForce RTX 5080的基准频率为2295MHz,Boost频率为2617MHz,这个频率对比前代RTX 4080的2505MHz还是提高了不少。其他方面则是这张显卡的TDP为360W,并且还配备了战将来的PCIe 5.0接口。

理论性能部分,看3DMark,在FireStrike系列测试中,GeForce RTX 5080表现非常亮眼,领先RTX 4080 SUPER约24%,领先RTX 4080更加多,差距能够拉大至32%。而在以DX12为表率的Time Spy测试中,新显卡得分32571,对比RTX 4080 SUPER或RTX 4080显卡均能做到领先约16%,性能提高还是非常可观的。

光追项目亦是RTX 50系提高的重点项目之一,GeForce RTX 5080亦是一骑绝尘,凭借22036的成绩遥遥领先于RTX 4080乃至是RTX 4080 SUPER,对比二者性能,分别领先了21%和23%。而在最新的Speed Way测试里,一样亦有超20%的性能提高,有一说一,在CUDA核心无显著增多的状况下,仅靠架构改进就能得到如此提高,这代RTX 50系显卡还是有点东西的。
DLSS 4专项测试
看完了理论性能部分的测试,接着咱们再来瞧瞧这次RTX 50系显卡最“顶”的升级,DLSS 3在RTX 40系显卡上引入了单帧生成技术,能够依靠AI在两帧之间生成一帧AI帧,从而实现帧数的翻倍,用过的玩家都说好!不外因为每生成一个新的帧都需要光流加速器和 AI 模型参与,因此呢生成多帧的开销相当昂贵,而过高的性能开销会带来瓶颈,引起帧率提高受限。
而这次DLSS 4全新升级,引入了多帧生成技术,它能够利用 AI 为每一个渲染帧额外生成多达3帧!相比传统渲染的方式,能够最多实现8倍的性能提高。并且每次渲染额外帧只需要AI模型执行一次,就能输出三帧画面,因此呢无论是对性能、显存的开销还是延迟都比之前要好了许多。
另一,因为多帧生成技术,输出的帧多了,要给每一帧都安排一个恰当的间隔刷新才可让观感更好。因此呢NVIDIA还引入了专属的Flip Metering来代替CPU Pacing,它将帧节奏规律转移到表示引擎,让GPU能够更精确地管理表示时间,尽可能的将每一帧画面的生成时间保持一致,从而加强整体游戏视觉的流畅感。不外因为Flip Metering是硬件级的掌控器,因此呢DLSS 4的多帧生成日前仅有RTX 50系显卡支持。
同期DLSS 4 还引入了图形行业首个 Transformer 模型实时应用。熟练AI的应该对它很熟系了,它在AI生成行业已然应用数年了。基于Transformer架构的 DLSS 超分辨率和光线重建以及DLAA模型,相比之前DLSS运用的卷积神经网络(CNN)模型来讲,具备2倍的参数量和4倍的计算量。在游戏场景中,能够供给更高的稳定性、更少的拖影、更高的细节和更强的抗锯齿能力,使画面更加清晰、流畅和逼真。
不外虽然DLSS 4的多帧生成功能是RTX 50系显卡的独霸功能,但新的Transformer模型将会逐步下放至DLSS 3、DLSS 2等,将适用于所有GeForce RTX显卡。并且按照NVIDIA的说法,超过75款游戏和应用将在GeForce RTX 50系列开售时支持DLSS 4的全新DLSS多帧生成功能,包含《赛博朋克2077》《战神:诸神傍晚》《心灵杀手2》《霍格沃兹之遗》等,《黑神话:悟空》亦将于今年晚些时候升级支持 DLSS4的多帧生成。随着时间的推移,支持DLSS 4的游戏和应用数量将持续增多。
简单介绍完,咱们再瞧瞧DLSS 4的理论表现怎样,还是经典的3DMark测试。不得不说GeForce RTX 5080搭配上DLSS 4后,帧数就跟打了鸡血同样,开关多帧生成前后的性能简直天壤之别!其中2K分辨率下,开关前后性能差距足足有4倍之多。4K分辨率下就更离谱了,开关帧数差距得有6倍,即便是对比DLSS 3的话,帧数亦能提高70%以上,这已然快做到翻倍了,看来游戏要变天了。最离谱的还要属8K,要晓得RTX 40时代,8K游戏在大都数玩家看来还不太实质,然则此刻GeForce RTX 5080在DLSS 4加持下能够做到156 FPS,这已然不是能玩的水准了,是畅玩爽玩了。
接着咱们瞧瞧DLSS 4在实质游戏中的表现,第1款游戏是《霍格沃兹之遗》,支持DLSS 4技术以后能够在设置看到帧生成部分多了有些选取,其中×2则是加强版DLSS 3帧生成,而×4则是RTX 50系独有的多帧生成功能,另一你亦能够选取插2帧的方式,亦便是所说的×3选项。
体验下来,《霍格沃兹之遗》这款游戏优化还是不错的,4K分辨率画质光追均设置最高的状况下,GeForce RTX 5080在不开任何超分的状况下,平均帧为78 FPS,流畅玩绝对没问题。倘若开启DLSS 3性能档,此时帧数已然能够做到203 FPS了,体验已然相当丝滑了。不外开启DLSS 4以后,你会发掘帧数来到了恐怖的358 FPS,已然远远超出此刻表示器的高刷输出范畴了,对比原生4K时,性能提高了约4.5倍以上。同期实质游戏过程中,无论是1%Low还是延迟都不错,尤其是延迟,相比原生分辨率还要低不少,跟手感更好。
第二款游戏咱们测试的是《星球大战》,同样你能在设置中看到其帧生成功能已然支持×4的选项,亦便是DLSS 4多帧生成功能。不外这项功能是RTX 50系独霸,想要体验最强的游戏性能,那就赶紧升级最新的GeForce RTX 5080!
实测DLSS 4在这款游戏中亦是大杀四方,在4K原生分辨率下,GeForce RTX 5080的平均帧仅有可怜的20 FPS,延迟亦是高得吓人。此时开启DLSS 4性能档以后,游戏平均帧直接暴增至170 FPS,忽然间游戏体验如德芙般丝滑,对比原生4K的表现,足足有8.5倍上下的提高。即便是对比加强版DLSS 3的95 FPS,那亦是接近翻倍的性能提高,还是挺不错的。
下一款游戏则是有“显卡杀手”之叫作的《赛博朋克2077》,有一说一,《赛博朋克2077》的设置页面就更丰富,除了能够设置DLSS 4的多帧生成外,还能够切换DLSS 4的另一个特性——Transfomer Mode,据述能够让画质更清晰,同期还能改善此前的拖影问题,对玩家能够说是一大好处。
下面咱们来看DLSS 4的性能表现,毕竟是“显卡杀手”,对显卡的压力确实不通常,在最高画质+路径跟踪的状况下,GeForce RTX 5080只能跑18.74 FPS,几乎不可玩。开启DLSS 3以后,游戏帧数能够来到104.62 FPS,体感已然非常流畅了。而开启DLSS 4以后,GeForce RTX 5080能够做到184.42 FPS,对比原生分辨率,性能足足提高了8.8倍。1%Low就更离谱了,几乎快要追上DLSS 3下的平均帧了,整体游戏体验便是掉帧的状况少之又少,稳定性拉满。
倘若你想玩的游戏还不支持DLSS 4,那亦不消担心,NVIDIA app还供给DLSS 4 Override优设功能,说人话便是能够让游戏强开DLSS 4,这儿咱们以《漫威争锋》为例,在NVIDIA app中简单设置,就能将帧生成调至“4×”,一键实现多帧生成。
实测这种方式开启多帧生成功能确实有用,GeForce RTX 5080在4K全高设置下,不开超分,帧数仅74 FPS,亦是刚好流畅玩罢了。而开启DLSS 3后,帧数能够达到190 FPS,相比原生分辨率已然提高了一倍以上,倘若再开启DLSS 4多帧生成,那性能对比原生分辨率的话,更加是提高4倍以上,327 FPS直接晋级电竞3A。同期延迟表现亦非常出色,原生分辨率下,其延迟为26ms,而开启DLSS 4以后,延迟乃至能够降低至23ms,游戏会更加跟手,体感更佳。
总的来讲,DLSS 4多帧生成功能的显现,毫无疑问让玩家的游戏体验又上了一个台阶。对比上代RTX 40系的DLSS 3单帧生成功能,再度实现了帧数的飞跃。一样的画质设置,RTX 5080的表现遥遥领先于RTX 4080,实测在上面说到的四款游戏中,开启DLSS 4的GeForce RTX 5080,帧数几乎是RTX 4080的翻倍!并且这还不是靠堆硬件的提高,全靠“科技与狠活”!
另一,值得一提的是,与DLSS 4一块到来的还有全新的NVIDIA Reflex 2技术。延迟始终是电竞中绕不开的专题,玩家的每一个动作都会经过繁杂的计算,再在屏幕上渲染,这其中的每一步都会增多延迟。虽然延迟常常仅有几十毫秒,然则你却能显著的感觉到游戏的不流畅、卡顿。
为了尽可能的降低延迟所带来的不良游戏体验,NVIDIA发布了NVIDIA Reflex技术,它能够使GPU和CPU同步,保证最佳响应速度和低系统延迟。日前NVIDIA Reflex已集成到超过100款游戏中,能够将PC延迟降低50%。
而GeForce RTX 50系显卡再度升级,带来了NVIDIA Reflex 2技术。它结合了Reflex低延迟模式与Frame Warp技术。它能够把最新的鼠标输入指令同步给渲染帧,即时更新渲染的游戏帧并在渲染帧被发送到表示器之前获取最新的鼠标信息,经过刷新渲染的游戏帧以进一步减少延迟,将PC延迟进一步降低多达75%。
另一,Frame Warp的加入,能够进一步将延迟降低。当一个帧被GPU渲染时,CPU会按照最新鼠标或手柄输入计算工作流中下一帧的视角位置。Frame Warp从CPU采样新的视角位置,而后将GPU刚才渲染的帧扭转到最新的视角位置。在渲染帧被发送到表示器之前,在尽可能最新的时间进行扭转操作,保证屏幕上反映最新鼠标输入。
而当Frame Warp转移游戏像素时,图像中可能会产生缝隙撕裂、镜头位置的变化会让游戏场景中表示新的部分。NVIDIA则研发了一种优化了延迟的预测渲染算法,该算法运用来自先前帧的视角、颜色和深度数据,对这些撕裂空白的像素进行准确的图像修复。玩家能够经过更新的视角看到无撕裂的渲染帧,并降低了改变游戏内视角位置而产生的延迟。说人话便是此刻NVIDIA Reflex 2还能够按照上一帧的信息去脑补有些空白的像素,有种无中生有但你又看不出来的感觉。
首发支持NVIDIA Reflex 2技术的游戏是《THE FINALS》以及《无畏契约》,后续咱们亦会第1时间带给大众该技术的仔细评测。
游戏性能测试
认识完DLSS 4的“逆天”表现以后,咱们再关注一下常规的游戏性能表现,还是老样子,先跑3DMark的DLSS 3性能测试。GeForce RTX 5080在2K分辨率下,对比RTX 4080或RTX 4080 SUPER,性能提高幅度大概在27%上下,4K分辨率下,开启DLSS 3以后性能领先亦基本维持在25%,思虑到三张显卡的CUDA核心几乎无差距,还是不禁赞叹一句Blackwell架构确实强。
当然理论性能终归是纸上谈兵,还得进游戏里实质测试一下才晓得GeForce RTX 5080的实力。这儿咱们选择了11款游戏进行测试,包括光追及光栅性能方面的测试,而游戏画质方面均所有选取最高画质,光追设定部分,如有则采用最高。
实测4K分辨率下,GeForce RTX 5080应对绝大都数游戏都轻容易松,尤其是在DLSS的加持下,满足4K@144Hz电竞无问题,即便是全高设置的《黑神话:悟空》,这款显卡亦能有87 FPS的表现,基本碰到了高刷的门槛,后续倘若有DLSS 4想必帧数提高会更加迅猛。详细到性能上,在这么多款游戏里,GeForce RTX 5080整体比RTX 4080 SUPER强约20%上下,倘若对比RTX 4080的话,性能领先幅度则能够扩大至25%以上。
图像视频创作性能测试
游戏测完,下面就来看一下创作者们比较关心的生产力性能,在PCMark10 Extended测试, GeForce RTX 5080在游戏、数位内容创作方面的表现更佳,基本上要比RTX 4080高10%和15%上下,而生产力方面的成绩则比较低,推测是日前驱动还不完善导致。
办公软件测试中,GeForce RTX 5080表现亦不错,整体性能能够领先5%上下,其重点领先在Excel、PPT以及Outlook三项,不外有一说一,这三张卡用来办公只能说确实有些浪费了,用它们打开这些软件,差距应该都是微乎其微的。
在Adobe以及达芬奇的Benchmark测试里,GeForce RTX 5080整体相比RTX 4080或RTX 4080 SUPER亦有小幅提高,不外提高比很强的还是视频编辑部分,究其原由还是由于这一代RTX 5080再度对编码器进行了升级,不仅编解码的效率更高,同期支持的格式亦更丰富。
例如在达芬奇和PR的测试中,GeForce RTX 5080领先RTX 4080约7-17%,还是非常夸张的。同期在PS以及AE里亦有小幅的性能提高,大约在4%-11%之间,总体来讲便是内容创作的效率更高了。
3D渲染创作性能测试
看完了图像视频方面的创作,咱们再把目光投向3D渲染以及工业行业的软件中,瞧瞧RTX 50系显卡又有怎么样的精彩表现。还是熟练的伴侣Blender以及V-Ray,在这两款软件中,RTX 5080的表现亦是大杀四方,其中前者基本上能领先RTX 4080 SUPER达3%-16%,而后者就夸张了,对比两张40系卡,乃至能够领先至84%。
再瞧瞧另一一款渲染器,D5 Render是一款基于DXR和光线跟踪技术构建的GPU渲染器。正由于其有光线跟踪技术,其渲染的画面相当出色。这款软件在RTX 40系显卡测试时支持了DLSS 3单帧生成,而此刻随着RTX 50系显卡的发布,它亦能够经过NVIDIA app的方式支持最新的DLSS 4多帧生成功能。
实测在开启DLSS 4以后,全部渲染预览的界面变得丝滑流畅,帧数基本都在226 FPS周边,而对比不开DLSS时,仅59 FPS的表现来看,性能几乎是提高了4倍以上。即便是面对RTX 40系的DLSS 3,亦一点不虚,性能优良亦有50%以上。
再瞧瞧工业行业的表现,SPEC2020能够反应显卡的工业能力,在多项测试中GeForce RTX 5080依旧傲视群雄,对比RTX 4080平均有30%的提高,而对比RTX 4080 SUPER亦在25%上下,这个性能提高还是很可观的,乃至有些超乎想象。
NVIDIA编解码测试
接下来的测试则是介绍RTX 50系显卡的编解码器,GeForce RTX 50系列显卡上换装了第9代NVENC编码器与第6代NVDEC解码器,在视频规格上支持AV1 UHQ(超高画质 AV1)与MV-HEVC(多视角HEVC)编解码。同期因为GeForce RTX 50系列显卡还升级支持DisplayPort 2.1 UHBR20输出,单一通道支持20Gbps带宽,因此呢用户能够体验到令人惊叹的HDR视觉效果、超高分辨率和更流畅的游戏体验。
这儿咱们直接运用NVIDIA供给的4K60片源与工程文件分别测试AV1、H.265以及H.264下的编码导出时间。实测同一段素材下,GeForce RTX 5080导出三段视频的时间分别是9秒、10秒以及13秒,效率分别比RTX 4080或RTX 4080 SUPER快了111%、90%以及54%。
同期,咱们亦对导出的区别格式的视频进行了画质对比,实测AV1编码的视频在画质上与H.265或H.264亦无显著差距,无论是在文字、人像还是建筑等画面里,三者的画质能够说是手足之间,倘若不特地标注其格式,通常人很难用肉眼分辨出来。随着日前越来越多视频网站、剪辑软件和硬件厂商的推动,将来AV1势必会作为下一个最受欢迎的格式。
值得一提的是,GeForce RTX 50系显卡还能够支持4:2:2色度取样的视频编解码,这将节省CPU的包袱,加快创作速度。上面的图表里亦能够看到咱们的测试成绩,实测导出时间会比上代显卡快不少,毕竟RTX 40系显卡不支持该功能,仅支持4:2:0色度采样,倘若必定要4:2:2导出只能靠CPU软解。
4:2:2色度采样的视频文件采用的是YUV颜色格式,与存储红色、绿色和蓝色(RGB)值区别,颜色被存储为亮度Y、蓝差色度U和红差色度V。在这类视频中,视频的完整亮度将被保存,而原始色度信息只保存一半,因此呢相比4:4:4的视频,其视频帧数据量仅有不到三分之二,而相比4:2:0的视频又能供给两倍的颜色分辨率,因此呢创作者采用这种格式拍摄,能够在保存更加多色彩信息的同期还能减少文件体积和带宽需要。
AI性能测试
AI是老黄在CES上谈及的重点,而RTX 50系显卡上针对AI性能的改进则是加入了对FP4精度模型加速处理的支持,它相比此前RTX 40系上的FP8精度,能够实现更快的生成速度,同期显存占用亦更低。
不信你看,咱们用UL Procyon的FLUX.1 AI Image Generation Demo For NVIDIA进行测试。在均运用FP8精度模型时,GeForce RTX 5080能够做到13.705s生成一张图,而RTX 4080或RTX 4080 SUPER则要17秒以上;而切换到FP4精度模型后,速度才真正拉开了差距,其中RTX 5080生成照片的速度能够提高到6.742秒一张,效率翻了一倍不止。而RTX 4080或RTX 4080 SUPER的生成时间则不降反升,RTX 5080对比它们的性能,拉大到了3.5倍以上。
并且FP4精度模型生成的照片亦非常能打,从下图就能看出来,其与FP8生成的照片几乎无区别,无论是对关键词的理解还是图像的质量,都非常有保证,新时代AIGC玩家的最佳选取了。
再瞧瞧GeForce RTX 5080在Stable Diffusion中的表现怎样,还是用UL Procyon进行测试,在比较容易的SD 1.5文生图测试里,无论是采用FP16精度模型还是INT8精度模型,RTX 5080的表现都展现了旗舰级显卡应有的实力,尤其是在INT8精度下,生成一张图的速度仅需0.54秒,效率比上代显卡快了48%,已然接近一倍了。而即便是在压力比很强的SDXL中,优良亦非常显著,生成一张图的速度为8.439秒,一样领先RTX 4080或RTX 4080 SUPER达1-2秒。
在AI文本生成测试中,GeForce RTX 5080在一众大语言模型里一样表现出众,咱们用MLPerf Client v0.5大语言模型进行测试,它是基于meta的Llama 2 7B开源LLM打造,涵盖了四项AI任务,分别是内容生成、创意写作以及对两份区别长度文本进行总结摘要。实测GeForce RTX 5080在每一项中都表现出了绝对的统治力,各项领先幅度均在16-18%上下。
接着咱们又用UL Procyon的AI Text Generation测试了更加多的大语言模型,GeForce RTX 5080的优良依旧非常显著,在以Llama 3.1 7B LLM打造的Phi-3.5测试中,新一代显卡取得4522分的成绩,相比RTX 4080提高了16%,相比RTX 4080 SUPER则提高了6%;将参数扩大至Llama 2 13B的测试中,GeForce RTX 5080的表现更加亮眼,4790分的表现已然离RTX 4090不远了,对比性能的话,则能够领先RTX 4080约28%,领先RTX 4080 SUPER 22%以上。
功耗与温度表现
最后一项测试烤机,这亦是许多玩家关注的重点,毕竟双槽卡的厚度然则塞下了360W的核心,难免让人担心它的温度表现。不外实测Furmark烧机10分钟后,得益于GeForce RTX 5080 FE出色的设计底蕴,核心温度并不高,仅有73.7度,显存温度亦是70度,此时显卡的最大功率为360.4W,已然完全顶着TDP的上限了,风扇转速则是1600RPM,噪音不算大,在可接受的范围之内。
横向对比RTX 4080或RTX 4080 SUPER时能够看到,虽然GeForce RTX 5080的TDP提高了,不外整体的烤机功耗并不算高,同期双槽卡在减低了厚度的状况下,核心与显存的温度还掌控确实不错,属于是非常惊喜了。这对ITX玩家能够说是一大喜讯,此刻小主机亦能有强性能!
评测总结
经过这段时间的实测,GeForce RTX 50系还是给我带来了不少惊喜。GeForce RTX 5080不论是从外观设计、硬件堆料、散热效能还是做工水准来讲,都全方位展示了NVIDIA的实力。尤其在散热技术上采用了创新的液态金属材料和双流通冷却系统,满足有效散热的同期,亦将显卡的体积带回了最初咱们认识的样子。技术层面,全新的Blackwell架构、DLSS 4、RTX神经网络渲染等技术则是将它推向了新的高度。
详细到实质表现,咱们分状况看。首要在游戏体验上,GeForce RTX 5080就给到咱们不少惊喜。原以为硬件层面无太多变化,在游戏性能上亦会如此。不外实测下来,即便是只开DLSS 3的状况下,这款显卡依旧能够领先上代显卡约20%。更不消说新的RTX 50系显卡还支持逆天的DLSS 4,实测性能提高巨大,与4K原生分辨率对比,性能差距最大能够去到8倍以上!随着支持DLSS 4的游戏越来越多,届时RTX 5080的性能又将迎来一次飞跃。
而在内容创作上,GeForce RTX 5080亦发挥出了旗舰级水准,尤其是新一代编解码器加持,让视频、渲染速度成倍提高,协同NVIDIA Studio平台的持续发力,让即使不玩游戏内容创作者们,亦有了非常多升级到GeForce RTX 5080的理由。除此之外,AI性能亦是这一代提高的重点,支持FP4精度加速,AI生图速度乃至能够做到RTX 4080的三倍乃至四倍!并且它还有GDDR7显存加持,能够供给惊人的数据传输效率,容易应对高分辨率渲染及AI创作。
最后聊聊选购意见,NVIDIA GeForce RTX 5080无疑是一款集高性能、高性价比于一身的显卡制品。无论是针对追求极致游戏体验的玩家,还是针对需要强大图形处理能力的创作者来讲,它都是一个非常值得思虑的选取。倘若你正在寻找一款能够满足你各样需要的显卡,那样不妨思虑一下这款GeForce RTX 5080,8299元的MSRP价格,只能说能买到的话,绝对物超所值!