热搜词:

索泰 RTX 5060Ti XGAMING OC显卡评测:建议选择16G版本

今年的RTX 5060Ti也是同样有16G显存和8G显存两个版本。上一周我们首发测试的几张RTX 5060Ti显卡都是16G显存版本的。在测试时,我们手头也没有16G显存版本的RTX 4060Ti(8GB版的是主流较为流通),所以在游戏表现上没法直观的体现区别。这次也是有机会来对比一下8GB显存版本的。

外观:

索泰RTX 5060Ti XGAMING OC显卡,延续了XGAMING系列一贯的设计,大胆的运用鲜艳活泼的颜色,银色为基底,搭配红、紫、绿。珠光变彩设计,不同的角度呈现不同的色彩,打造了年轻玩家喜爱的个性显卡。整卡尺寸320mm x 125mm x 45mm。

背面一体式合金背板,能很好的保护PCB板,增加显卡结构强度,提升静电防护能力。右侧镂空网孔可进行辅助散热。中间还印有XGAMING字样的logo。

左侧I/O区域三个DP2.1b和一个HDMI2.1b,足够满足多屏输出需求。相比此前的DP1.4a,DP2.1b可以支持更高分辨率、更高刷新率的视频输出。

通电后,侧面的GEFORCE RTX和ZOTAC都会亮起。供电采用单8pin接口。推荐电源600W.

在散热上采用冰芯2.0散热系统。三个90mm的复合材质环刃风扇,噪音低,风量大,风压强。散热底座进行镜面抛光处理配合三根6mm镀镍复合热管以及大面积密集散热鳍片能均匀的导出GPU热量,大大提高散热效率。

测试平台:

我们搭建了如下配置的测试平台,处理器使用了AMD最新的锐龙9000系列的9700X,主板是X870E,两条16GB的DDR5 6800MHz内存。

性能:

在索泰RTX 5060Ti XGAMING OC显卡上上使用了全新的Blackwell架构,加入了神经网络渲染技术。SM多单元流处理器计算单元具有更大的吞吐量计算能力上限显著提升。第五代的Tensor Core配合上第四代RT Core让游戏帧数更高、画面细节更逼真的同时还能减少显存占用。GDDR7显存的带宽更大,传输速度更快却更节能。

GeForce RTX 50系列显卡中首次引入了Transformer模型,增加了Filp Metering模块,它可以进行均匀的插帧,不再会出现某一瞬间low帧过低,所以也不再会感受到明显的卡顿和掉帧。DLSS 4技术引入的多帧生成技术,可为每个渲染帧生成多达三帧以进一步提高帧率。多帧生成技术可与全套DLSS技术协同运行,与传统渲染技术相比,性能提升至高可达8倍,而且延迟更低,显存占用也更低。

Transformer模型,适用于GeForce RTX 20系列至50系列的所有显卡。用户可在游戏内自主选择使用CNN或者是Transformer。DLSS超分辨率、DLSS光线重建、DLAA都由于Transformer模型驱动,它对画面中的每个像素的重要程度进行评估,可以更好的理解场景,可提高画面稳定性,减少伪影,增加细节并增强抗锯齿效果。

我们在《赛博朋克2077》中对一下CNN与Transformer两种模型下的画质,除了水面上反射出来的画面更清晰之外,右侧的Transfomer模型甚至把金属材质的下水道井盖的光反射也做出来了,所有材质表面的纹理、凹凸也能被观察到。

在参数上,索泰RTX 5060Ti XGAMING OC,核心代号GB206,工艺依旧是TSMC 4N,4608个流处理器,光栅单元48颗,纹理单元144颗,位宽128bit,8GB GDDR7显存,带宽448GB/s,基础频率2407MHz,加速频率2632MHz,TDP功耗180W。

与上一代的RTX 4060 Ti进行对比除了架构更新了之外,最大的区别就是RTX 50系独占DLSS 4多帧生成功能。并且AI TOPS算力翻了2.15倍,来到759。显存方面,升级为了GDDR7芯片,能提供更快的传输速度,同时编解码器也进行了升级。

进行15分钟的烤机,显卡温度大约61.3度,总功耗约180W,此时频率2452MHz。

在3DMark理论测试中,整体性能提升了21%左右,不过主要提升还是在DX11游戏上,尤其是在2k和4k分辨率下的。提升了25%和30%。第四代RT Core的加入也让光追成绩有了飞跃实现30%的提升。

在3DMark的DLSS 4测试中,将画面设置为2k,DLSS质量模式,在原生状态下连50帧都不到,但在开启DLSS多帧生成后,最高能来到170左右fps,足足翻了3.5倍。

目前已有超百款游戏和应用支持DLSS 4技术,我们可以看到《黑神话悟空》他也加入了DLSS 4的行列但是目前STEAM版的还暂不支持,只有EPIC和WEGAME上的才可开启。在1080p上提升最大的是《心灵杀手2》,5倍提升帧数接近200fps,《黑神话悟空》以及《赛博朋克2077》也有不到80帧的表现,也算不赖。但在2k下8GB显存的5060Ti就吃力不少了即使是开启多帧生成,《赛博朋克2077》的帧数也没有超过50,不过《黑神话悟空》却还有70帧。其余几款游戏帧数也都超过了100帧。

针对DLSS4帧生成延迟问题,我们在《赛博朋克2077》上进行了测试,延迟确实是存在的也有一定程度的增长,但是DLSS 4相比DLSS 3延迟微乎其微,仅仅增加了6ms,从64ms到了70ms。更何况对于3A游戏而言,延迟反而不需要这么在意,用略微的延迟换取更高的画质与帧数无疑是更赚的。

除了上述支持DLSS 4的游戏外,我们还测试了一些热门3A和网游,在1080p下提升夫妇仅21%,绝大多数的游戏都没有破百,虽然其中《赛博朋克2077》的提升最大但也仅就60帧。在2k分辨率下提升了46%,像《怪物猎人:荒野》和《黑神话:悟空》勉强保持60帧的水平。

NVIDIA此次还推出了Reflex 2技术。对于常玩FPS游戏的玩家而言,Reflex技术可以降低游戏延迟。上一代是同步GPU和CPU,通过删除CPU到GPU之间的渲染队列,优化响应速度并降低系统延迟。Reflex 2在此基础上支持Frame Warp,可在将渲染帧发送至显示器前,根据最新的鼠标输入信号对其进行更新,从而降低游戏延迟。与原生渲染相比,Reflex 2最高可降低75%延迟。

目前还没有游戏上线此功能,但是NVIDIA宣布Reflex 2首先会在《The Finals》和《无畏契约》上支持,其他游戏也会慢慢加入支持列表,大家敬请期待。

除了游戏上,GeForce RTX 50系列显卡还能在直播,视频制作,3D渲染,大语言模型等生产力方面提供卓越帮助。

NVIDIA Broadcast软件可将任何房间变为家庭工作室。借助AI增强的语音和视频,将您的直播、语音聊天和视频会议通话提升到更高水平。

在音频方面,它新推出了音频效果——音棚音效(Studio Voice),会让声音更清晰、更饱满,听起来就像你通过一个高频麦克风说话一样,具有宽频谱范围。在背景有其他嘈杂的声音时仍能保证声音的清晰。

在视频上,虚拟补光功能使用AI分析每个视频帧,会提取面部特征并与背景分离,照亮你的脸部并消除阴影。

第五代Tensor Core支持FP4精度模型的加速处理,FP4精度每个参数只占有4bit,相当于FP32的1/8,可以极大减少数据存储量和计算量,使用FP4精度后可以让AI任务更高效的运行。在Blackwell架构的加持下,性能提升是之前的5倍,可以输出比FP16更细腻的画面。

最后再来看一下有关生产力方面的测试。在V-Ray Benchmark RTX测试中得分4488。领先RTX 4060 Ti的3300分。

在Blender4.3渲染测试中,monster得分2344,junkshop得分1125,classroom得分1194,总分约4600。整体分数相比4060Ti高了800分。

在PR PugetBench测试中,由于RTX 50系列的编解码器升级了所以整体分数来到了9949,比RTX 4060 Ti高了1500分左右。

RTX 50系列显卡现已支持对HEVC和H.264 10bit 4:2:2格式的解码加速。GPU加速的解码可实现更快的实时播放,能够直接使用原生素材而不是代理文件,实现了更流畅的响应并降低CPU负载,为各类应用程序工作流和创意任务释放系统资源。

D5渲染器是一款基于实时光线追踪技术的3D渲染软件,支持多种模型、材质和光源。它支持了RTX 50系显卡的多帧生成功能,只需在NVIDIA APP中覆盖设置即可。在开启DLSS 4后相比原生状态,帧数提升了将近2.3倍,1%low帧也有显著提升,整体画面更稳定。

最后来跑一下LLM大语言模型方面的测试:Procyon的AI文本生成基准测试,它简化了多个大型语言模型(LLM)的AI性能评估流程,提供了一种可重复且高效的方法来评估AI的能力,能够对AI的工作流程进行比较。RTX 5060 Ti的算力为759。

它运行了四个模型,其中PHI 3.5得分2900,MISTRAL 7B得分2816,LLAMA 3.1得分2120,LLAMA 2因为是14B的参数模型,至少需要12GB显存,而我们是8GB所以分数会较低只有872。

总结:

从整体表现来看,索泰GeForce RTX 5060 Ti 8GB XGAMING OC领先RTX 4060Ti 20%左右。不过8G版本的在2k游戏下存在明显的爆显存现象,仅适合那些游玩1080p网游的玩家,而且也不能运行过大参数的大语言模型。两个版本的价格差距400,如果为了更好的游戏体验还是建议选择16G显存的。