目前NVIDIA RTX 30系显卡已经先后发布了GeForce RTX 3080/3090/3070/3060 Ti,如今入门级GeForce RTX 3060也已经发布,完成了全线布局。相信大家还记得发布会时全新的RTX 30系显卡给我们带来的惊艳表现,今天我们拿到的显卡为华硕ROG STRIX GeForce RTX 3060 O12G OC,也正是ROG的颜值担当猛禽系列。
华硕ROG-STRIX-RTX3060-O12G-GAMING
电商报价¥10000¥5999
我们再来说一说GeForce RTX 3060这个型号本身,这款卡是首次采用GA106核心的入门级显卡,而此前发布的GeForce RTX 3060 Ti采用的是与GeForce RTX 3070相同的GA104,在核心内部做了改动,关于GA106我们后面会详细说明,下面先来看看GeForce RTX 3060的提升有哪些。
第一代NVIDIA RTX架构 Turing下的RTX 2060
第二代NVIDIA RTX架构 Ampere下的RTX 3060
相较于上一代的Turing RTX架构,NVIDIA Ampere架构在算力上有着成倍的增长,这一点在RTX 3060中依旧有体现,每个时钟执行2次着色器运算,而Turing为1次,RTX 3060的着色器性能达到12.7 TFLOPS单精度性能,而Turing为6.5 TFLOPS。
NVIDIA Ampere架构翻倍了光线与三角形的相交吞吐量,RT Core达到24.9 RT TFLOPS,而Turing为19.5 RT TFLOPS。而且第二代光线追踪最重要的不仅仅是性能提升,还增加了对游戏中运动模糊部分场景的光线追踪计算加速。
例如最新发布的《赛博朋克2077》中,当玩家在游戏中遭遇赛车,追逐,打斗等激烈运动场景,第二代光追在架构上可以确保显卡渲染帧率相对更平稳,游戏体验上不会有频繁掉帧带来的顿挫感。
《赛博朋克2077》
全新的Tensor Core可自动识别并消除不太重要的DNN权重,处理稀疏网络的速率是Turing的两倍,算力高达102 Tensor TFLOPS,而Turing为51.6 Tensor TFLOPS。
芯片决定了显卡大体性能和规格,但是显卡工作的整体稳定性,温度表现,噪音等级却更依赖显卡制造商在PCB布线,电子元器件的适配,散热系统调校等综合能力。作为ROG旗舰产品在这些方面自然有着过人之处,在评测开始前,笔者为大家总结一些该显卡的特点,也方便大家有针对性的阅读:
ROG猛禽,1882MHz高频率
巅峰颜值,颜值与质感并存
总的来说,作为ROG旗下的旗舰产品,ROG STRIX RTX3060 O12G GAMING在此次RTX 30系显卡中完成了完美升级,外观重做后,ROG STRIX系列表面为金属风格,搭配交错的纹理和图案,简单的材质却展现出了令人惊叹的质感,多线条的面积分割让本身体积很大这一缺陷更具有立体感,不得不说工业设计满分。
在性能方面,RTX 3060这款显卡由于芯片型号所限,相较RTX 3060 Ti有较大幅度的差距。不过对比上一代的RTX 2060提升明显。虽然同样作为入门级显卡,但RTX 3060相比RTX 2060,采用了全新的NVIDIA Ampere架构,拥有更纯熟的第二代RT Core和第三代Tensor Core,在光线追踪和AI学习方面都有不同程度加强,对于目前的游戏将会有着更好的性能表现。
此次RTX 3060的全面升级在性能上相比RTX 2060综合提升20-25%,并且价格不变。目前在steam的硬件调查中,GTX 1060仍然以10%左右的占有率高居榜首,而RTX 3060相比GTX 1060拥有2倍于它的光栅性能,10倍的光线追踪性能,相信在这款显卡推出后势必也会让大量玩家考虑更换掉自己手中的GTX 1060,当然前提是有货来卖。
华硕ROG-STRIX-RTX3060-O12G-GAMING
京东商城
4099
进入购买
01 ROG STRIX RTX3060 O12G GAMING外观
此次的ROG STRIX系列在外观上做了非常大的改动,可以说完全推倒重做,但效果也是显而易见的,个人认为绝对是目前该系列的颜值巅峰,在RTX 30系显卡普遍增加体积的前提下,丝毫不显臃肿,反而质感十足。
ROG STRIX RTX3060 O12G GAMING
ROG STRIX RTX3060 O12G GAMING的整体尺寸为300×133.6×53.5mm,导流罩整体采用了金属与塑料交错拼接的纹理图案,简单的材质却展现出了令人惊叹的质感,多线条的面积分割让本身体积很大这一缺陷更具有立体感,不得不说工业设计满分。
ROG STRIX RTX3060 O12G GAMING
另外在散热方面,虽然同属ROG STRIX系列,但不同型号之间也有所区别,比如在RTX 3090中三风扇中间为13叶风扇两边为11叶风扇;而RTX 3060则全部采用的9叶风扇,三个风扇均采用全高阻隔环,大幅提升静压,加上正逆转工作设计,有效减少空气乱流,提高散热效率,为全新的散热模组提供了强大的气流。
ROG STRIX RTX3060 O12G GAMING导流罩细节
在细节部分ROG STRIX系列的设计也是满分,边角部位的小铭牌与导流罩整体的线条分隔相呼应,使视觉效果更统一。另外比较有意思的事,那一串非常容易被忽略的数字则是华硕总部的坐标。
ROG STRIX RTX3060 O12G GAMING背板展示
在背板上,ROG STRIX RTX3060 O12G GAMING采用了一体式的金属背板,同样是两种工艺效果的拼接展现,GPU芯片背部等几个发热量大的元器件采用了镂空处理方便更好的散热,同时尾部的大面积镂空便于热空气更好的从散热鳍片排出。
ROG STRIX RTX3060 O12G GAMING
散热方面ROG STRIX RTX3060 O12G GAMING的散热底座采用镜面抛光工艺,达到镜面平滑的效果,让散热底座更紧密的贴紧芯片,提高热量传递效率,让散热效能更好。这次由于RTX 3060的功耗较小,所以在厚度上相比RTX 3090的2.9槽更薄一些,仅为2.7槽的厚度,让卡身整体的重量和体积都小了不少。
BIOS切换拨片及供电接口
在供电接口上,ROG STRIX RTX3060 O12G GAMING由于功耗较小,满载功耗仅为150W左右,所以采用单8pin的供电接口,并且在接口下方有电源故障指示灯,在不接供电的情况下会有红灯报警。
接口左侧为BIOS切换拨片,“P MODE”为performance性能模式,可提供更高的风扇转速来快速降温,而“Q MODE”为quiet安静模式,运行起来噪音会更低,但相应的温度会有所升高,用户拿到显卡后默认为“P MODE”。
ROG STRIX RTX3060 O12G GAMING视频输出接口
视频输出接口上,ROG STRIX RTX3060 O12G GAMING采用DP 1.4a*3 HDMI 2.1*2的5接口设计,搭配12GB的大显存,可提供更多的扩展空间。另外新的HDMI 2.1接口可支持单线8K的视频输出。
02 NVIDIA Ampere架构下的RTX 3060
ROG STRIX RTX3060 O12G GAMING采用了NVIDIA Ampere架构,我们首先来看一下GeForce RTX 3060的参数提升。
完整的GA106核心
完整的GA106 GPU包含3个GPC(图形处理集群)15个TPC(纹理处理集群)以及30个SM(流处理器)组成,GPC是占据主导地位的高级模块,拥有所有的关键图形处理单元,每个GPC包含一个专用光栅引擎。在新的NVIDIA Ampere架构中,每个GPC还包含了两个ROP分区,每个分区包含8个ROP单元。
GeForce RTX 3060采用GA106核心,拥有132亿5000万(13250 million)个晶体管,276平方毫米的面积,基于三星的8nm NVIDIA定制工艺,来自三星的GDDR6显存。
本次NVIDIA Ampere的SM在Turing基础上增加了一倍的FP32运算单元,这使得每个SM的FP32运算单元数量提高了一倍,同时吞吐量也就变为了一倍。
而通常我们计算显卡的CUDA数量,并不是把SM中的所有单元加起来计数,而是只统计FP32单元的数量,所以这样一来,SM中的【FP32 : INT32】 从 1:1 变为 2:1。
GeForce RTX 3060共有3584个CUDA,其实它有1292个INT32单元,但由于内部的FP32数量翻了一倍,所以最终实现了3584的CUDA数量。
而这样粗暴的提升CUDA数量对于游戏其实有着非常大的帮助,通常在游戏中浮点运算相比整数计算要常用的多,图形、算法以及各种计算操作中着色器工作负载通常需要混合使用FP32算数指令,而FP32的加速也有助于光线追踪降噪着色器。
与此次RTX 30系显卡一同发布的还有一项新技术——RTX IO。目前很多游戏动辄几十G甚至百G的安装空间,对于存储空间的负担暂且不提,但存放在硬盘中的数据,如果显卡想要读取到,需要先由CPU从硬盘中读取压缩过的数据,经过解压缩再发送到显存中。
虽然随着NVMe SSD的推出,读取速度相较机械硬盘能够快20倍,但受制于传统I/O限制,NVMe高达7GB/秒的高速读写对于CPU是极大的负担。
传统的数据交换
在这个过程中,会占用多个CPU核心,压力急剧增大,占用较多的内存,而此时其实GPU是处于闲置状态的。RTX IO的作用就是越过CPU解压再传输数据这一步,直接从PCIE总线读取硬盘上经过压缩的数据,并且完成无损GPU解压,降低CPU占用,变向提升了性能。
RTX IO可以极大解放CPU负担
当然这项技术作为系统底层的运行方式改变,还需要借助微软发布的DirectStorage来实现,对于目前容量的游戏来说,RTX IO的改善效果有限,但假以时日等游戏容量上百G成为常态的时候,这项技术将会发挥巨大的功效。
同时搭配新增的HDMI 2.1接口,可以支持单线8K的视频输出,而上一代HDMI 2.0仅支持4K 98Hz的视频输出,如果想要连接8K电视,则需要更多的线缆支持。
03 3DMARK 理论性能测试及超频测试
首先介绍一下测试平台,为了保证此次评测能够发挥ROG STRIX RTX3060 O12G GAMING显卡的最佳性能,主板和CPU采用了目前桌面旗舰级配置,具体如下。
在测试成绩上,基准测试采用3DMARK,游戏性能测试使用游戏自带Benchmark,同时为了减小误差,每项测试成绩均测试3遍取平均值。
GPU-Z参数
首先看一下GPU-Z的参数,GeForce RTX 3060采用GA106核心,三星8nm工艺,芯片面积276平方毫米,拥有3584个CUDA,ROG STRIX RTX3060 O12G GAMING的Boost频率为1882MHz,公版为1777MHz,有较大幅度提升。采用12GB GDDR6显存,位宽为192bit,显存带宽达到了360 GB/s,光栅单元和纹理单元为48和112。
下面先进行的是用来衡量显卡DX11理论性能的3DMARK FS套装:FS,FSE,FSU三者分别对应显卡在1080P、2K、4K的理论性能,取显卡分数实际测试结果如下:
3D MARK FS套装测试
在针对显卡DX11性能的3DMARK FS套装测试中,我们可以看到ROG STRIX RTX3060 O12G GAMING的性能与RTX 2070对位。不过由于采用GA106芯片,性能要比采用GA104芯片的RTX 3060 Ti相差较大。
3D MARK TS套装测试
而在针对DX12环境下的Time Spy和Time Spy Extreme测试中,ROG STRIX RTX3060 O12G GAMING的分数与RTX 2070追评,整体来看三款显卡的分数都在同一档位上。
3D MARK 光追测试
PortRoyal是3DMARK中专门针对光追性能的测试项,ROG STRIX RTX3060 O12G GAMING的成绩相较RTX 2070的成绩低2%,同时要比RTX 3060 Ti的成绩低32%,不过相较RTX 2060的成绩提升更明显,达到39%。
在理论测试中,ROG STRIX RTX3060 O12G GAMING可以明显看出性能与上一代RTX 2070相仿,而相比上一代与之对应的型号RTX 2060,综合提升约为20-25%左右。
另外由于芯片体质不同,RTX 3060与本代产品RTX 3060 Ti的分数相差较大,而两者的差价为500元,具体的取舍还需要玩家自行定夺。
图片说明
图片说明
当然作为ROG STRIX系列产品1882MHz的频率显然不够,用户可以去华硕官网下载GPU Tweak II软件,在软件中会内置三种工作模式,默认情况下为游戏模式,也就是我们拿到手的1882MHz频率,在点击超频模式后,显卡会变成1912MHz,下面我们再来看看3D MARK跑分的变化。
FS套餐超频前后对比
TS套餐超频前后对比
光追性能测试
在超频测试中,我们去掉过多的干扰项,直接以RTX 3060和ROG STRIX RTX3060 O12G GAMING默认的跑分进行对比。可以看到在超频后的成绩均比默认频率的成绩提升1%左右,对比公版成绩整体提升2%左右。当然软件中提供的超频模式仍然是比较保守的性能提升,是在安全稳定的基础上将频率提升,对于新手来说非常合适。
不过在下面的游戏测试中我们仍以显卡默认的1882MHz来进行测试,毕竟超频后的1912MHz并不属于典型值,可能GPU Tweak II软件大家都不回去下载,更别说超频了。
04 游戏性能测试
在游戏性能测试中,我们选择了《德军总部新血脉》、《孤岛惊魂5》、《刺客信条:英灵殿》、《无主之地》,国产游戏《光明记忆:无限》的benchmark跑分软件。
另外在游戏测试中,由于显卡驱动的版本更新和游戏更新非常影响游戏帧数,所有benchmark跑分成绩均以本次成绩为准。
《刺客信条:英灵殿》游戏测试
首先我们来看看号称众生平等的刺客信条,游戏选择推出不久的《刺客信条:英灵殿》,在实测中我们发现虽然理论成绩测试RTX 2070要强上一些,但实际到游戏中的分数基本与RTX 3060吻合,相差不过1帧,甚至有时候能追评RTX 2070。
《德军总部新血脉》游戏测试
《德军总部新血脉》并且由于自带两个benchmark,所以我们的数据取跑分均值,另外这款游戏几乎每更新一次驱动或者游戏版本升级都会导致分数的巨大差异,在几个月前的跑分要高出现在平均30帧左右。不过在整体分数都降低的情况下也要比英灵殿高很多,即使在2K分辨率下也要比英灵殿1080P分辨率的帧数高。
《孤岛惊魂5》游戏测试
《孤岛惊魂5》同样算是优化比较到位的3A大作,ROG STRIX RTX3060 O12G GAMING作为RTX 30系的入门级显卡,在2K分辨率下也能做到64帧的流畅运行。另外这款游戏也有明显的跑分降低情况,不知道是否和NVIDIA调整驱动有关。
《光明记忆:无限》游戏测试
《光明记忆:无限》是由飞燕群岛工作室开发的《光明记忆》新系列,所有测试成绩均为“RTX 最高/DLSS 质量”模式下进行。由于这个演示demo涵盖了大量复杂的光追元素,很少有显卡能在4K分辨率下流畅运行,这次三款显卡的跑分插值都在1帧左右,区别不大。
《无主之地3》
《无主之地3》是一款采用了卡通渲染风格的游戏。虽然画风较卡通,但对于显卡的要求却比较高,比英灵殿甚至更吃配置。目前ROG STRIX RTX3060 O12G GAMING只有在1080P分辨率下,可以稳定流畅运行。
05 温度与功耗测试
在温度功耗测试方面,室温24℃,我们并没有采用全封闭式的机箱,而是采用测试平台的方法,这样做可以最大限度的保证显卡除了自身散热外将风道等外因减小到最低。
功耗测试(点击查看大图)
功耗测试中,我们选择FurMark软件进行拷机测试,功耗仅计算显卡自身。作为一款入门级显卡ROG STRIX RTX3060 O12G GAMING的功耗满载仅为150W左右,建议搭配650W及以上电源。
温度测试
温度方面,本次的ROG STRIX RTX3060 O12G GAMING经过15分钟左右的拷机,温度稳定为55℃左右,当然这要归功于两方面,首先是RTX 3060的低功耗和ROG出色的散热设计方案。
06 部分游戏光追及DLSS效果展示
上面我们测试了部分游戏的光追和DLSS性能表现,这些效果具体在游戏中是什么表现,下边笔者选择了两款游戏给大家展示一下。
《赛博朋克2077》RTX ON(点击查看大图)
《赛博朋克2077》RTX OFF(点击查看大图)
在《赛博朋克2077》中,光追效果随处可见,而在游戏中也运用到了不同的光追效果,包括最常见的光追反射、阴影,还有环境光遮蔽、漫反射照明以及全局光照等比较高级的效果。
《堡垒之夜》RTX ON(点击查看大图)
《堡垒之夜》RTX OFF(点击查看大图)
堡垒之夜的光追效果还是比较明显的,其中加入了反射、全局照明和路径追踪等效果。卡车车身上的反射较为明显,角色身上的环境光在打开光追后更为写实,另外仔细看的话远处建筑物的玻璃同样有光线的反射,整体画质改善非常明显。
《魔兽世界9.0》RTX ON(点击查看大图)
《魔兽世界9.0》RTX OFF(点击查看大图)
《魔兽世界9.0》同样作为一款卡通渲染的网游来说,魔兽的年代更加久远,此次加入光追效果在整体视觉上没有堡垒之夜明显。不过如远处的树木阴影,以及近处石台下方的阴影都比较明显。
《控制》RTX ON(点击查看大图)
《控制》RTX OFF(点击查看大图)
《控制》这款游戏所采用的引擎物理效果非常出色,同时光追开关的对比也是肉眼可见的明显。包括玻璃上的人物反光,远处地面的植物反光都比较清晰,同时打开光追后屋顶处的明暗对比也更加明显。
DLSS模式对比
DLSS的对比测试我们选择《赛博朋克2077》这款游戏,2K/RTX ON/DLSS关闭 原生画质下作为标准,在打开DLSS质量模式后可以看到整体画面几乎没有任何变化,广告牌的字样边缘依然很清晰。在DLSS平衡和DLSS性能模式中依然有着不错的状态,整体相较原生画质并无二致。
07 软硬兼施 铸就Ampere
好的硬件没有软件的加持,相当于空有长柄没有枪头,想要发挥十成威力则必须软硬搭配,反之亦然。此次随着发布会共同推出的还有以下几项非常值得大家关注。
NVIDIA Reflex
以往我们关注延迟大多从显示器上了解到几毫秒极速响应,但那只是作为最终端的显示输出效果,你是否想过从系统内部到实际看到的画面有多大延迟?
NVIDIA Reflex
在20系显卡中NVIDIA反复提及的“帧能赢”,在30系显卡中也做了更进一步的突破,除了NVIDIA将推出自己的电竞显示器NVIDIA 360Hz G-SYNC ESPORTS,还有NVIDIA Reflex技术。
以往如果想测量系统延迟需要高速相机以及定制的LED鼠标电路。而使用带有NVIDIA Reflex技术的显示器将内置精确的延迟分析工具,可在CPU和GPU中优化渲染管道,极大减少延迟时间,将系统延迟整体降低至30ms以下。不过就像图中所示,为此你需要一个支持反射延迟分析的鼠标。
NVIDIA Broadcast
NVIDIA Broadcast是一款易用且专业的直播软件,它的强大之处就在于主播不再需要任何的背景布置,只需要一个普通的摄像头和一张GeForce RTX系列的显卡即可。
宠物派对直播
这款软件可以让你杂乱无章的房间立即变成直播间,其内置了音频降噪、背景虚化、虚拟背景、头部追踪等功能。NVIDIA Broadcast的工作原理是利用AI算法通过DGX超级计算机深度学习而来。
NVENC编码
同时RTX 30系显卡拥有目前最好的硬件解码器,大部分用户的电脑在直播时打开OBS推流后CPU占用会直接飙升到50%左右,而基于GPU的NVENC解码可以极大地减轻CPU负担。
NVIDIA Studio
对于内容创作者来说,提到软件可能大部分只会想到内容创作的相关软件,但NVIDIA专为内容创作者推出的NVIDIA Studio驱动则是承担着连接创作软件和显卡功能的关键。
NVIDIA Studio
NVIDIA Studio驱动经过更新与优化,对于最新版本的Adobe系列软件支持更为稳定,同时附带更出彩的创作功能。利用NVIDIA CUDA技术,GPU加速特效可实现更快的实时视频编辑并加速渲染输出,并让原本只能进行软件编码输出的视频轻松得到硬件的支持。另外在AI计算方面的优势,包括自动标记片段、特效追踪和人脸识别等功能,都有显著的速度提升。
以GPU渲染为14.98秒 而CPU渲染为11分钟
当然NVIDIA Studio的加速创作绝不止Adobe一家,DaVinci、Keyshot、Blender、D5等专业软件中都有非常亮眼的表现。不仅能提供强大且稳定的运行环境,更能以GPU加速,有效提升创作效率。
08 工匠之力 信仰典范
ROG STRIX RTX3060 O12G GAMING作为“出身名门”的猛禽系列,在此次RTX 30系显卡中完成了完美升级,经历外观重做后,ROG STRIX系列将金属与塑料交错拼接,形成不纹理图案,简单的材质却展现出了令人惊叹的质感,多线条的面积分割让本身体积很大这一缺陷更具有立体感,不得不说工业设计满分。
ROG STRIX RTX3060 O12G GAMING
在细节方面,作为ROG的旗舰系列没有马虎,在显卡的边缘部分同样点缀了小的铭牌,与整体设计相呼应,层次和立体感更强。
这里顺便再提及一下华硕的全超冷概念,ROG STRIX是华硕旗下的猛禽系列,生产过程采用全自动化将元器件精准焊接在PCB上,并经过144小时的持续测试,最终才得以出厂进行售卖。
ROG STRIX RTX3060 O12G GAMING
全就是指的全自动化制程,通过全自动化生产,降低传统人工生产线的不确定性,确保显卡拥有一致高稳定性的同时,提升显卡使用寿命。
超就是指的超合金供电,华硕独家的超合金供电在整个散热效果上会比普通供电提升一倍。
冷就是冷静散热了,上面所说的散热器增大和新的风扇都是算是这部分的东西,而且华硕为了获取更好的散热效果会不惜采用较为昂贵的制程,比如镜面铜制程。所以在温度的控制上,ROG STRIX RTX3060 O12G GAMING显卡才能做到如此出色。
ROG STRIX RTX3060 O12G GAMING
在性能方面,RTX 3060这款显卡由于芯片型号所限,相较RTX 3060 Ti有较大幅度的差距。不过对比上一代的RTX 2060提升明显,并且价格相同,可以达到中端显卡RTX 2070的水准。ROG STRIX RTX3060 O12G GAMING还拥有比公版1777MHz更高的1882MHz频率,在部分测试内容中甚至能追评或超过RTX 2070。
ROG STRIX RTX3060 O12G GAMING
虽然同样作为入门级显卡,但RTX 3060相比RTX 2060,采用了全新的NVIDIA Ampere架构,拥有更纯熟的第二代RT Core和第三代Tensor Core,在光线追踪和AI学习方面都有不同程度加强,对于目前的游戏将会有着更好的性能表现。
ROG STRIX RTX3060 O12G GAMING
最后关于购买方面,此次RTX 3060的解禁时间为2月25日,各个品牌的售卖时间为2月26日。鉴于此前一直被玩家诟病的矿老板抢购显卡情况,此次NVIDIA也是直接限制了RTX 3060的哈希率,导致挖矿效率的下降,相信更多玩家也能不加价买到自己心仪的显卡。
产品图片 (16张)
官方图
官方图
官方图
评测图解
评测图解
评测图解
评测图解
评测图解
评测图解
评测图解
评测图解
评测图解
评测图解
评测图解
评测图解
评测图解
距离GeForce RTX 30系显卡发布已经过去了9个月,但在人们的记忆中发布会仿佛仍在昨天,在这半年多的时间中,RTX 30系显卡也在不断迭代,今天给大家带来的是华硕TUF RTX 3070 Ti O8G GAMING显卡的评测。
华硕TUF-RTX3070TI-O8G-GAMING
电商报价¥7199¥6599
给大家造成显卡仍发布不久的假象,主要是因为芯片荒而导致的全球性显卡缺货,加上矿潮的影响。第一是因为发布半年多大家却买不到卡,第二是因为总有热点话题来勾起大家的记忆,久而久之玩家对于GeForce RTX 30系显卡的印象还是那个未发布的新显卡。
华硕TUF RTX 3070 Ti O8G GAMING
不过NVIDIA对于芯片荒虽然无可奈何,但对于加密货币挖矿已经采取了积极地应对措施,根据NVIDIA此前的官方博客说明,这批显卡已经限制了以太坊的算力。另外GeForce RTX 3070 Ti这一批的非公版显卡,在包装上不会有任何限制算力的标注,“Lite Hash Rate”或者“LHR”的说明只针对已经发售的显卡,后续为了方便区分才会在包装上进行标注。
对于目前挖矿热潮,不光NVIDIA大力出手,政府也开始重点监管,在5月25日“挖矿重灾区”内蒙古已经颁布了八项措施严厉打击挖矿,相关文章可以翻看我们之前的消息,这里不过多讲解了:内蒙古八大措施禁止挖矿 警惕矿卡回流。另外我们也有相关文章来教大家如何简单鉴别矿卡:矿难来临时矿卡能买么? 警惕妹子自用显卡。
华硕TUF RTX 3070 Ti O8G GAMING
GeForce RTX 3070 Ti是台北电脑展上发布的第二款显卡,它的解禁也标志着目前GeForce RTX 30系显卡“Ti家族”在游戏卡方面全部补齐。当然也不排除目前的卡皇GeForce RTX 3090会推出Ti系列,但个人认为对于内容创作领域,它已经表现得足够强悍。
华硕作为信仰梯队的代表“人物”,其产品一直受到各界用户的关注,所以今天我们就来看看这款华硕TUF RTX 3070 Ti O8G GAMING的性能到底如何在评测开始前,笔者先将这款显卡的特点列出方便大家阅读:
包装及显卡保护非常到位
优质做工 质感出色
DP1.4a*3 HDMI 2.1*2的5接口设计
华硕TUF RTX 3070 Ti O8G GAMING
总的来说,其实华硕TUF RTX 3070 Ti O8G GAMING在其家族系列中属于非常具有性价比的代表,性能方面与公版并无二致,但散热及做工更加精致,尤其是视频输出接口部位,双HDMI 2.1的设计,几乎在任何其他家显卡上都不曾看到,最主要的这还是华硕的平价卡。在性能方面,华硕TUF RTX 3070 Ti O8G GAMING相较原型卡的性能提升约为7%,不算很大,但也填充了RTX 3070与RTX 3080之间的空白。
01 GA104核心的第二张显卡
在核心架构上,GeForce RTX 3070 Ti是采用GA104核心的第二张卡,官方白皮书上对比的对象为GeForce RTX 2070 SUPER,相较于上一代的NVIDIA Turing架构,NVIDIA Ampere架构下的GeForce RTX 3070 Ti每个时钟执行2次着色器运算,而Turing为1次,RTX 3070 Ti的着色器性能达到22 TFLOPS单精度性能,而Turing为9 TFLOPS。
新老两代显卡算力对比
NVIDIA Ampere架构翻倍了光线与三角形的相交吞吐量,RT Core达到42 RT TFLOPS,而Turing为24 RT TFLOPS。而且第二代光线追踪最重要的不仅仅是性能提升,还增加了对游戏中运动模糊部分场景的光线追踪计算加速。
第三代Tensor Core可自动识别并消除不太重要的DNN权重,处理稀疏网络的速率是Turing的两倍,算力高达174 Tensor TFLOPS,而Turing为72 Tensor TFLOPS。
GeForce RTX 3070 Ti采用了GA104核心,与GeForce RTX 3070相同,不过NVIDIA官方并没有给出GA104核心架构图,我们仍以GA102来做讲解。
完整的GA102核心
完整的GA102 GPU包含7个GPC(图形处理集群)42个TPC(纹理处理集群)以及84个SM(流处理器)组成,而GeForce RTX 3070 Ti的CUDA数量是6144个,共有48个SM单元,也就是3个GPC 24个TPC,而刚刚发布的GeForce RTX 3080 Ti共有40个TPC 80个SM单元,这也是两款芯片的差距所在。
公版显卡参数表
为了查询方便,笔者将这几款显卡的核心参数列出,可以看到GeForce RTX 3070与GeForce RTX 3070 Ti的差距不大,相差的两个SM单元,和刚刚发布的GeForce RTX 3080 Ti情况基本相同,也就是1组TPC,256个CUDA。只不过GeForce RTX 3080 Ti更接近GeForce RTX 3090,而根据参数来看GeForce RTX 3070 Ti与GeForce RTX 3080还有一定差距。
GDDR6X
另外GeForce RTX 3070 Ti的显存虽然依旧是8GB,但已经由GDDR6更换为GDDR6X,两者的区别主要在于频率和带宽上,同频下实现更高的显存带宽可以降低成本和功耗,另外在相同时间内GDDR6X可以比GDDR6传输多2倍的数据。这对于需要大量数据负载的工作尤为重要,如光线追踪的游戏、AI学习和8K视频渲染。
02 NVIDIA Ampere架构GA104解析
GeForce RTX 3070 Ti采用了GA104核心,拥有174亿(17400 million)个晶体管,392平方毫米的面积,基于三星的8nm NVIDIA定制工艺,来自Micron的GDDR6X显存,这里与GeForce RTX 3070的GDDR6有所区别。
本次NVIDIA Ampere的SM在Turing基础上增加了一倍的FP32运算单元,这使得每个SM的FP32运算单元数量提高了一倍,同时吞吐量也就变为了一倍。
而通常我们计算显卡的CUDA数量,并不是把SM中的所有单元加起来计数,而是只统计FP32单元的数量,所以这样一来,SM中的【FP32 : INT32】 从 1:1 变为 2:1。
GeForce RTX 3070 Ti共有6144个CUDA,其实它有3072个INT32单元,但由于内部的FP32数量翻了一倍,所以最终实现了6144的CUDA数量。
而这样粗暴的提升CUDA数量对于游戏其实有着非常大的帮助,通常在游戏中浮点运算相比整数计算要常用的多,图形、算法以及各种计算操作中着色器工作负载通常需要混合使用FP32算数指令,而FP32的加速也有助于光线追踪降噪着色器。
在去年与GeForce RTX 30系显卡一同发布的还有一项新技术——RTX IO。目前很多游戏动辄几十G甚至百G的安装空间,对于存储空间的负担暂且不提,但存放在硬盘中的数据,如果显卡想要读取到,需要先由CPU从硬盘中读取压缩过的数据,经过解压缩再发送到显存中。
虽然随着NVMe SSD的推出,读取速度相较机械硬盘能够快20倍,但受制于传统I/O限制,NVMe高达7GB/秒的高速读写对于CPU是极大的负担。
传统的数据交换
在这个过程中,会占用多个CPU核心,压力急剧增大,占用较多的内存,而此时其实GPU是处于闲置状态的。RTX IO的作用就是越过CPU解压再传输数据这一步,直接从PCIE总线读取硬盘上经过压缩的数据,并且完成无损GPU解压,降低CPU占用,变向提升了性能。
RTX IO可以极大解放CPU负担
当然这项技术作为系统底层的运行方式改变,还需要借助微软发布的DirectStorage来实现,对于目前容量的游戏来说,RTX IO的改善效果有限,但假以时日等游戏容量上百G成为常态的时候,这项技术将会发挥巨大的功效。
同时搭配新增的HDMI 2.1接口,可以支持单线8K的视频输出,而上一代HDMI 2.0仅支持4K 98Hz的视频输出,如果想要连接8K电视,则需要更多的线缆支持。
03 华硕 TUF RTX 3070 Ti O8G GAMING外观
首先还是来看一下外观,华硕TUF属于旗下电竞特工系列,其特点是极简和军工风格的外观,不过在本次拆开显卡包装时笔者还发现了不少显卡之外的细节。
防伪胶带及包装盒上的logo印纹
比如你很少在显卡包装盒上见到防伪胶带,很少看到显卡的黑色的硬包装盒上会有logo印纹,很少见到防静电袋内的显卡还有正反两层膜要撕。这些都是出自华硕旗下平价显卡TUF系列上的,有人说这叫羊毛出在羊身上,但在显卡首发时华硕的TUF系列大部分都是最平价的那一拨,况且还有很多其他品牌的高端产品同样没有这些。
华硕TUF RTX 3070 Ti O8G GAMING
题外话扯完我们来看看显卡本身,华硕TUF RTX 3070 Ti O8G GAMING的外观依旧与GeForce RTX 30系其他产品相同,采用了金属拉丝及磨砂工艺,同时增大了导流罩的镂空面积,灰黑色的全铝导流罩除了美观外对于散热也有一定帮助。
华硕TUF RTX 3070 Ti O8G GAMING显卡的尺寸约为300×127×52mm,占用约2.7槽的的空间,对比目前所有的RTX 30系显卡算是比较轻薄的。
华硕TUF RTX 3070 Ti O8G GAMING风扇
另外在散热方面,华硕TUF RTX 3070 Ti O8G GAMING三个风扇均采用全高阻隔环,大幅提升静压,加上正逆转工作设计,有效减少空气乱流,提高散热效率,为全新的散热模组提供了强大的气流。
华硕TUF RTX 3070 Ti O8G GAMING背板
背板方面,华硕TUF RTX 3070 Ti O8G GAMING显卡有大面积镂空设计,芯片位置便于发热量大的元器件散热,而尾部的镂空部分,可让正面风扇吹透散热鳍片,已达到迅速散热的效果。
华硕TUF RTX 3070 Ti O8G GAMING视频接口
在视频输出接口上,共有DP1.4a*3 HDMI 2.1*2的5个接口,给用户提供了丰富的扩展空间。另外由于新的HDMI 2.1协议,最高已可支持单线8K的视频输出。
华硕TUF RTX 3070 Ti O8G GAMING供电接口
供电接口部分,虽然华硕TUF RTX 3070 Ti O8G GAMING显卡采用8 8pin的传统供电方案,经过我们的实测,满载功耗为280W左右,建议搭配750W及以上电源,另外在供电接口下方还有两个故障指示灯,如果在未接入供电或有故障时,红色指示灯会亮起,而正常接入时红灯熄灭。
华硕TUF RTX 3070 Ti O8G GAMING BIOS切换拨片
接口左侧为BIOS切换拨片,“P MODE”为performance性能模式,可提供更高的风扇转速来快速降温,而“Q MODE”为quiet安静模式,运行起来噪音会更低,但相应的温度会有所升高,用户拿到显卡后默认为“P MODE”。
04 3DMARK 理论性能测试
首先介绍一下测试平台,为了保证此次评测能够发挥华硕TUF RTX 3070 Ti O8G GAMING显卡的最佳性能,主板和CPU采用了目前桌面旗舰级配置,具体如下:
在测试成绩上,基准测试采用3DMARK,游戏性能测试使用游戏自带Benchmark,同时为了减小误差,每项测试成绩均测试3遍取平均值。
GPU-Z参数
首先看一下GPU-Z的参数,华硕TUF RTX 3070 Ti O8G GAMING采用GA104核心,三星8nm工艺,芯片面积392平方毫米,拥有6144个CUDA,1770MHz频率。采用8GB GDDR6X显存,位宽为256bit,显存带宽达到了608.3 GB/s,光栅单元和纹理单元为96和192。
下面先进行的是用来衡量显卡DX11理论性能的3DMARK FS套装:FS,FSE,FSU三者分别对应显卡在1080P、2K、4K的理论性能,取显卡分数实际测试结果如下:
3D MARK FS套装测试
在针对显卡DX11性能的3DMARK FS套装测试中,我们选择了上代和本代的4张显卡进行分值对比,以便能更好的反应参测显卡的性能水平。
可以看到华硕TUF RTX 3070 Ti O8G GAMING的性能更接近GeForce RTX 3070,对比提升8%左右;对比GeForce RTX 3080的差距为18%左右;相比上一代的GeForce RTX 2070 SUPER提升44%左右。
3D MARK TS套装测试
而在针对DX12环境下的Time Spy和Time Spy Extreme测试中,华硕TUF RTX 3070 Ti O8G GAMING的分数提升稍弱,相比GeForce RTX 3070提升7%左右。而对比GeForce RTX 3080的分数差距为23%左右;对比上一代GeForce RTX 2070 SUPER的分数要高出49%左右。
3D MARK 光追测试
PortRoyal是3DMARK中专门针对光追性能的测试项,在这组测试中华硕TUF RTX 3070 Ti O8G GAMING的表现更贴近GeForce RTX 3070,分数提升为7%左右;对比GeForce RTX 3080的分数差距为31%左右;对比上一代GeForce RTX 2070 SUPER的分数提升则非常大,约为50%。
这是比较理想的等差数列
另外我们对比了一组比较有意思的数据,综合来看目前GeForce RTX 30系显卡性能,形成等差数列的游戏卡型号分别为RTX 3060、RTX 3060 Ti、RTX 3070 Ti以及RTX 3080,所以个人来看GeForce RTX 3070与GeForce RTX 3070 Ti的型号会有些许冲突,不知道NVIDIA后续是否会有停产GeForce RTX 3070的打算。
05 游戏性能测试
在游戏性能测试中,我们选择了《德军总部新血脉》、《孤岛惊魂5》、《刺客信条:英灵殿》、《无主之地》,国产游戏《边境》、《光明记忆:无限》的benchmark跑分软件。
另外在游戏测试中,由于显卡驱动的版本更新和游戏更新非常影响游戏帧数,所有benchmark跑分成绩均以本次成绩为准。
《刺客信条:英灵殿》游戏测试
在游戏实测中可以看到华硕TUF RTX 3070 Ti O8G GAMING和GeForce RTX 3070的帧数差距并不明显,平均下来为3%左右。而对比GeForce RTX 3080的分数差距整体在10%左右。
《德军总部新血脉》游戏测试
《德军总部新血脉》并且由于自带两个benchmark,所以我们的数据取跑分均值,另外这款游戏几乎每更新一次驱动或者游戏版本升级都会导致分数的巨大差异,在本次重新测试中,华硕TUF RTX 3070 Ti O8G GAMING与GeForce RTX 3070的差距约为4%,而相比GeForce RTX 3080的帧数差距为12%左右。
不难发现在1080P分辨率下三款显卡差距很小,其实在低分辨率下CPU已经限制了显卡的发挥,而在4K分辨率下GeForce RTX 3080能领先华硕TUF RTX 3070 Ti O8G GAMING约22%的帧数。
《无主之地3》游戏测试
《无主之地3》是一款采用了卡通渲染风格的游戏,它对于性能要求的下限很低而上限又很高,并且这款游戏的跑分也很符合三款显卡的性能规律,其中华硕TUF RTX 3070 Ti O8G GAMING相比GeForce RTX 3070提升为7%;相比GeForce RTX 3080的分数差距为25%。
《光明记忆:无限》游戏测试
《光明记忆:无限》是由飞燕群岛工作室开发的《光明记忆》新系列,目前还没有游戏提供试玩,不过benchmark的跑分软件官方已经提供,玩家可以在steam上自行下载。
另外我们在测试的时候由于无法关闭光追选项,故所有测试成绩均为“RTX 最高/DLSS 质量”模式下进行。整体的分数分布情况与《无主之地3》非常相似,但在有光追的游戏中,10GB显存的GeForce RTX 3080相比华硕TUF RTX 3070 Ti O8G GAMING的8GB显存更有优势。
《边境》游戏测试
在另外一款国产游戏《边境》的跑分软件中,情况基本与《光明记忆:无限》相同,测试条件均在“RTX最高/DLSS质量”下进行。
《孤岛惊魂5》游戏测试
《孤岛惊魂5》同样算是优化比较到位的3A大作,在这款游戏中CPU的瓶颈更加明显,1080P分辨率下两款显卡的成绩几乎相同,在2K和4K分辨率下比较能反应真实水平。
06 功耗及温度测试
功耗测试中,我们选择FurMark软件进行拷机测试,并采用GPU-Z检测温度,功耗仅计算显卡自身。
功耗测试(点击查看大图)
华硕TUF RTX 3070 Ti O8G GAMING经过我们的实测在满载状态下单卡功耗为280W左右,建议搭配750W及以上电源。
华硕TUF RTX 3070 Ti O8G GAMING
温度方面,本次的华硕TUF RTX 3070 Ti O8G GAMING经过15分钟左右的拷机,温度稳定为65℃左右,相比公版降低了13℃,显存温度为84℃左右。
07 部分游戏光追及DLSS效果展示
上面我们测试了部分游戏的光追和DLSS性能表现,这些效果具体在游戏中是什么表现,下边笔者选择了两款游戏给大家展示一下。
《赛博朋克2077》RTX ON(点击查看大图)
《赛博朋克2077》RTX OFF(点击查看大图)
在《赛博朋克2077》中,光追效果随处可见,而在游戏中也运用到了不同的光追效果,包括最常见的光追反射、阴影,还有环境光遮蔽、漫反射照明以及全局光照等比较高级的效果。
RTX ON(点击图片查看大图)
RTX OFF(点击图片查看大图)
在网游《逆水寒》中,由于光追效果正处于试验阶段,并没有如宣传片一样的水面反射。但画面整体的阴影更加真实,如头顶树木的阴影,以及水面上荷叶的效果。而且由于光追效果较少,在打开该功能后帧数并没有明显下降。
《堡垒之夜》RTX ON(点击查看大图)
《堡垒之夜》RTX OFF(点击查看大图)
堡垒之夜的光追效果还是比较明显的,其中加入了反射、全局照明和路径追踪等效果。卡车车身上的反射较为明显,角色身上的环境光在打开光追后更为写实,另外仔细看的话远处建筑物的玻璃同样有光线的反射,整体画质改善非常明显。
《魔兽世界9.0》RTX ON(点击查看大图)
《魔兽世界9.0》RTX OFF(点击查看大图)
《魔兽世界9.0》同样作为一款卡通渲染的网游来说,魔兽的年代更加久远,此次加入光追效果在整体视觉上没有堡垒之夜明显。不过如远处的树木阴影,以及近处石台下方的阴影都比较明显。
《控制》RTX ON(点击查看大图)
《控制》RTX OFF(点击查看大图)
《控制》这款游戏所采用的引擎物理效果非常出色,同时光追开关的对比也是肉眼可见的明显。包括玻璃上的人物反光,远处地面的植物反光都比较清晰,同时打开光追后屋顶处的明暗对比也更加明显。
《赛博朋克2077》DLSS模式对比
DLSS的对比测试我们选择《赛博朋克2077》这款游戏,2K/RTX ON/DLSS关闭 原生画质下作为标准,在打开DLSS质量模式后可以看到整体画面几乎没有任何变化,广告牌的字样边缘依然很清晰。在DLSS平衡和DLSS性能模式中依然有着不错的状态,整体相较原生画质并无二致。
《逆水寒》DLSS模式对比
画质说明
在《逆水寒》的DLSS测试中,我们将画面设置为4K分辨率,画质为预设最高。通过关闭、快速、超级性能,3种不同模式来进行帧数以及画面的对比。
首先在关闭DLSS中,游戏帧数为26帧原生画质,打开DLSS快速模式后为41帧,而打开DLSS超级性能模式后为57帧。通过放大图片不难发现原生画质和DLSS快速模式的区别很小,而DLSS超级性能模式中角色背后的装饰会变模糊,以及木条箱的纹理边界会有较明显变化。但帧数提升却非常明显。
08 软硬兼施 铸就Ampere
好的硬件没有软件的加持,相当于空有长柄没有枪头,想要发挥十成威力则必须软硬搭配,反之亦然。此次随着发布会共同推出的还有以下几项非常值得大家关注。
NVIDIA Reflex
以往我们关注延迟大多从显示器上了解到几毫秒极速响应,但那只是作为最终端的显示输出效果,你是否想过从系统内部到实际看到的画面有多大延迟?
NVIDIA Reflex
在20系显卡中NVIDIA反复提及的“帧能赢”,在30系显卡中也做了更进一步的突破,除了NVIDIA将推出自己的电竞显示器NVIDIA 360Hz G-SYNC ESPORTS,还有NVIDIA Reflex技术。
以往如果想测量系统延迟需要高速相机以及定制的LED鼠标电路。而使用带有NVIDIA Reflex技术的显示器将内置精确的延迟分析工具,可在CPU和GPU中优化渲染管道,极大减少延迟时间,将系统延迟整体降低至30ms以下。不过就像图中所示,为此你需要一个支持反射延迟分析的鼠标。
NVIDIA Broadcast
NVIDIA Broadcast是一款易用且专业的直播软件,它的强大之处就在于主播不再需要任何的背景布置,只需要一个普通的摄像头和一张GeForce RTX系列的显卡即可。
宠物派对直播
这款软件可以让你杂乱无章的房间立即变成直播间,其内置了音频降噪、背景虚化、虚拟背景、头部追踪等功能。NVIDIA Broadcast的工作原理是利用AI算法通过DGX超级计算机深度学习而来。
NVENC编码
同时RTX 30系显卡拥有目前最好的硬件解码器,大部分用户的电脑在直播时打开OBS推流后CPU占用会直接飙升到50%左右,而基于GPU的NVENC解码可以极大地减轻CPU负担。
NVIDIA Studio
对于内容创作者来说,提到软件可能大部分只会想到内容创作的相关软件,但NVIDIA专为内容创作者推出的NVIDIA Studio驱动则是承担着连接创作软件和显卡功能的关键。
NVIDIA Studio
NVIDIA Studio驱动经过更新与优化,对于最新版本的Adobe系列软件支持更为稳定,同时附带更出彩的创作功能。利用NVIDIA CUDA技术,GPU加速特效可实现更快的实时视频编辑并加速渲染输出,并让原本只能进行软件编码输出的视频轻松得到硬件的支持。另外在AI计算方面的优势,包括自动标记片段、特效追踪和人脸识别等功能,都有显著的速度提升。
以GPU渲染为14.98秒 而CPU渲染为11分钟
当然NVIDIA Studio的加速创作绝不止Adobe一家,DaVinci、Keyshot、Blender、D5等专业软件中都有非常亮眼的表现。不仅能提供强大且稳定的运行环境,更能以GPU加速,有效提升创作效率。
09 顶级信仰源自细节
大家对Ti系列的印象应该是性能飙升、碾压原型号,就像GeForce RTX 3060 Ti和GeForce RTX 3080 Ti一样,但GeForce RTX 3070 Ti的出现却有些例外,相对于GeForce RTX 3070综合提升7%的性能,怎么看都无法驾驭“Ti”这个称号。
华硕TUF RTX 3070 Ti O8G GAMING
但是抛开这些来讲,GeForce RTX 3070 Ti的售价为4499元起,正好位于GeForce RTX 3070和GeForce RTX 3080之间,这是其一;除了内部的性能对比,GeForce RTX 3070 Ti的性能正好横跨于对面RX 6700 XT和RX 6800之间,这是其二。所以综合这两点来看,GeForce RTX 3070 Ti的“身世”还比较复杂。
这是比较理想的等差数列
在性能跑分图中,我们也找到了比较有意思的现象,目前RTX 30系形成等差数列的游戏卡型号分别为RTX 3060、RTX 3060 Ti、RTX 3070 Ti以及RTX 3080,并没有GeForce RTX 3070什么事,所以后续不知道NVIDIA会不会砍掉。
说了半天公版,我们再来看看华硕,可能很多人不理解华硕的信仰在哪里,除了高端炫酷的ROG系列,其实在TUF等平价系列中,也有足够多恐怖的细节。
华硕TUF RTX 3070 Ti O8G GAMING细节特写
首先你很少在显卡包装盒上见到防伪胶带,很少看到显卡的黑色的硬包装盒上会有logo印纹,很少见到防静电袋内的显卡还有正反两层膜要撕。这些都是出自华硕旗下平价显卡TUF系列上的,有人说这叫羊毛出在羊身上,但在首发时华硕的TUF RTX 3080 8G GAMING同样是5499元最便宜的那一拨,况且还有很多其他品牌的高端产品同样没有这些。
华硕TUF RTX 3070 Ti O8G GAMING
今天测试的华硕TUF RTX 3070 Ti O8G GAMING,在性能上和公版并无二致,但满载温度保持了华硕一贯的高水准,拷机15分钟仅65℃;并且搭载了DP1.4a*3 HDMI 2.1*2的5接口设计。
这里顺便再提及一下华硕的全超冷概念,TUF GAMING是华硕旗下的电竞特工系列,生产过程采用全自动化将元器件精准焊接在PCB上,并经过144小时的持续测试,最终才得以出厂进行售卖。
华硕TUF RTX 3070 Ti O8G GAMING
全就是指的全自动化制程,通过全自动化生产,降低传统人工生产线的不确定性,确保显卡拥有一致高稳定性的同时,提升显卡使用寿命。
超就是指的超合金供电,华硕独家的超合金供电在整个散热效果上会比普通供电提升一倍。
华硕TUF RTX 3070 Ti O8G GAMING
冷就是冷静散热了,上面所说的散热器增大和新的风扇都是算是这部分的东西,而且华硕为了获取更好的散热效果会不惜采用较为昂贵的制程,比如镜面铜制程。所以在温度的控制上,华硕TUF RTX 3070 Ti O8G GAMING显卡才能做到如此出色。
这款显卡将在6月10日发售,目前尚不清楚价格,不过按照惯例首发日的价格将会是最低的,所以这一波一定要抢,这里也祝大家都能有好手气。