- 北境漫步
-
驰在30系列中最让人印象深刻的是新推出的星耀系列显卡产品线。从外包装的青春时尚,到显卡别出心裁的透明亚克力外壳设计,都给人一种晶莹剔透的视觉感。追求个性的玩家还可以拆壳定制丰富的DIY绘画,真的让包括笔者在内的很多玩家眼前一亮。
随着RTX 40系列的上市,Galaxy也带来了新一代的Startelecom设计,一体式纯白背板和5V ARGB的加入相信可以弥补很多机友的不足。这次我们入手了Galaxy GeForce RTX 4080 16GB Star Obsolete OC,看看新版Star Obsolete有什么新的实力。
01/阿达洛芙莱斯建筑和RTX 4080
GeForce RTX 4080 16GB显卡采用AD 103-300显示核心,基于TSMC 4N工艺和阿达洛芙莱斯架构核心制造。其芯片面积为378.6平方毫米,晶体管密度为459亿。
其中,阿达洛芙莱斯架构核心配备了全新的第三代RT核心、第四代张量核心和SM。
据英伟达 官方介绍,阿达洛芙莱斯架构Core使用的第三代RT Core,不仅光三角相交性能翻倍,RT-TFLOP峰值性能也翻倍。第三代RT Core还配备了全新的Opacity Micromap 引擎和Displaced Micro-Mesh 引擎,进一步提高了光线追踪计算的性能,降低了计算开销,从而带来更好的光线追踪性能。阿达洛芙莱斯架构核心配备的第四代张量核,引入专业H100数据中心GPU的FP8 Transformer引擎,带来更强大的AI计算能力。
与上一代相比,第三代RT Core的结构图增加了两个功能。
阿达洛芙莱斯架构核心在SM单元中引入了着色器执行重新排序技术,以更好地调度和排序着色器工作。在使用中,可以根据不同的负载需求进行渲染,负载均匀的渲染图像,降低工作成本。
据英伟达 官方介绍,这个SER函数将作为API向开发者开放。Nvidia官方宣称SER功能的加入可以带来高达两倍于RT Core的提升 性能,并且能为追光游戏带来更多的体验升级。据英伟达 官方数据,新的SM可以带来高达两倍的性能和能效升级,升级幅度非常明显。
阿达洛芙莱斯建筑核心SM结构图
除了第三代RT核、第四代张量核和SM的升级,阿达洛芙莱斯架构的核心带来了全新的第八代NVENC双硬件编码器,集成了对AV1视频编码格式的支持,除了可以使用传统的H.264等格式外,在主流新标准AV1的支持下,可以对AV1格式进行编解码,有效提升了生产力的表现,尤其适用于创意用户、游戏主播等群体。根据英伟达官方数据,第八代NVENC双硬件编码器AV1的效率比H.264编码器提升了40%,这种提升非常明显。
除了核心上的升级,阿达洛芙莱斯架构核心还大大改善了其L2缓存。GeForce RTX4080 16GB拥有64MB L2缓存,大容量L2缓存有效提高了数据命中率。目前在显存带宽得到有效提升的情况下,可以通过升级更大的L2缓存来提高数据命中率,提升性能。据英伟达 的官方声明,大L2缓存的加入为一系列GPU操作带来了更高的收益,尤其是在光线追踪等场景中。
RTX 4080 16GB核心架构图
阿达洛芙莱斯架构的一系列升级也带来了新DLSS 3技术的独家使用和NVIDIA Reflex体验的提升。
DLSS 3包包含DLSS 2和新加入的DLSS帧生成技术,依托阿达洛芙莱斯架构的独立光流处理器和张量核的AI计算能力。在运行过程OFA技术中,光流处理器获得一系列数据后,利用光流加速生成画面信息,AI计算能力负责进一步优化画面,从而在游戏中加入更多的帧数,提高帧数。
DLSS 3可以直接生成游戏第一帧和整个游戏第二帧的3/4像素,相当于用1/8的计算能力完成整个计算过程。通过这样的过程循环,可以在节省资源的同时增加帧数,从而进一步带来更好的游戏体验。
在《DLSS 3》的帧生成技术上,可能会增加延迟,所以《DLSS 3》也会集成NVIDIA Reflex技术,减少渲染和操作的延迟。据英伟达 官方说法,DLSS 3通过整合NVIDIA Reflex和一系列技术,可以让游戏体验拥有媲美甚至超越原生水平的渲染和操作体验。
得益于更先进的工艺技术,GeForce RTX 40系列显卡显著提高了晶体管密度和核心频率。此次测试的RTX 4080 16GB的CUDA核心数量已经可以与上一代旗舰机型RTX 3090 Ti相媲美,公版卡实现了高达2.5GHz的加速频率,我们此次测试的Galaxy GeForce RTX 4080星曜OC可以实现一键超频到2.58GHz的加速频率,功耗远低于RTX 3090 Ti。
02/外观拆卸
chi GeForce 4080 16GB OC采用了近乎纯白的设计,配合其水晶透明盖,外观非常独特,带来了非常不错的视觉印象。
Galaxy GeForce RTX 4080 16GB星曜OC采用透明可拆卸上盖,其上盖在外围边缘和风扇周围采用钻石切工造型设计,视觉上呈现出光线折射效果。在封面的大部分区域,Galaxy GeForce RTX 4080 16GB Star曜石OC被调平,方便用户个性化外观。
智GeForce 4080 16GB星耀OC使用的透明上盖,支持拆卸。拆开后会露出纯白的外壳。用户可以通过个性化的DIY设计,打造属于自己的专属外观。
智GeForce RTX 4080 16GB星曜OC在显卡顶部配备了一个logo灯。标志灯支持多种灯光效果,采用多次反射处理,营造出科技感极强的灯光效果。
除了顶部的灯,Chi GeForce RTX 4080 16GB星曜OC在风扇部分还配备了RGB灯,光效可以穿过静霜扇叶。其风扇支持智能启停,风扇转动时能带来更好的视觉效果。Chi GeForce RTX 4080 16GB星曜OC的灯光效果还支持几大厂商的5V RGB灯光同步,并且还配备了 quot负能量 quot检测系统,出现故障时会有不同的照明效果。
银河GeForce RTX 4080 16GB星曜OC配备了集成压铸金属背板。这款背板采用了近乎纯白的设计,观感非常好。这块金属背板可以对显卡起到一定的支撑作用,并且通过尾部的大面积镂空设计,进一步辅助热量有效导出。
chi GeForce RTX 4080 16GB Star Telecom OC三槽宽,配备三个DP 1.4和一个HDMI 2.1输出接口。
智GeForce 4080 16GB星曜OC搭载全新星曜III散热系统。这套散热系统在显卡正面配备了三个直径为102mm的风扇。风机采用11片特殊设计的静霜叶片,可提高风力和风量。
Galaxy GeForce 4080 16GB星耀OC采用的星卓三代散热系统,配备4 * 8mm 5 * 6mm镀镍复合热管,通过大面积的蒸汽室和翅片进一步将热量传导出去。
智GeForce RTX 4080 16GB姚兴OC采用12层高规格PCB,布局进一步优化。在PCB中间,我们可以看到AD 103-300的内核。
智GeForce RTX 4080 16GB星曜OC采用AD 103-300的核心,频率提升至2580 MHz。在核心周围,我们可以看到一圈16GB的GDDR6X内存。
智GeForce 4080 16GB星耀OC配备18相GPU电源和3相显存电源。
Chi GeForce RTX 4080 16GB星曜OC采用了全新的12VHPWR供电接口,可以通过12VHPWR电源线为显卡供电。如果用户使用的是ATX 2.0标准电源,也可以使用附带的12VHPWR转3 * 8针跳线。这款显卡官方推荐是750W及以上,用户要注意。
智GeForce RTX 4080 16GB星曜OC还配备了具有RGB灯光效果的显卡支架,方便用户支撑显卡。
03/基准测试
强大的CPU单核性能对于今天的性能发布非常重要 高端显卡。本次测试我们选择了13代酷睿i5-13600K平台,将大核手动超频至5.7GHz,最大限度降低CPU带来的显卡性能瓶颈。
从GPU-Z可以看出,Galaxy GeForce RTX 4080 16GB星曜OC加速频率为2580MHz,但默认TGP为320W,最大解锁为450W。
在3DMark基准测试中,Galaxy GeForce RTX 4080 16GB姚兴OC的跑分已经全面超越上一代黄卡RTX 3090 Ti,领先幅度甚至超过20%。
在DLSS基准测试中,Galaxy GeForce RTX 4080 16GB星曜OC在DLSS 2模式下4K性能提升159%,在DLSS3模式下提升235%。
04/游戏性能
RTX 4080强大的理论性能有目共睹,接下来就是游戏帧数的考验了。这里,我们首先分别在2K和4K分辨率下测试四款经典游戏。
传统游戏测试
《绝地求生:大逃杀》中,Galaxy GeForce RTX 4080 16GB星曜OC性能如预期超越RTX 3090 Ti,领先幅度约15%。
在其他大部分大型游戏场景中,Galaxy GeForce RTX 4080 16GB星曜OC的性能也稳步超越RTX 3090 Ti,分别领先15-20%。与原生分辨率相比,RTX 4080在DLSS 2模式下的性能提升为30-120%。
除了在2K分辨率的DLSS模式下测试《永劫无间》时,可能是高帧率导致CPU瓶颈,导致显卡不满。相比原生2K,实际帧率性能没有提升,导致不如RTX 3090 Ti的情况。
DLSS 3和反射的特殊测试
接下来,我们将用NVIDIA # 039美国新一代DLSS 3技术,游戏的图像质量将调整到全高。让 让我们来看看这些游戏分别在原生画面、DLSS 2超分辨率和DLSS 3帧生成下的性能和延迟差异。
首先,让 让我们来看看反射低潜伏期功能的作用。《守望先锋 归来》中,G开启反射功能的延迟减少了一半以上,对帧率几乎没有影响。这个功能可以减少DLSS 3 的延迟的补充帧功能,所以打开DLSS 3也会同步打开反射。对于追求更高延迟的玩家来说,使用Reflex Boost可以进一步增强,但是效果没有那么明显,也会造成很小的帧率损失。
在基于Unity的《Enemies》 DLSS 3测试演示中,RTX 4080在4K只能运行到22帧。这种极低帧模式下的帧生成时间很长,所以延迟来到了192 ms,打开DLSS 3后帧率提高了3倍多,延迟降低到了56 ms
同样的情况也出现在《赛博朋克:2077》。原生4K下30帧的平均帧带来了117ms的画面延迟,导致画面卡顿,运行迟缓。但DLSS 3开启后,帧率提升至95帧,延迟49ms,比DLSS 2不开启Reflex时还要低。
同样,在《幻塔》 beta中,由于没有单独开启反射的选项,DLSS 3模式的延迟低于DLSS 2模式。
在赛博主题横版3D游戏《生死轮回》中,DLSS 3实现了近3倍原生分辨率的性能,而延迟控制在仅32 ms
《瘟疫传说:安魂曲》,DLSS 3也带来了超过一倍的原生分辨率,延迟增加不明显。
在755-79000中,RTX 4080在DLSS 3模式下的平均帧数和DLSS 2模式下相差无几,应该已经触及帧率上限,但前者在1%低帧的表现明显提升。
在《暗影火炬城》中,开启了DLSS 3的RTX 4080也具有两倍于原生图像质量的性能和更低的延迟。
在图像质量方面,OBS用于以高比特率记录DLSS和原生图像质量。从下图对比可以看出,DLSS模式的画质甚至比原生分辨率的纹理细节更清晰。
05/生产力表现
除了游戏,现在从游戏主播、内容创作者到视频剪辑、3D建模、渲染等生产力工作,都离不开GPU的性能支持。
在渲染能力方面,我们首先关注Blender Benchmark。在大多数场景中,废品店和教室,Galaxy GeForce RTX 4080 Star Obsidian OC的性能比GeForce RTX 3090 Ti高52%。
同样,在V-Ray 5 Benchmark中,会同时测试GPU CUDA和光线追踪的性能。可以看到,Galaxy GeForce 4080 16GB星耀OC的RTX渲染效率相比GeForce 3090 Ti提升了38%。
在SPECviewperf 2020集成的八项工业软件测试中,Galaxy GeForce RTX 4080 Star曜石OC与RTX 3090 Ti相比也是整体领先。
Octane Render RTX常用于场景建模,尤其是光线追踪开启后,对实时预览性能和渲染输出要求很高,与GPU和GPU的RTX性能直接挂钩。在这个项目中,Galaxy GeForce RTX 4080 Star黑曜石OC的性能比GeForce RTX 3090 Ti提高了30%以上。
视频创作方面,在用达芬奇渲染同样的4K H.265视频的任务中,Galaxy GeForce RTX 4080 16GB星曜OC也比RTX 3090 Ti快20%以上。
同时,GeForce RTX 40系列显卡还首次加入了AV1双编码器。AV1编码是由英特尔、微软、亚马逊、谷歌、网飞等互联网巨头组成的开放多媒体联盟AOMedia推出的免费编码格式,在国内得到了公司和爱奇艺的支持。它的特点是在相同的文件体积下可以有更高的清晰度图像质量,或者在相同的清晰度图像质量下可以有更小的体积。
下图是AV1和AVC的画质对比。
GeForce RTX 40系列显卡是目前市面上为数不多的可以支持硬件AV1渲染加速的GPU。实际渲染结果同样是AV1视频,其效率比纯CPU软件编码高4倍左右。
同时,对于游戏主播来说,GeForce RTX系列显卡支持的播报工具还可以一键实现人像追踪、视频去噪、噪音和回声消除、背景消除/模糊等实用功能。
06/功耗和散热测试
使用Furmark对galaxy GeForce RTX 4080 16GB姚兴OC进行10分钟满负荷压力测试。最终显卡功耗稳定在320W左右,远低于RTX 3090 Ti。不得不感叹这一代显卡的能效确实很强。此时显卡核心温度仅低至61.9,风扇不到1200转,凉爽安静,延续了星耀系列显卡出色的散热水平。
07/摘要
RTX 4080 16GB显卡再次展现了RTX 40系列强大的能效表现。它只是以300W左右的功耗实现了超越上一代旗舰450W功耗的性能,再加上远低于RTX 3090 Ti的售价,绝对会成为4K发烧玩家的新宠。
首批非公开机型中,Galaxy GeForce RTX 4080 16GB姚兴OC继承了上一代的时尚外观 白色透明风格和丰富的DIY空间,并进一步做到了更纯粹的一体白,还配备了更先进的5V ARGB灯光效果,对于热爱白色主题mod的玩家来说几乎是一个完美的选择。
王者之心2点击试玩