最快的 GPU 就一定就是最好的吗?

截至昨天,Nvidia RTX 3090Ti 是世

界上速度最快的游戏 GPU。今天,Nvidia 推出了 GeForce RTX 4090,几乎在各个方面都比其前代产品有了巨大改进。那么,为什么我不更兴奋呢?

事实上,我可以用 Nvidia 所要求的价格买一辆便宜的二手车,除此之外,还有一些其他问题我们需要讨论。

RTX 4090——不仅仅是一次刷新?

塞浦路斯的移动数据 塞浦路斯的主要移动服务 塞浦路斯移动数据 提供商,如 Cyta、Epic 和 PrimeTel,在全国范围内提供可靠的 4G 覆盖。5G 在城市中可用。旅行者经常使用预付费 SIM 卡,因为它们可以轻松访问廉价的数据包,而且价格实惠。虽然大都市地区享有快速可靠的互联网连接,但农村地区可能会遇到定期的连接挑战。

两年前,GeForce RTX 3090 以 从公司博客中获取更多潜在客户的 5 个实用技巧 惊人的 1500 美元的价格推出,而 Nvidia 对此的理由是,它是一款 Titan 级 GPU。当然,现在我们都知道那是胡说八道,因为 Nvidia 仅在六个月前(2022 年 3 月)推出了 RTX 3090 Ti,售价为 2000 美元,规格与价格相比只有很小的提升,而且仍然没有 Titan 级浮点计算功能。

由于 GPU 需求暴跌,这两款显卡的售价目前都在 1000 美元左右,而 AMD 的竞争实际上比这要少一点。RTX 4090 的售价为 1,600 美元。三台 PS5 游戏机的价格能买到什么?

它不是 Titan 级 GPU,并且 VRAM 数量与上一代 RTX 3090 相同,但相似之处仅此而已。不仅内存与 RTX 3090 Ti 上的内存一样快,而且 CUDA 核心数量增加了 50% 以上,每个核心的时钟频率都高出 35% 以上。我的意思是,随便你怎么说,但仅凭这一点,建议零售价仅上涨 7%,即 2020 年以来通货膨胀率的一半,就已经是一次实质性的升级。“真是太便宜了”,如果不是因为它本身的价格,老实说,它仍然是一整台中档游戏电脑的价格,我会这么说。那么这还带来了什么呢?

Nvidia 声称,与即将推出的 Ampere 架构 巴林电话簿 相比,他们的每个 CUDA 核心几乎在所有方面都得到了增强,据称性能提升高达 30 系列的两倍。这在很大程度上要归功于 L1 缓存增加了近一倍,以及核心布局本身的重大变化。此外,还得益于台积电新 N4 工艺的使用,总芯片面积比其前代产品小了近 150 平方毫米。

测试设置以及我们为何不运行 22H2

当然,我们需要测试 Nvidia 的说法,所以我们关掉灯,启动我们闪亮的新插槽 am5 工作台,安装 Windows 11 22H1,然后开始测试。为什么是 22H1?显然 22H2 引入了一些 Nvidia 无法解决的问题。但现在让我们把注意力转向主要事件:游戏。

4K 游戏结果

一开始,与强大的 3090 Ti 相比,即使是传统的光栅性能也非常出色。是的,你没看错。Cyber​​punk 2077 在 4090 上的运行速度比 3090 Ti 快 2.5 倍,最低帧率从不到 50 提高到 100 以上。为了确保万无一失,我们不得不反复检查,但事实确实如此。

我们还发现 Forza Horizo​​n 5 在 4K 分辨率下的最低帧率超过 120,而 3090 Ti 的最低帧率低于 90,而且非常稳定。刺客信条:英灵殿的帧率在 4090 上也飙升了约 50%,从而可以毫不妥协地实现 4K 120 FPS 游戏。请记住,这只是光栅化性能,我们认为 Nvidia 试图通过在新闻材料中展示其 RT 性能来向我们隐藏这一点。

然而,育碧的另一款游戏《孤岛惊魂 6》并没有取得同样的提升,整体提升幅度约为 30% 左右。

不算太差,甚至可以说是完全不差,但看到其他结果后,我简直崩溃了。《古墓丽影:暗影》的改进继续变得更加温和,我们可能会在 4K 分辨率下开始受到 CPU 限制。我先来消化一下。

当我们运行 CS:GO 时,我们再次看到了同样的问题,出于某种奇怪的原因,情况发生了逆转。RTX 3090 Ti 在多次运行中都优于 4090。这尤其令人惊讶,因为 GPU 核心时钟和负载仍然很高。我的意思是,如果你有解释,我很想在评论中看到你的看法。

1440p 游戏结果

将分辨率降低到 1440P,似乎 CPU 受到的限制更大,但至关重要的是,Forza Horizo​​n 5 中的最低帧速率得到了大幅提升,从而带来了更流畅的整体体验。

有趣的是,CS:GO 实际上在 1440P 下恢复正常。所以,我不知道,也许是我们在 4K 下遇到了驱动程序错误之类的。

光线追踪和 DLSS 游戏结果

现在,你还记得赛博朋克的结果吗?那就来看看吧。我们从 3090 Ti 上的平均 25 FPS 提升到了 4090 上惊人的 96 FPS(4K,无 DLSS)。这几乎是性能的四倍。

当我们在更老的《古墓丽影:暗影》中打开光线追踪时,4090 能够将最低 FPS 提高近一倍,而 3090 Ti 的最低 FPS 则能达到这一水平。这使得这款游戏在 4K 分辨率下从 60 FPS 或更高提升到 100 到 120 FPS 的流畅程度,而且完全没有使用 DLSS。

在性能模式下,借助 DLSS,Cyber​​punk 的平均 FPS 为 144 FPS,最低帧率超过 120 FPS 1%。没错,如果您对 DLSS 满意,您可以在此卡上获得流畅的 4K 120 和光线追踪。

DLSS 画质模式下的《古墓丽影:暗影》简直太差劲了。3090 Ti 在 5% 低点时无法达到 90 FPS。4090 的速度足够快,可以轻松驱动 144 赫兹 4K 显示器。

DLSS 3.0 在哪里?

现在,您可能想知道新的 DLSS 3.0,即 Nvidia 的 AI 帧生成技术。我们也想知道。不幸的是,我们所有的显卡,甚至是我们今天不允许向您展示的第三方显卡,都经常崩溃,甚至在多个工作台上也是如此。因此,实验室无法正确测试 DLSS 3.0,我们希望得到比我们得到的更多的光线追踪结果。我们将在后续报道中提供所有缺失的数据,敬请期待。

生产力结果

但是,如果你不是游戏迷怎么办?好吧,你很幸运,因为这个东西也是生产力的猛兽。在 Blender 中,它在怪物和垃圾店场景中每分钟的采样率是原来的两倍多,在旧教室场景中每分钟的采样率接近两倍。这可以节省大量时间,如果你是一名 3D 艺术家,那么它可能物有所值。

类似地,我们的 4K DaVinci Resolve 导出完成速度快了近一分钟,差异约为 25%,而且这个差异还会随着时间的推移而增加,特别是对于具有大量渲染图形效果的时间线而言。

与此同时,SPECviewperf 显示出全面的巨大进步,其中 3ds Max、Maya、Medical 和 Solidworks 的改进最为显著,得分几乎翻了一番。而 Creo 的性能提升只有 10% 左右。不过,这就像是在看一款完全不同级别的 GPU,而不是典型的代际改进。

鉴于所有这些性能提升,如果 Nvidia 还希望卖掉所有挖矿剩余的 3090,那么他们可能不得不将这些产品定价为 1,600 美元。而且这还不是全部。

AV1

许多公司(包括英特尔和苹果)都非常重视的另一个重要生产力部分是视频编码,而 Nvidia 必须证明他们没有在工作中打瞌睡。您不仅可以获得与我们在 DaVinci 解析测试中看到的首次在 RTX 20 系列上亮相的相同高质量编码器,而且您还可以获得两个编码器,它们都支持 AV1。AV1 是一种新的编解码器,可能会接管 YouTube 和 Twitch 等网站上的直播和点播流媒体。虽然它可以在相同的比特率下产生明显更好的视频质量,但除非您有专用的硬件,否则编码会耗费更多时间且难度更大。英特尔 Arc 以它作为主要功能推出,可以肯定的是,随着时间的推移,它会变得越来越重要。

不幸的是,我们现在没有时间对它进行适当的测试以供评测。今天我可以告诉你的是,它的速度几乎与 Nvidia 现有的 H.264 和 H.265 编码器一样快,这非常令人印象深刻。当然,所有这些功能都有一些缺点,其中第一个就是功耗。

功耗

为了达到 Nvidia 为其设定的功率目标,RTX 4090 普遍需要 ATX 3.0 连接器,并在包装​​盒中附带适配器。正如规格所示,我们的 RTX 4090 在游戏负载下消耗的功率几乎与 RTX 3090 Ti 一样多,尽管它确实保持在 425 瓦左右,而不是额定的 450 瓦。这与 RTX 3090 和 6950 XT 形成了鲜明对比,这两款显卡的功耗始终比 RTX 3090 和 6950 XT 低近 100 瓦。这对最终的 RTX 4090 Ti 来说并不是一个好兆头。至少 4080 系列显卡的功率目标较低,尽管我们今天没有任何显卡可以测试。

当我们通过 MSI Kombustor 以更高的负载运行 RTX 4090 时,RTX 4090 和 3090 Ti 的功耗都飙升至红线。不过,奇怪的是,在运行到一半时,功耗下降到 440 左右,这有点奇怪。与此同时,RTX 3090 再次没有超过 350 瓦的门槛,6950 XT 也没有。

热量和时钟稳定性

当然,强大的性能意味着强大的散热能力,RTX 4090 也不例外。游戏时的散热量与功耗大致一致。其巨大的三槽半散热器在游戏时将热点保持在 80 度,尽管功耗很大,但它仍处于 RTX 3090 和 6950 XT 之间。这证明了 Nvidia 的散热器设计。

核心时钟频率显然比任何前一代卡都要高得多,而且至关重要的是,它们在约 2.6 到 2.7 千兆赫的运行过程中保持稳定。

然而,当我们再次查看燃烧室结果时,热点温度与 RTX 3090 Ti 一起超过 80 度阈值,并且我们再次看到运行到一半时温度略有下降。而 3090 则低于 70 度。

4090 的核心时钟频率最终明显较低,约为 2.25 GHz,而 3090 Ti 的核心时钟频率则降至低于其耗电量较小的兄弟产品。

与此同时,我们的 AMD 卡有点像是心跳模式的加速和减速,这可能会导致性能不均匀。

箱体空气温度

值得注意的是,这些测试是在 Corsair 5,000 D Airflow 内部进行的,顶部有 360 毫米散热器,前面有 3 个 120 毫米风扇抽风。因此,我们不会让显卡缺氧,也不会让它们吸入来自 CPU 的热空气。事实上,尽管我们给它们提供了足够的气流,但 RTX 4090 和 3090 Ti 都导致机箱内部空气温度达到 39 到 40 度的高温,RTX 3090 的最低内部温度明显更高,而环境温度都在 21 度左右。

这意味着,如果您的机箱只能勉强处理 3090,那么您将无法管理 4090。抱歉,小型外形爱好者,这款卡不适合您。

一些怪癖……DisplayPort 和 PCI Express

看完这些之后,你可能会看到规格表,并有一些挥之不去的问题,比如“为什么 Nvidia 不支持 PCI Express Gen 5?”和“DisplayPort 2.0 在哪里?”无论你是否喜欢,这两个问题的答案都是 Nvidia 认为你在 1,600 美元的显卡上不需要它们。你闻到了吗?是的,那是 copium 独特的气味。虽然运行整个 16 条 PCI Express Gen 5 通道的 GPU 在今天可能不是很有用,但运行 8 条 Gen 5 通道的 GPU 肯定会很有用,尤其是对于那些也需要大量 NVMe 存储的人来说。对于同类显卡来说,这是一个不错的选择。

请记住,PCI Express 链路越快,在满足相同带宽要求的情况下所需的通道数就越少。Nvidia 应该知道这一点。

至于 DisplayPort 2.0,官方的说法是“DisplayPort 1.0 已经支持 60 赫兹的 8K,消费级显示器暂时不需要更高频率”,这听起来可能很合理,但你意识到 4K 分辨率也只能达到 120 赫兹,而 RTX 4090 的性能水平可以超过这一水平,这一点我们已经看到了。在 DisplayPort 1.4 上获得更高刷新率的唯一方法是使用色度二次采样,但坦率地说,在如此高端的硬件上,这种体验并不理想。

如今,240 赫兹 4K 显示器已经存在,并且很快就会支持 DisplayPort 2.0。Arc 已经支持它,而 RDNA 3 自 5 月起就已确认支持 DisplayPort 2.0。Nvidia 显然又想在 GPU 上省钱,而这款 GPU 的价格相当于 Series X、PS5、Switch 和 Steam Deck 的总和。或者这些卡可能只是准备好了,在仓库里等待的时间比我们想象的要长。令我感到非常有趣的是,第一款可能真正能够运行 8K 游戏而无需星号的 GPU 却被 Team Green 以如此漫不经心的方式处理。

他们说,以性能换取价格的时代已经结束。他们说,摩尔定律已经消亡。然而竞争对手似乎并不这么认为。虽然目前确实没有人能达到 4090 的强大性能,就像我们在 RTX 3090 上看到的那样,但这种情况不会永远持续下去。

结论

事情就变得奇怪了。就目前的情况来看,虽然 RTX 4090 的功耗与 RTX 3090 Ti 一样大,但它在几乎所有方面都比 RTX 3090 和普通 3090 有了巨大的升级,远远超过了它的价格上涨。对于内容创作者来说,这是理所当然的。但我不能凭良心建议那些钱多得没脑子的游戏玩家去购买一款无法驱动同样非常昂贵的显示器的硬件,而这些显示器实际上可能会利用这一点,尤其是当一款更便宜、更省电的显卡,甚至可能是 Nvidia 自己的 RTX 4080s,可以做同样的事情时。

 

图形处理器 显卡 英伟达 rtx 4090 rtx 3090 ti 与 rtx 4090 硬件

发表评论

您的邮箱地址不会被公开。 必填项已用 * 标注

滚动至顶部