苹果的GPU,言过其实
苹果已经披露了其新 M2 处理器的大部分主要细节。该披露充满了常见的 Apple 式夸张,包括与未能准确披露正在测试的 PC 硬件的比较。尽管如此,M1 一直是一款不错的芯片,尤其是对于 MacBook 笔记本电脑而言,而 M2 看起来会改进设计并将其提升到一个新的水平。但是,Apple 必须遵守与所有其他芯片公司一样的规则,不能轻易创造奇迹。
M1 是 2020 年第一款上市的 5nm 级处理器。两年后,台积电的下一代 3nm 技术还没有完全准备好,因此苹果不得不凑合着使用优化的 N5P 节点,即“第二代5纳米工艺。” 这意味着晶体管密度并没有真正发生太大变化,这意味着苹果必须使用更大的芯片来获得更多的晶体管和性能。这从数据可以看到,M1 有 160 亿个晶体管,而 M2 将增加到 200 亿个。
总体而言,Apple 声称 CPU 性能将比其之前的 M1 芯片快 18%,而 GPU 将快 35% - 请注意,Apple 在此讨论中不包括 M1 Pro、M1 Max 或 M1 Ultra。不过,我对 GPU 功能更感兴趣,坦率地说,它们并没有给人留下深刻的印象。
是的,M2 的图形速度很快对于集成解决方案,但这究竟意味着什么,它与最好的显卡相比如何?如果手头没有用于测试的硬件,我们无法确切说明它将如何执行,但我们确实可以进行一些合理的比较。
让我们从原始性能数据开始。并非所有的 teraflops 都是平等的,因为架构设计决策肯定会发挥作用,但我们仍然可以通过查看我们所知道的来获得一些合理的估计。
例如,Nvidia 在其RTX 3050 GPU上具有 9.0 teraflops 的理论单精度性能,而AMD 的 RX 6600具有 8.9 teraflops 的理论性能。在纸面上,这两个 GPU 看起来相对相等,它们甚至具有相似的内存带宽——两张卡都是 224 GB/s,这得益于具有 14Gbps GDDR6 的 128 位内存接口。然而,在我们的GPU 基准测试层次结构中,RX 6600 在 1080p 时快 30%,在 1440p 时快 22%。(请注意,在我们的光线追踪测试套件中,RTX 3050 大约快 15%。)
在架构上,Apple 的 GPU 在基于 teraflops 的实际性能方面看起来与 AMD 相似。例如,M1 的额定理论值为 2.6 teraflops,带宽为 68 GB/s。这大约是 AMD RX 5500 XT 的一半 teraflops 和三分之一的带宽,在图形基准测试中,M1 通常运行速度大约是其一半。我们预计 M2 GPU 不会有任何大规模的架构更新,因此它应该与 AMD 的 RDNA 2 GPU 相对相似。
AMD 和 Apple 都没有 Nvidia 的双 FP32 管道(其中一个也处理 INT32 计算),并且 AMD 拥有 Infinity Cache,至少在实践中应该类似于 Apple “更大的 L2 缓存”的说法。
M2 GPU 的额定速度仅为 3.6 teraflops。这还不到 RX 6600 和 RTX 3050 的一半,也低于 AMD 备受诟病的RX 6500 XT(5.8 teraflops 和 144 GB/s 带宽)。这不是游戏的世界末日,但我们不希望 M2 GPU 能够以最大设置和 60 fps 的速度通过 1080p。
诚然,Apple 正在做集成显卡,就集成解决方案而言,3.6 teraflops 相当不错。最接近的比较是 AMD 的 Ryzen 7 6800U 与 RDNA 2 显卡。该处理器有 12 个计算单元 (CU),时钟频率高达 2.2 GHz,达到 3.4 teraflops。它还在双通道 128 位总线上使用共享 DDR5 内存,因此像华硕 Zenbook S 13 OLED中的 LPDDR5-6400将提供 102.4 GB/s 的带宽。
这基本上就是我们对 Apple 的 M2 GPU 所期望的性能水平,再次,给予或接受。它比英特尔现有的集成显卡解决方案快得多,并且完全击败了上一代基于英特尔的 MacBook 中使用的第 8 代英特尔酷睿 GPU。但这不会是一个很棒的游戏解决方案。我们的目标更多是足够的。
另一个值得注意的有趣事项是,Apple 没有提及 AV1 编码/解码支持。AVI 得到了一些大公司的支持,包括亚马逊、谷歌、英特尔、微软和 Netflix。到目前为止,英特尔是唯一一家支持 AV1 编码的 PC 图形公司,而 AMD 和 Nvidia 在其最新的 RDNA 2(Navi 24 除外)和 Ampere GPU 上支持 AV1 解码。
苹果还详细介绍了其即将推出的MetalFX 升级算法,这是非常有意义的。Apple 在其所有产品上都使用高分辨率 Retina 显示屏,如果没有任何帮助,3.6 teraflops GPU 和 100 GB/s 带宽将无法处理原生 2560 x 1664 游戏。假设 Apple 获得与 FSR 2.0 或 DLSS 2.x 类似的缩放比例,M2 GPU 可以使用“质量”模式并渲染 1706 x 1109,放大到原生 2560 x 1664,大多数人不会真正注意到差异。这小于 1920 x 1080,当然 M2 应该能够处理得足够好。
我们也不要忘记,这只是迄今为止宣布的基本型号 M2。就像之前的 M1 变体一样,它被用于 MacBook Air 和 MacBook Pro 13,但苹果很有可能也会制造出功能更强大的 M2 解决方案。与基本 M1 的 8 个内核相比,M1 Pro 拥有多达 16 个 GPU 内核。将 GPU 核心数量和带宽加倍应该会将性能提升到 7.2 teraflops 范围——理论上大致相当于 RX 6600 或 RTX 3050。对于具有 40 个 GPU 内核和 14.4 teraflops 的 M2 Max 而言,再将其翻倍将使 Apple 处于与RX 6750 XT甚至 RX 6800 相同的领域。
对于在 65W 功率范围内运行的集成显卡解决方案,这将是非常令人印象深刻的。但是,在得出任何最终结论之前,我们仍然需要查看芯片的实际运行情况,并且可以肯定的是,专用图形解决方案将继续提供更高的性能。
Apple 的芯片继续向 CPU 和 GPU 领域的老牌厂商进军,但请记住,首先瞄准效率通常意味着较低的性能。专用的 AMD 和 Nvidia GPU 在台式机上可能使用 300W 或更多功率,但相同的芯片可以用于笔记本电脑并仅使用 100W,同时仍可提供台式机等效产品的 70-80% 的性能。
如果没有硬件和真实世界的测试,我们无法确切知道 Apple 的 M2 GPU 的速度会有多快。然而,即使是苹果也只声称比 M1 GPU 性能高出 35%,这意味着 M2 将比 M1 Pro 慢很多,更不用说 M1 Max 或 M1 Ultra。这很好,因为它进入的笔记本电脑更多的是关于全天电池寿命而不是玩最新游戏。
性能合理的集成 GPU 与 MetalFX Upscaling 相结合也很有希望,追逐 Apple 市场的游戏开发者肯定会考虑使用 upscaling。这应该至少在本机显示分辨率(升级后)下提供可播放的性能,这是一个很好的起点。我们也有兴趣了解被动冷却的 MacBook Air 如何在持续的游戏工作负载下保持稳定。
声明:本文版权归原作者所有,转发仅为更大范围传播,若有异议请联系我们修改或删除:zhangkai@cgbtek.com