Moore's Law Is Dead 刚刚分享了与英伟达 GeForce RTX 40 系列“Ada Lovelace”显卡相关的详细爆料。传闻称绿队新品会在 2022 年 3 季度到来,并与红队的 AMD RNDA 3(MCM)GPU 展开直接的竞争。首先聊聊功耗,MLID 指出 AIB 合作伙伴已经有成熟的三槽(甚至四槽位)散热解决方案。
访问购买页面:
京东NVIDIA系列商品汇总
视频截图(来自:MLID / YouTube)
AD102 旗舰 SKU 的 500-600W 功耗,应该可以用风冷压制住。当然,高端衍生型号肯定也少不了基于水冷的选项。
接口方面,此前我们已经见到过电源厂商展示的双 8-pin 转 1×16-pin(PCIe Gen 5)转接线,每个连接器能够支持高达 600W 的功率。
(图 via WCCFTech)
据说跳票的 GeForce RTX 3090 Ti,也是因为 TGP 功耗达到了 450W,而有望成为首个使用 16-pin / PCIe Gen 5 连接器的桌面显卡型号。
显存方面,尽管 GDDR6X 已经给大家留下深刻的印象(不仅仅是性能 / 功耗 / 发热),但据说英伟达也有在考虑为 RTX 40 系显卡换用 GDDR7 显存。
消息人士透露,Ada Lovelace GPU 集成了 GDDR7 显存控制器,但目前英伟达尚未在任何 RTX 30 SKU 上提供“满血”版的 24Gbps GDDR6X 显存选项。
即使是即将到来的 RTX 3090 Ti,也不过是配备了 21Gbps 的 GDDR6X 显存颗粒。至于 Ada Lovelace 是否会分 Rev.1 和 Rev.2(SUPER)而分别提供 GDDR6X / GDDR7 显存支持,仍有待时间去检验。
带宽方面,得益于 256-bit 总线接口 @ 32Gbps GDDR7 显存颗粒,RTX 40 系列高端显卡有望轻松突破 1 TB/s 。若升级到 384 / 512-bit 位宽,更是可以飙到 1.5 和 2 TB/s 。
具体型号方面,传闻称 Ada Lovelace 至少有六款 SKU,包括 AD102 / 103 / 104 / 106 / 107 / 108 。前五个适用于桌面 / 移动平台,辅以 GeForce RTX 40 / RTX 工作站解决方案。
性能提升方面,MLID 给出了如下推测:
● RTX 4090(AD102)→ 提升 80~110% 光栅化性能,两倍于 RTX 3090(GA102)光追性能。
● RTX 4070(AD103)→ 提升 10~30% 光栅化性能,较 RTX 3090 高 2~3 阶的 RT 性能。
● RTX 4060(AD104)→ 与 RTX 3080(GA102)/ 3090 相当的 RT 光栅化性能。
● RTX 4050 Ti(AD106)→ 与 RTX 2080 Ti(TU102)/ 3070 相当的 RT 光栅化性能。
● RTX 4050(AD107)→ 与 RTX 3060(GA106)相当的 RT 光栅化性能。
泄露消息称,下一代 GeForce RTX 4090 / 4080 Ti 显卡会用上 144 组 SM 单元的 AD102 GPU 核心,较 GA102 GPU 提升了 71%、辅以 18432 个 CUDA 核心数。
有趣的是,AD102 是唯一一个 SM 数量增加超过 50% 的 SKU 。显然,英伟达宁可以更高的功耗为代价,也要在“性能旗舰”上压竞争对手 AMD 的 RDNA 3 一头。
除了 SM 单元数量,Ada Lovelace GPU 还增加了 L2 缓存大小。从 AD102 GPU 开始,旗舰 SKU 拥有高达 96MB 的二级缓存,是 GA102 GPU(6MB)的 16 倍。
AD103 / 104 和 106 / 107 分别具有 64 / 48 / 32MB L2 缓存,总线接口方面,旗舰 AD102 GPU 拥有了 384-bit 位宽,AD103 / 104 和 106 / 107 则是 256、192、128-bit 位宽。
Nvidia Lovelace AD102 Leak GDDR7 Speeds & Insane TDPs - MLID(via)
最后,预计 2022 下半年到来的 Ada Lovelace GPU 有望带来类似于从 Pascal / Maxwell 的代际飞跃,同时维持与 RTX 30 系列相仿的定价策略 —— 此前英伟达已砸下数十亿美元来锁定台积电的 5nm 产能。