英伟达官宣新一代GPU 推理算力是Blackwell的5倍

责任编辑:朱文凤 2026.01.06 08:56 来源:快科技

TheVerge报道,英伟达CEO黄仁勋在CES 2026主题演讲中宣布,新一代“Rubin”计算架构平台已正式进入量产阶段。

该平台包含六款新型芯片,分别为Vera CPU、Rubin GPU、NVLink 6交换机、ConnectX-9超级网卡、BlueField-4 DPU及Spectrum-6以太网交换机。目前,这六款芯片已从合作制造方处回厂,并通过部分关键测试,整体进度正按计划推进。

英伟达官宣新一代GPU 推理算力是Blackwell的5倍

据英伟达公布的数据,Rubin平台的训练性能达到前代Blackwell的3.5倍,运行AI软件的性能提升5倍。此外,其推理token生成成本可降低多达10倍,训练混合专家模型(MoE)所需的GPU数量也减少至原来的四分之一。

新一代Vera CPU配备88个核心,性能为替代产品的两倍。该处理器专为代理推理设计,被视为大规模AI工厂中能效最高的CPU,采用88个定制Olympus核心,支持完整Armv9.2架构,并搭载高速NVLink-C2C互连技术。

Rubin GPU集成第三代Transformer引擎,具备硬件加速自适应压缩功能,可为AI推理提供50 petaflops的NVFP4算力。每个GPU带宽达3.6TB/s,而Vera Rubin NVL72机架的整体带宽更提升至260TB/s。

英伟达同时透露,包括亚马逊AWS、谷歌云、微软Azure和甲骨文云在内的多家云服务商将于2026年率先部署基于Vera Rubin的实例。此外,CoreWeave、Lambda、Nebius和Nscale等云合作伙伴也将陆续跟进。

英伟达官宣新一代GPU 推理算力是Blackwell的5倍


通信世界网版权及免责声明:
1、凡本网注明“来源:通信世界全媒体”及标有原创的所有作品,版权均属于通信世界网。未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载我方内容的单位,也必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和本站来源。
2、凡本网注明“来源:XXX(非通信世界网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。
3、如因作品内容、版权和其它问题需要同本网联系的,请在相关作品刊发之日起30日内进行。
发表评论请先登录
...
热点文章
    暂无内容