通信世界网消息(CWW)在智能体AI时代,CPU正重返现代AI基础设施的中心。6月1日,英特尔正式发布首款基于Intel 18A制程工艺的数据中心CPU至强6+。英特尔公司执行副总裁兼数据中心事业部(DCG)总经理Kevork Kechichian在媒体沟通会上表示,英特尔正通过至强6+、网络与AI系统解决方案,推动智能体AI规模化应用。

智能体浪潮下,CPU重回“黄金时代”
AI上半场,算力决定上限,而GPU是算力的核心,几乎成了AI的代名词,此时CPU负责数据的迎来送往,而非核心角色;随着AI推理,尤其是智能体工作负载的增长,计算格局正在发生深刻变化——GPU开始“水土不服”,CPU的重要性越发凸显,甚至开始出现产能短缺。
与传统的“人-机对话”式推理不同,智能体工作流涉及多个专家模型的协同、子智能体的繁衍与调度、长上下文的持续交互。这种复杂、多步骤、高并发的任务模式,使CPU不再是“配角”,而成为整个系统的调度中枢与执行核心。
“一年前推理仍是获取前沿模型智能的主要方式,但现在由于智能体的兴起,CPU处于所有流程的中心,系统内部CPU与GPU的占用比例发生变化,从训练场景的1:4或1:8,开始向CPU倾斜,CPU比重甚至超越GPU。”Kevork Kechichian指出,成熟且广泛的至强x86生态系统,为客户将智能体AI集成到他们的工作流程中提供了最低的阻力。加速器成为AI的“思考者”,而CPU则成为AI的“执行者”。
Kevork Kechichian表示,到2030年,现有数据中心底层架构仍将持续发挥价值,且会承载近50%的工作负载,而当前绝大多数工作负载均以x86架构为核心,其中一些工作负载(包括推理和智能体 AI)甚至几乎将完全在x86上运行,这是因为CPU内置的各类加速器与引擎,性能已能够满足需求,无需额外添置其他的加速设备。
据介绍,结合客户需求,英特尔针对不同工作负载优化出两类核心:P-core(性能核)已部署在至强6中,性能优势突出。同时,能效核(E-core)正逐步兴起,在智能体工作流中变得至关重要。
至强6+发布:每瓦性能提升55%
至强6+是英特尔制程工艺转折点上的关键产品,它首次将Intel 18A引入数据中心领域。据介绍,其针对单机架功耗、单核吞吐量以及延迟可预测性要求极高的业务环境进行了优化,且聚焦于横向扩展性能,让企业无需对数据中心进行颠覆性重构,即可承载全新的AI工作负载。

首先,至强6+基于Intel 18A工艺,单颗处理器最高集成288个能效核(E-core)。与上一代产品相比,性能提升高达2.5倍;与同类产品相比,每线程每瓦性能提升高达45%,可为云原生、电信和智能体AI驱动的工作负载提供高并发和快速响应能力。Kira Boyko介绍,基于最新的Intel 18A工艺技术,英特尔至强6+采用PowerVia技术实现了更短、更直接的供电路径,从而有效降低功耗。为增强性能一致性,它还采用RibbonFET技术以降低待机功耗。
其次,至强6+采用Foveros Direct 3D封装,将基于18A工艺的计算Tile直接垂直堆叠在基于Intel 3工艺的Base Tile之上。这种3D堆叠打破了单芯片的物理面积限制,至强6+由12个计算Tile、3个Active Base Tile和2个I/O Tile和12个EMIB组成,实现了更短的互连距离和更高的带宽密度,以及性能与成本的平衡。
再次,至强6+支持12通道高达8000 MT/s的DDR5内存,以及高达576MB的末级缓存(LLC),缓存容量较上一代提升超5倍,极大缓解了“内存墙”问题,确保高并发下的数据吞吐。该平台还提供了96条PCIe Gen 5通道,并支持单路和双路配置,这些规格升级带来了显著的代际性能跃升。
此外,英特尔应用能效遥测技术(Intel AET)可让数据中心运营商在工作负载层级实时查看CPU核心的功耗与运行状态,进而实现能效更优的资源编排、精准成本分摊,并针对负载优化应用落地能效激励机制。
破解三大难题,至强6+实测效果显著
英特尔公司至强6+产品总监Kira Boyko在沟通会上介绍道,现代5G核心网与云原生工作负载对基础设施提出前所未有的严苛要求,行业当前有三大核心诉求:提升性能密度,在减少机架空间的同时处理更多的任务;提升每瓦性能,降低TCO;为关键业务部署提供高可靠性保障。至强 6+正是为解决这三个关键问题而设计的。
英特尔针对一系列关键的基础工作负载进行了优化,包括网络基础设施(如5G核心网的控制面、用户面及下一代防火墙),媒体业务(如CDN内容分发网络、流媒体、实时媒体处理与传输),Web及微服务(如服务网格、代理服务器、网页托管与电子商务平台),存储(如分布式冷热数据层)等。
同时,至强6+已在电信网络基础设施中进行测试,并开始配置到数据中心系统中,整个生态系统均有可用平台。其中包括来自华硕、戴尔科技、爱立信、技嘉、慧与(HPE)、联想、超微等厂商所提供,或在其方案中采用的服务器、网络和集成解决方案。
其中,爱立信在运营商部署中测试至强6+分组核心网,结果显示,与上一代E-core相比,在相同内核数量下,性能提升30%,每瓦性能提升60%以上,运行期间机架功耗降低38%。德意志电信旗下的T-Systems指出,海量内核数量与出色的能效是其T-Cloud私有智能体AI基础设施的关键赋能因素。

系统布局,扩大数据中心市场优势
算力资源在实际执行工作负载时能否被充分释放,还需要高性能、高能效的连接支持。为此,英特尔发布E835以太网控制器和适配器,E835控制器可提供200 GbE的吞吐量,支持10GbE到200GbE的数据速率;适配器每瓦性能比同类产品高出多达1.4-1.9倍。
同时,英特尔还发布了首款基于Xe 3P架构的数据中心GPU——“Crescent Island”。Crescent Island则专注于AI推理,提供高达480GB的LPDDR内存,以及350W的低功耗,可在现有风冷数据中心部署。
从英特尔至强6+到E835以太网控制器,再到Crescent Island,无不证明系统协同才能为客户提供更高性能、更高能效的算力底座。智能体的快速发展充分展现了市场对于可规模化部署AI应用的迫切需求。对于英特尔而言,这将是一场全方位的机遇,特别是有利于扩大在数据中心市场中的优势。
在沟通会中,英特尔还提到了面向数据中心的下一代性能核产品,将于2027年发布的Diamond Rapids。Diamond Rapids基于Intel 18A-P制程工艺,支持16通道,内存带宽将翻倍,并且核心数量将增加50%,提供更高的每线程性能,且支持更多PCIe Gen6通道。



