官宣!华为云发布盘古大模型5.5与CloudMatrix384超节点

作者:盖贝贝 责任编辑:梅雅鑫 2025.06.21 09:24 来源:通信世界网

通信世界网消息(CWW)6月20日,华为开发者大会2025正式开幕。在主题演讲中,华为常务董事、华为云CEO张平安宣布两项核心进展:基于CloudMatrix 384超节点架构的新一代昇腾AI云服务全面上线,以及盘古大模型5.5正式发布。

CloudMatrix 384超节点架构突破算力瓶颈

近日,华为创始人任正非在接受记者采访时曾表示,硅基芯片,我们用数学补物理、非摩尔补摩尔,利用集群计算的原理,可以达到满足我们现在的需求。

今天所上线的基于CloudMatrix 384超节点架构的新一代昇腾AI云服务正是采用这种思路。据张平安介绍,CloudMatrix 384超节点架构通过MatrixLink高速网络实现了384颗昇腾NPU与192颗鲲鹏CPU全对等互联,形成高性能计算单元。实测数据显示,其单卡推理吞吐量达2300Tokens/s,较传统架构提升近4倍。

image.png

而且,这种结构非常贴合混合专家模型(MoE)进行深度优化。例如,DeepSeek模型配置了256个固定专家和32个共享专家(共288张卡),再加上一些用于应对负载不均衡情况的冗余卡,总共需要320张卡用于Decode操作。而Prefill操作大概会用到32张卡。综合起来,整个过程需要352张卡。

因此,这种架构完全支持“一卡一专家”并行推理模式,单节点可承载384个专家模型同步运行。资源调度层面实现“一卡一算子任务”的细粒度控制,使算力有效使用率(MFU)提升50%以上。在扩展性方面,支持432个节点级联构建16万卡集群,并创新实现“日推夜训”的训推算力动态分配方案。据张平安介绍,目前该服务已落地科大讯飞、中科院等1300余家客户。

盘古大模型5.5实现全栈升级

盘古大模型5.5的全面升级,则是华为云在AI应用领域的又一重大突破。

一直以来,华为云盘古大模型都聚焦行业,致力于解难题、做难事,重塑千行万业。此次发布的盘古大模型5.5,五大基础模型全面升级,为行业提供了全新价值。

在自然语言处理(NLP)领域,全新的718B深度思考模型由256个专家组成MoE大模型,在知识推理、工具调用、数学等领域大幅增强,处于业界第一梯队。同时,盘古大模型5.5在高效长序列、低幻觉、快慢思考融合、Agent等特性上进行升级,提升了用户体验。例如,自适应快慢思考合一的技术让模型能根据问题难易程度自适应切换快慢思考,整体模型推理效率提升8倍;盘古深度研究DeepDiver可以在网页搜索、常识性问答等应用上获得很高的执行效率,大幅提升工作效率。

在多模态领域,全新发布基于盘古多模态大模型的世界模型,可以为智能驾驶、具身智能机器人的训练构建数字物理空间,实现持续优化迭代。广汽集团与华为云深度合作,依托盘古多模态大模型,实现了2D视频模态与3D点云模态的像素级对应,为端到端模型的高效迭代提供了强力支撑。此外,华为云还基于盘古大模型的多模态能力及思维能力,正式发布CloudRobo具身智能平台,加速具身智能创新。

在预测领域,盘古预测大模型采用业界首创的triplet transformer统一预训练架构,极大地提升了预测大模型的精度和跨行业、跨场景的泛化性,已被应用于钢铁、有色金属、供热等多个行业,帮助客户实现工艺优化和系统寻优。

在科学计算领域,华为云持续拓展盘古科学计算大模型与更多科学应用领域的结合,深圳气象局、重庆市气象局、深圳能源等机构都基于盘古大模型取得了显著成果。

在计算机视觉(CV)领域,华为云发布全新MoE架构的300亿参数视觉大模型,全面支持多维度、泛视觉的感知、分析与决策,并通过跨维度生成模型构建工业场景稀缺的泛视觉故障样本库,极大地提升了业务场景的可识别种类与精度。中国石油基于盘古打造了昆仑大模型,在多个专业领域开展人工智能深度应用,取得了显著成效。

据张平安透露,在过去的一年中,盘古大模型已在30多个行业、500多个场景中落地,在政务、金融、制造、医疗、煤矿、钢铁、铁路、自动驾驶、气象等领域发挥了巨大价值。

结语

华为云是华为公司面向开发者的统一底座,目标打造昇腾、鸿蒙、鲲鹏、GaussDB、欧拉等各项根技术的生态,给广大开发者一个更优的选择。如今,华为云开发者已超过800万;华为云作为云底座,支持鲲鹏、昇腾、鸿蒙等生态的开发者总计达到1300万。

从CloudMatrix 384超节点带来的强大算力支持,到盘古大模型5.5在各个领域的深度应用,华为云正以技术创新为驱动,为千行万业注入新的活力。


通信世界网版权及免责声明:
1、凡本网注明“来源:通信世界全媒体”及标有原创的所有作品,版权均属于通信世界网。未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载我方内容的单位,也必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和本站来源。
2、凡本网注明“来源:XXX(非通信世界网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。
3、如因作品内容、版权和其它问题需要同本网联系的,请在相关作品刊发之日起30日内进行。
发表评论请先登录
...
热点文章
    暂无内容