通信世界网消息(CWW)9月25日,智创“新”北京暨2025(第二十二届)北京互联网大会在京举办。中国科学院院士钱德沛受邀出席并发表了题为《抓两个融合,促算力建设》的演讲。他表示,算网融合塑造了今日的算力基础设施格局,而算智融合将定义未来计算。行业应建设一个具有高度内在智能、提供强大算力、渗透全社会、承载各领域应用的算力网络,支撑国家的创新发展。
中国科学院院士 钱德沛
历史回望:算网融合奠定数字化社会根基
钱德沛首先回顾了算网融合四十余年的发展历程。这一融合最初的驱动力源于对计算资源与软件共享的迫切需求,上世纪80年代,美国NSFNET通过广域网连接美国各地的超算中心,实现了算力在学术界的初步共享。随着局域网的普及,计算机普遍联网,机构内部、机构之间数据传输与共享的需求更加凸显,成为推动融合深入的关键因素。进入上世纪末至本世纪初,搜索引擎、电子商务、物联网、社交网络等互联网应用与服务的兴起与普及,极大地深化了算网融合的程度。时至今日,算网融合已成功将计算机从昔日的孤立设备,转变为如同水电一般按需使用、无处不在的社会基础设施。
这一历程的背后,是网络、计算机及微电子等领域一系列关键技术突破的共同驱动。从ARPANET奠定分组交换基础,到英特尔开启微处理器和微计算机时代,再到高锟博士提出光纤理论及康宁公司制成低损耗光纤为高速通信铺平道路,技术的协同进步构筑了算网融合的坚实底座。
我国积极抓住了算网融合的历史机遇。钱德沛表示,自上世纪90年代中后期起,国家863计划便前瞻性地支持了国家高性能计算环境和中国高速信息网(Cainonet)等重大课题。本世纪初连续实施四个高性能计算方向的重大项目,使我国超算能力跃居世界前列的同时,构建了基于互联网的国家高性能计算环境“中国国家网格(CNGrid)”。CNGrid不仅创新了网络计算应用模式,还研发了大规模应用软件,推动了超算应用的普及。当前,“东数西算”工程将算网融合推向新高度,它不仅是实现“双碳”目标、促进区域协调发展的关键举措,更是构建创新型国家基础设施的核心一环,通过八大枢纽、十大集群的布局,形成了覆盖全国的先进算力网络。
当下洞察:算智融合引领计算范式变革
钱德沛紧接着剖析了当前算智融合的需求与趋势。过去,国家超算中心的核心应用集中于数值模拟,通过求解复杂数学模型模拟物理世界。而如今,人工智能已成为主流负载,大模型训练、内容生成、具身智能等应用如火如荼。科学智能也日益彰显其价值,在天气预报、新材料发现等领域深刻变革传统科研范式。
人工智能带来了计算范式的根本性迁移:从基于数学模型的方程求解转向数据驱动与AI赋能。后者虽在模型训练阶段耗费巨量算力,但推理速度非常快。值得关注的是,人工智能应用对算力的需求极大,GPT-4参数达1.8万亿,算力需求相比GPT-3增长68倍。同时,人工智能需要特殊硬件支持,异构加速系统成为主流,当前全球前10的超级计算机中9台采用此架构。
为适应不同应用需求,智能计算与超级计算正逐步分离,算力基础设施形态也从单一的超算中心,发展为超算中心(支持数值模拟)、智算中心(支持人工智能)与云算中心(支持数据处理与互联网服务)并存。“超算和智算软件栈的不同加剧了二者的分离,这种分化虽能高效服务特定应用,但单一类型计算中心难以兼顾不同负荷的需求,给业界带来了挑战。”钱德沛讲道。
钱德沛还强调,尽管中国在E级计算机上已取得领先,但向后E级时代迈进时,仍面临性能提升放缓、能耗约束、大规模系统的可靠性约束、异构并行系统的可编程性约束等严峻挑战,加之自2015年以来美国在高端处理器、高带宽内存、先进制程、EDA工具等方面的持续封锁,严重制约了中国高性能计算与人工智能产业的自主发展。
未来路径:以“两个融合”驱动算力建设破局
面对机遇与挑战,钱德沛提出了以“两个融合”促进算力发展的系统性思路:智算融合双向赋能、面向领域通专结合、关键技术另辟蹊径、实行敏捷自动设计验证、软硬协同优化系统、通过模式创新普及应用。
一是智算融合双向赋能。智能和计算不是替代的关系,而是相互补充,相互支撑的关系,目前AI仅可替代约30%的超算应用,无法完全解决精确计算问题。钱德沛介绍了智算融合双向赋能的三种形式,其一是计算支持智能,发展GPU、AI加速器等高效支持AI的硬件,优化大模型训练与推理,实现软硬件多层次协同创新。其二是智能改造计算,用AI优化算力的调度、运维管理与能效,支持硬件与软件的设计,提升计算机性能、能耗与可靠性。其三是算智融合,智能成为计算机的内在属性和基本特征,提供智能化引擎与服务。
二是面向领域通专结合。通用系统成本低但性能与能效不足,专用系统性能高但批量小、价格高。未来超算应采用面向领域的深度异构体系结构,在处理器、节点与系统层面实现多层次异构。
三是关键技术另辟蹊径。突破制造工艺封锁,要发展Chiplet、晶圆级集成与3D封装技术,以相对落后工艺制造高性能、低功耗芯片;攻克高速、低延迟互联技术,探索硅光子与稠密波分复用光网络,降低互联能耗。
四是敏捷自动设计验证。敏捷的系统设计验证能力,是面向领域通专结合的基础,不能快速设计、验证处理器,不能高效研发系统软件,柔性异构的体系结构无从谈起,应充分利用大模型和AIGC的最新研究成果,推动处理器芯片和系统软件的设计自动化。
五是通过模式创新普及应用。钱德沛提出“超算互联网”理念,借鉴互联网的成功经验来运营算力基础设施。在国家超算基础设施之上构建运营服务平台,类似电商模式,使用户能够直接获取应用软件、计算流程乃至整体解决方案,并按实际使用量付费,改变传统软件许可模式。底层通过高速网络连接国家超算中心,中层由多运营商提供多样化算力服务,顶层通过标准、评测与监控体系协调运行,最终实现算力服务的多样化与应用的繁荣。
最后,钱德沛总结道,算网融合塑造了今日的算力基础设施格局,而算智融合则将定义计算的未来,引领计算技术进入一个更具智能、更普惠、更高效的新纪元。长远来看,超算与智算的界限应逐步淡化,最终实现计算的无界融合。业界应致力于建设一个具有高度内在智能、提供强大算力、渗透全社会、承载各领域应用的算力网络,支撑国家的创新发展。