通信世界网消息(CWW)当前,经济社会加速进入数智化时代,数字经济占GDP比重逐年上升,算力已成为数字经济的核心生产力,作为继CPU、GPU之后的“第三块主力芯片”,DPU有望成为数据中心场景中的第三大算力支柱,释放巨量算力,助推数字经济发展。
为进一步探讨DPU技术趋势和产业应用,7月30日下午,在“2022年中国计算机学会芯片大会”期间,由中科驭数牵头组织的 “DPU技术趋势和应用”分论坛成功召开,多位行业大咖齐聚,奉献了一场DPU技术盛宴,为产业发展持续输入新动能。
重塑DPU评价体系!DPU技术评测白皮书发布
众所周知,芯片评测通行的评价维度是PPA,即性能(Performance)、功耗(Power)、面积(Area),这三个维度可以用于比较“同类”芯片产品的优劣,然而,这个评价维度适用的前提是芯片 要“同类”。对于新近发展起来的DPU芯片而言,现有不同厂商的DPU芯片功能存在较大差异,虽笼统属于DPU大类,但是否属于“同类”仍有待商榷,这必然导致性能评价的维度各有侧重,呈现多元化,给建立一个公平的DPU评价体系带来了较大的挑战。
为应对这一挑战,在此次论坛上,中科驭数联合多家企业和机构正式发布《专用数据处理器(DPU)性能基准评测方法与实现》技术白皮书,针对现阶段DPU产品的功能定义,充分考虑DPU使用环境等的差异性,为未来DPU产品建立一套公平、开放、全面、客观的DPU评测体系,既为DPU用户提供参考,也为未来DPU产品的标准化提供引导。
值得关注的是,中科驭数在2021年就牵头完成了行业第一部DPU技术白皮书,为DPU的标准化做出了重要贡献。
行业专家纵论DPU发展趋势
赛迪顾问预计,2025年国内DPU市场规模将达565.9亿元,五年复合增速高达170.60%。站在新的时代风口,来自中国移动、中科驭数、浪潮、百度、英伟达的10余位行业专家在论坛上畅所欲言,共话DPU产业发展大势。
面对网络、存储、AI加速、智算中心部署等快速发展的技术需求,多元异构计算架构暴露出一些问题,集中表现为计算负载如何去中心化?对此,浪潮异构加速前沿创新团队负责人阚宏伟表示,下一代处理器及其计算架构变革已成共识,“第三块主力芯片”势如破竹。以DPU为代表的各种xPU芯片,在网络/存储侧布局各种计算引擎卸载分流系统负载,把其纳入计算架构的基本1/O范畴研究布局,摆脱了以CPU为中心的传统模式,使计算通路更加畅通高效。分布式xPU芯片及其高密度池化服务器是平衡系统芯片制程依赖、功耗、算力、效能,让数据每一跳都产生更多价值的有效途径。
天翼云科技有限公司弹性计算产品总监孙晓宁和资深研发专家刘禄仁合力讲述了DPU在天翼云的过去、现在和未来。作为全球公有云市场排名前十的唯一央企,天翼云位居全球运营商云业务规模榜首,中国政务(公有云)市场第一、混合云市场第一。当前,天翼云正在紫金技术架构、网络存储架构等方面发力,其中,天翼云推出的天翼云弹性裸金属服务器可让CPU释放更多算力。该服务器兼具云服务器弹性和物理机性能,将网络、存储等功能卸载至DPU卡,极大降低了物理机侧CPU和内存等资源消耗,最终算力远超普通云主机,将通用物理机升级为具备硬件加速、云盘挂载、支持vpn网络等能力的高性能弹性计算产品。
“当前,摩尔定律放缓,CPU性能提升速度远落后于数据/网络带宽的增长速度,同时,云数据中心基础设施软件开销巨大,为应对这两大挑战,DPU应运而生。”中科院计算所博士研究生廖云坤表示,作为数据中心技术创新的热点,DPU将是继GPU后的下一个核心算力芯片,将从CPU上卸载大部分的业务,成为新的数据网关、存储入口以及加速沙盒,未来的算力生态将呈现以CPU、GPU和DPU三足鼎立的态势。
作为国内DPU研发的领军企业,中科驭数提出了以“软件定义加速器”为核心技术路线的SDA计算架构KPU,解决了专用处理器设计碎片化的问题,KPU架构具有软件定义可配置、低设计成本、计算高效的优势。同时,中科驭数还创新性的提出了敏捷异构KPU芯片架构,推出了DPU软件开发平台HADOS,研发了网络卸载引擎NOE和数据计算卸载引擎DOE。其中,HADOS是支撑DPU硬件平台的专用软件框架,具有良好的生态兼容能力和丰富的开发维护工具,所支持的业务类型丰富,能大幅降低应用软件开发难度。
中国移动研究院基础所未来网络室主任李志强指出,随着经济社会加速进入数智化时代,算力成为数字经济的核心生产力,数智化时代需要强大算力支撑,要通过网络基础设施和算力基础设施的深度融合,实现新型算网协同调度。他表示,算网一体作为算力网络的目标阶段,将引发计算和网络学科交叉融合,可能会产生大量原始创新技术,促进两大领域创新突破以及一体化发展,需要业界共同探索,加快技术联合攻关,推进方案原型试点、标准开源合作。
“传统的计算平台计算在CPU和GPU上,RDAM网络连接计算和存储,CPU运行业务并管理基础设施操作。”英伟达网络亚太区高级总监宋庆春指出,而现在基于云原生超级计算架构的计算平台则是数据在哪里,计算就在哪里,网络成为计算单元,DPU卸载基础设施操作,存储成为计算单元。同时,该架构实现了计算和通信平台的统一,并利用网络计算技术解决了通信瓶颈,避免了网络拥塞,无需消耗CPU资源即可进行通信。
百度杰出研发架构师、太行DPU研发负责人王富认为,云之于芯片,云计算半封闭是芯片发展的高速路,而DPU之于云,DPU已经成为云计算的核心组件,构建了lass资源的统一弹性底座。头部CSP自研DPU的目的是解决数据中心管理以及虚拟化的局限性,并保持其产品的优势。据了解,百度在DPU芯片上的研发已有2-3年,其产品太行DPU历经三代,实现了虚拟化全加速、0损耗、规模部署,并进行了全面升级,端到端打通,实现业务加速。与此同时,百度四大自研硬核引擎支持多协议、多场景、跨平台,打造极致时延,构建了lass层统一底座。王富还提及了未来DPU的三种表现形态,即ASIC/异构芯片、eAISC/FPGA、AISC+FPGA。
中国移动研究院网络所项目经理班有容在演讲中指出,DPU是算力网络算力基础设施的关键技术,DPU以数据为中心的计算架构,具备低损耗、高性能、高灵活、高安全的优势,能够支撑算力网络多样化业务需求,构建高效、灵活、敏捷的算力基础设施坚实底座。但班有容也指出,由于DPU软件实现方式差异大,业界存在异厂家DPU与云平台软件定向开发适配成本高的问题。她建议DPU软件标准化围绕管理、网络、存储、计算、安全五大系统,定义功能要求和交互接口。同时,服务器引入DPU需要定制设计,以完成适配对接,亟需对服务器定制点进行标准化定义,引导DPU服务器设计标准化突破新技术规模应用瓶颈。
此外,班有容表示,各自为营、定向适配的商业模式不利于DPU的产业发展,业界应完善技术体系,构建统一软硬件标准,加强产业合作。中国移动意愿发挥链长责任,持续推动DPU软硬件标准化进程,促进DPU产业生态稳步健康发展。