华为何波:四大秘籍实现数据中心能源重构

作者:黄海峰 责任编辑:梅雅鑫 2020.04.29 16:35 来源:通信世界网

通信世界网消息(CWW)随着国家“新基建”概念提出,包括5G基建、大数据中心、人工智能、工业互联网等为代表的通信技术必将迎来新的发展机遇。

行业数字化、软件云化的发展,必然带来海量的数据增长,数据中心作为底层基础将迎来更快增长。相关数据显示,2019年中国数据中心IT投资规模达3698.1亿,预计2020年这一规模将增长12.7%,达到4166.8亿元;而到2025年,预计这一投资规模将达到7070.9亿元。

伴随高速增长的数据中心建设,数据中心也面临诸多挑战。如何助力数据中心迎接挑战,打造坚实的“新基建”底层基础?华为数据中心能源领域总裁何波近期接受了通信世界全媒体记者专访,分享了华为对数据中心在“新基建”下的一些洞察和思考。

image.png

数据中心能源成最大挑战

既然数据中心在“新基建”中扮演者“数字底座”的角色,那么数据中心在建设中面临着哪些挑战呢?

对此,何波介绍到,目前数据中心建设面临传统建设模式弹性差,不能按需部署和匹配IT演进;数据中心资源消耗与日俱增,节能降耗迫在眉睫;数据中心运维效率和资源利用率低;数据中心面临可靠和安全挑战四大挑战。

其中能耗问题成为数据中心最大挑战。据国际环保组织绿色和平发布数据显示,2018年中国数据中心总用电量1608.89亿千瓦时,占中国全社会用电量的2.35%,超过上海市2018年全社会用电量,到2023年中国数据中心总用电量将达到2667.92亿千瓦时。以8MW的数据中心为例,年耗电量课满足1.5万户居民一年用电需求。

此外,在水资源方面,8MW 1T负载的数据中心,年耗水量约为28万吨,课装满125个标准游泳池,或满足3000户居民一年用水需求。

未来数据中心能源的模样

数据中心能源未来着怎样的发展趋势?何波介绍,今年1月,华为发布面向2025年数据中心能源十大趋势。

趋势一:高密。伴随算力、AI需求增长,数据中心必将向高密化发展。当前,数据中心单柜平均功率为6~8kW,预计到2025年,15~20kW/柜将成为主流。

趋势二:弹性。IT设备的生命周期一般为3~5年,而数据中心基础设施的生命周期为10~15年。数据中心必须能够匹配不同功率密度的IT设备混合部署。

趋势三:绿色。降低数据中心PUE和建设绿色数据中心成为必然方向,预计未来五年内,中国新建数据中心PUE将进入1.1时代。

趋势四:快速。随着数据和流量需求激增,要求数据中心必须快速投入使用,当前数据中心TTM典型水平是9到12个月,预计未来将缩短至6个月以内。

趋势五:全数字化,AI智能。随着IOT、AI技术的不断完善,数据中心将逐步实现由运维、节能、运营等单域的数字化,向规划、建设、运维、优化的全生命周期数字化和自动驾驶演进,AI将得到普遍应用。

趋势六:全模块化。为了解决传统数据中心建设缓慢和初期投资成本大的挑战,更多数据中心将实践全模块化的建设理念。

趋势七:供电极简,锂进铅退。传统数据中心供配电系统存在系统割裂且复杂、占地面积大、故障定位难等问题,极简的供电架构将减少变换次数,缩短供电距离,减少占地,提升出柜率和系统能效。

趋势八:风液融合,风进水退。GPU、NPU的应用促进高密场景增多,液冷系统越来越普遍。但这也造成对水资源的浪费,1MW数据中心年耗水3.5万吨。模块化架构的间接蒸发冷却系统可缩短部署时间、降低运维难度,同时充分利用自然冷却资源,大幅降低制冷系统的电力消耗

趋势九:比特瓦特联动。数据中心将通过能源、IT、芯片、数据、云的全栈联合创新,实现比特和瓦特的联动,达到动态节能,全系统能效最优。

趋势十:安全可信。数据中心须同时需要具备韧性、Security安全性、隐私性、Safety安全性、可靠性、可用性六个特征,以避免由环境因素、恶意人员发起的攻击威胁,包括网络入侵类的威胁。

华为如何助力行业破解能源挑战

作为全球顶级通信设备制造商及方案解决商,如何帮助行业应对数据中心能源面临挑战,并朝着未来的样子发展?何波介绍了华为破解数据中心能源的四大秘籍。

秘籍一:多元算力

在计算层面,针对计算多样化需求,华为通过“鲲鹏+昇腾”双引擎,打造出覆盖“算、智、存、传、管”完整的计算芯片生态,通过云、端、边协同,提供“鲲鹏+昇腾+x86+GPU”的多样性算力,以多元化计算、异构计算打破能效墙、散热墙、优化墙、内存墙、高速IO墙等难题,让算力对于能源和环境具有更好的友好性。

秘籍二:云+AI提升能力

在云+AI的平台应用层,华为率先将AI技术与云数据中心、智能计算、存储等IT基础设施不断融合,提供全栈式云解决方案,并具备云边协同能力。

以华为Atlas 900 AI训练集群为例,算力达到了256 PFLOPS时,通用CPU需要6195个机柜,GPU则需要208个机柜。但通过芯片优化和系统级优化最终只用了16个机柜。

秘籍三:智能管理芯片

在运维管理层,华为基于自研的智能管理芯片,并通过智能化的手段将传统数据中心的基础设施从“哑设备”转变成为可以精确感知和精准控制的智能设备,使其能够与运维系统联动,并通过全面应用AI技术,真正实现无感知的自动化智能运维,从而大幅提升数据中心的可靠性、能源效率以及运维效率。

以华为创新研发出了DCIM+解决方案为例,通过智能自动检测、智能数据分析、智能决策执行等智能化手段在数据中心的应用,在数据中心实现有效的“监、管、营、控”,最终达成数据中心稳定运行和最大化的使用率。

秘籍四:模块+智能

在网络能源领域,华为也在业界率先提出了“锂进铅退”,“风进水退”,“AI节能”等理念,在实践过程中以“模块化+智能化”、 “AI加持四大重构,引领数据中心向“数字化、网络化、智能化”的变革。

何波在采访中还重点介绍了华为iCooling解决方案。其实早在2018年,华为就发布了基于AI的iCooling解决方案,助力大型数据中心制冷系统从制冷走向“智冷”。

据介绍,基于AI的iCooling数据中心能效优化解决方案,针对数据中心制冷效率提升瓶颈,通过机器深度学习,探索影响能耗的关键因素,获取PUE的预测模型。最终通过规范化的实践引导和目标导向评测,不断调整优化,获取均衡PUE。

对于该方案,何波介绍了中国移动与华为首个联合创新的AI节能数据中心案例。中国移动携手华为,在中国移动宁夏数据中心定制了一套面向未来的自愈、自治、自优化的基础设施自动驾驶解决方案。借助华为自研的DCIM系统,对数据中心的海量数据进行采集和治理,通过深度神经网络算法,学习自动寻找出制约PUE的关键因素,进而推理出在当前IT负载、室外温度等制约条件下,冷站、末端空调等系列设施的最佳参数组合,最终实现数据中心能效最优。

何波介绍到,目前,iCooling@AI已有效降低数据中心PUE 3.5%。在第二阶段中高负载及机械制冷场景下,随PUE模型精度的不断提升,节能效果预计可达到5%到8%。

从何波的介绍中我们不难发现,华为正在依靠自主创新能力,通过自研芯片、操作系统、数据库以及云计算平台,自下而上构建了智能高效的端到端数据中心能力,将智能化、数字化渗透到数据中心全生命周期的管理,实现对数据中心重构。

可见在新基建趋势下,华为这家公司希望通过芯片,数据,能源,云全栈的创新,让数据中心越用越快,越用越省,越用越节能。


通信世界网版权及免责声明:
1、凡本网注明“来源:通信世界全媒体”及标有原创的所有作品,版权均属于通信世界网。未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载我方内容的单位,也必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和本站来源。
2、凡本网注明“来源:XXX(非通信世界网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。
3、如因作品内容、版权和其它问题需要同本网联系的,请在相关作品刊发之日起30日内进行。
发表评论请先登录
...
热点文章
    暂无内容