构筑未来,AIGC推动运营商智能化革命

作者:华为数据存储产品线副总裁 顾雪军 责任编辑:包建羽 2023.07.18 09:26 来源:通信世界全媒体

通信世界网消息(CWW)ChatGPT凭借其极强的语义理解能力、文字流畅性和持续对话能力,掀起了生成式AI热潮,也代表着通用人工智能奇点时刻的到来。产业界纷纷加强大模型相关领域的研究,并推出一些新产品和新应用,而传统信息产业生态正在被重构。作为ICT基础设施建设的主力军,运营商迎来了智算发展的新机遇。

AI创新,加速运营商数字化转型

在网络基础设施运营方面,AIGC可以助力产品创新智能化、IT/网络运维智能化,甚至能够提供网络费用智能稽查、网络投诉“自服务机器人”等服务。智慧运营不仅可以提升运维效率,还能优化服务品质、提升用户体验。例如中国移动的“九天”AI平台,在网络智能化运营方面有诸多创新实践。

在创新业务方面如视联网、VR、直播等,AIGC不仅可以提升机器视觉算法的准确率,还能快速生成数字内容,提供个性化、沉浸式体验。这些创新业务为运营商带来新增长动力,例如天翼云的“明厨亮灶”服务,通过多种识别算法提升了食品安全保障;韩国KT的VR服务,可以提供丰富的互动内容。

在toB业务方面,“5G+工业互联网”有广阔的应用前景,比如智慧矿山、智慧校园等。面对运营商海量边缘业务场景,AIGC不仅可以帮助边缘IT平台实现业务自治,减少故障发生的次数;还能通过自主训练和推理不断提升边缘业务服务水平,提升对不同场景的适应性。如中国电信iStack(灵动版)边缘一体机,能够广泛应用于各种边缘AI场景。

AIGC到来,数据基础设施面临哪些挑战?

要想抓住AI发展机遇,就需要加强技术创新与基础设施建设。提及AI产业的基础设施,人们普遍会关注AI芯片、深度学习框架和预训练大模型,而忽略另一个关键问题——大模型将带来巨大的数据压力,数据存储是AI发展中的支柱。那么,从数据归集、数据预处理,到数据训练的AIGC大模型流程中,数据基础设施面临哪些挑战呢?

挑战一:数据归集慢

数据归集需从跨域多数据源中拷贝PB级原始数据。由于涉及数据迁移和数据汇聚,如果使用硬盘邮递进行数据迁移,需要数周时间;如果由本地向目标中心远程传输,也需要数天的时间。分散的多样化数据源实则造成了“数据孤岛”,在使用时无法有效快速归集数据。因此,如何打通“数据孤岛”、缩短归集时长,是我们面临的第一个挑战。

挑战二:数据预处理周期长

通过收集、网络爬取获得的原始数据不能直接用于AI模型训练,需要进行数据预处理,即对多样化、多格式的数据进行清洗、去重、过滤和加工。与传统单模态小模型相比,多模态大模型所需的训练数据量是其千倍以上,例如一个典型的百TB级大模型数据集,预处理的时长超过10天,占AI数据挖掘全流程的30%。同时,数据预处理常伴随频繁的高并发情况,对CPU消耗巨大。如何以低成本方式缩短数据预处理时长,是当前亟需解决的问题。

挑战三:训练易中断,数据恢复时间长

相较于传统深度学习模型,大模型训练带来了参数、数据集规模的指数级增加。目前,主流预训练模型的参数已达千亿级,今后将发展至万亿级。因此,频繁的参数调优、网络不稳定、服务器故障等因素会带来训练过程不稳定、易中断返工,预训练需要利用Checkpoint机制确保训练回退到某一个点,而不是初始点。当前,由于Checkpoint需要数天时间才能恢复,因此大模型整体训练周期延长,面对单次10TB的数据量和未来小时级的频度要求,产业界需要认真考虑如何减少Checkpoint恢复时长。综合来看,为确保AIGC大模型的持续创新突破,需要从数据存储的角度对归集、预处理和训练全流程进行优化。

面向AIGC,运营商智算中心需如何建设?

运营商加强AI智算中心建设,需要重视数据存力的建设,实现存算均衡发展。我们建议可以从以下方面考虑。

首先,消除“数据孤岛”,缩短归集时长。面对多数据源难以共享的问题,运营商需要构建智能数据编织能力,实现跨系统、跨地域、跨云的全局统一数据视图和调度。华为通过GFS(Global File System),帮助用户打通“数据孤岛”,提升3倍数据调度效率,实现小时级数据归集时长,更好地支持上层应用的数据价值挖掘。

其次,通过近数据加速,缩短数据预处理耗时。面向海量原始数据预处理任务,华为数据存储提供高效数据底座,支持多协议互通、免数据格式转换、高效识别多样化的数据格式;单节点340万IOPS满足海量数据并行预处理高性能要求;未来将支持预处理任务下推,由存储承接数据预处理任务,大幅减少CPU资源开销,实现降本增效。

最后,创新AI存储解决方案,减少Checkpoint恢复时长。面对大模型训练易中断、Checkpoint需快速恢复的要求,华为通过创新的AI存储解决方案,以及高带宽、大容量的存储设备,满足面向PB级数据、小时级频度的Checkpoint要求,提升训练预处理效率,支持万亿参数大模型训练。

AIGC奔涌而来,智算底座将成为千行百业创新变革的重要基石。生成式AI已进入网络运营、创新业务和toB边缘等运营商应用场景,华为数据存储通过创新的存储技术,打造领先的全闪存架构产品和解决方案,携手AI产业生态伙伴率先实现存储创新与AI发展的紧密契合,助力运营商构筑可靠AI数据基础设施。

通信世界网版权及免责声明:
1、凡本网注明“来源:通信世界全媒体”及标有原创的所有作品,版权均属于通信世界网。未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载我方内容的单位,也必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和本站来源。
2、凡本网注明“来源:XXX(非通信世界网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。
3、如因作品内容、版权和其它问题需要同本网联系的,请在相关作品刊发之日起30日内进行。
发表评论请先登录
...
热点文章
    暂无内容