两会时间 | 全国人大代表,中国铁塔党委书记、董事长张志勇:推进行业大模型高质量发展

责任编辑:包建羽 2024.03.05 15:28 来源:通信世界全媒体

通信世界网消息(CWW)人工智能的迅速发展为人类社会经济社会发展持续注入新动能。近年来,以大模型为代表的技术突破广泛应用于各个领域,推动产业升级和变革,引发了世界范围内的研究热潮。我国虽在基础理论、原创模型方面较美国有一定差距,但我国是制造大国,拥有健全的工业门类和产业高端化、数字化、绿能化的迫切需求,为大模型创新发展提供了更为广阔的实践空间。2024年全国两会,全国人大代表,中国铁塔党委书记、董事长张志勇提交了《关于推进行业大模型高质量发展的建议》

1709625048074010097.png

张志勇指出,随着各级政府支持政策陆续出台,从算力支持、场景开放、技术突破、产品生态等方面鼓励大模型发展。但现阶段算力资源不足、数据质量不高、场景开放不够、应用部署成本高、模型数据安全风险等问题,对行业大模型的发展形成了一定制约。

一是算力资源不足。目前国内高端智算芯片供不应求,各大云厂商算力面临一定程度紧缺,价格不断上涨。同时,跨数据中心的算力协同方面也存在不小挑战,智算中心算力利用率和效率不够高。能够提供训练和推理一体化算力供给的单体超大规模智算中心较少,其中国产AI训练和推理芯片、深度学习框架占比偏低,自主可控、安全可靠成为行业大模型发展的短板。

二是高质量数据成为掣肘大模型发展的关键。大模型在前期训练阶段和后期调优阶段都需要海量的数据支撑,数据质量直接影响大模型“聪明”程度,训练数据集的分布特征和多样性也会影响大模型的能力。目前市场上缺少高质量的行业公开数据,很多大模型企业使用相同的开源数据集,无法快速帮助其构建契合行业特点、差异化的大模型;而掌握丰富行业数据的企业又缺乏大模型研发能力,掣肘了行业大模型的创新发展。

三是场景开放不够。行业大模型是否好用,取决于应用价值和丰富的场景选择。对行业大模型预训练、模型微调、模型蒸馏过程中,除了投喂大量数据进行训练,还需要保证各个场景的数据质量,使得大模型能够很好地、高质量地掌握该领域行业知识。在开放场景中,相关数据可以通过公开手段获得,但在面向行业的“封闭场景”中,大模型所需的行业多场景优质数据集不容易获得,导致行业大模型自我迭代能力较弱。

四是应用部署成本高。现阶段大模型原生应用或杀手级应用并未形成,短期内行业大模型技术和业务尚未有机融合,研发和应用部署成本高,很难创造额外价值。行业大模型中心侧训练和边缘侧推理的软硬件投入高,如单台算力服务器最大功率是6.5kW,运行一小时需要6.5度电,按照平均工业用电每度0.63元计算,一台服务器开一天(24小时)的电费约200元,如果是1000台服务器,一天的纯电费支出就是约20万元,租用算力的价格也出现了上涨趋势。

五是模型数据安全风险需要关注。如何保证在利用大数据的同时,确保数据的安全,是行业应用大模型必须考虑的问题。目前看,行业大模型研发和应用过程中,面临的生成内容合规可信、模型本身安全(如开源陷阱、数据投毒)、业务数据丢失、个人隐私数据安全等风险需要关注。

基于此,张志勇提出了以下五点建议:

一是提升算力资源供给能力。建立算力资源公共调度平台,促进算力资源协同共享,提升算力资源利用效能。同时,提升自主创新能力,在政策引导、品牌推广、行业采购等层面加大对国产硬件的支持力度,推进AI深度学习框架、AI硬件计算100%国产化。加快推动能够提供训练和推理一体化的单体超大规模行业智算中心建设。

二是提升行业数据供给水平。制定统一标准的数据架构,鼓励各类企业建设高水平行业数据集,加强行业数据流通交易,建立多类多模态新型公共数据集,增强高质量数据供给;制定数据开放相关政策,引导行业龙头企业开放非敏感数据,全面提高数据资源开发利用水平,让数据“供得出”“流得动”“用得好”,为行业大模型成长提供充足“养料”。

三是加快创新应用场景建设。发挥我国应用场景丰富的优势,加强企业主导的产学研深度融合,在国家统筹部署下,引导企业开放应用场景;举办基于生产场景应用的人工智能算法大赛,加快资本、人才、技术、数据、算力等要素汇聚;进一步加强多模态、多场景、多任务的行业大模型人工智能技术研发,促进科技成果转化,推动大模型在行业应用中不断提升能力。

四是降低应用部署成本。打造人工智能创新开放体系,进一步开放算力平台、共性技术平台、行业训练数据集、仿真训练平台等人工智能基础设施;打造协同创新的人工智能产业发展联合体,开源平台和开源生态,促进破除商业化禁用限制,进一步降低算力成本,使大模型的使用“普惠化”。进一步加强中心侧高性能人工智能芯片和低功耗面向多场景、行业应用的边端侧推理芯片的研发,进一步降低使用成本。

五是加强模型数据安全。加快推进人工智能立法,出台暂行办法保障大模型安全发展。构建行业大模型内生安全体系,建立全面的软硬件安全、网络安全、数据安全、模型算法可信增强、个人信息保护的立体化安全保障体系。

六是加强产业政策扶持和人才培养。加快完善相关产业政策,进一步支持算力、数据、工具、平台、应用场景等基础设施建设,持续提升行业大模型创新应用推广、行业数据开放共享、数据安全治理水平,完善行业大模型创新发展的保障体系;特别是随着掌握人工智能基本技能的人力需求急剧增长,要加快人工智能人才的培养和储备,注重应用型人工智能人才培养,满足各行业对人工智能人才的需求。

image.png

据悉,中国铁塔正推动高质量完成“天-临-空-地森林火灾协同监测体系集成与应用示范”等国家专项中承担的研发任务。同时,组织“空间治理行业大模型”等重点任务攻关,推动输出高层次有份量的科技成果。近年来,中国铁塔围绕视觉感知、数据采集、图像分析、信息处理等数字化需求,研发打造了全国统一开放的铁塔视联平台,形成了标准规范、按需定制、丰富多样的“铁塔视联”产品,通过“铁塔﹢5G﹢AI”,为千行百业装配“千里眼”“顺风耳”“智慧脑”,全力服务数字治理、助力数字中国、赋能千行百业。目前已有近22万座“通信塔”升级为“数字塔”,广泛服务于环保、林草、农业、国土、水利、交通、应急、政法等40多个关系国计民生的关键领域,助力监管近4.8亿亩农田秸秆焚烧行为,为50万平方公里林区提供防火预警服务,守护超7000万亩耕地、4700多条河道、2300多个水库。以长江大保护为例,中国铁塔在全国15个省(区、市)利用存量通信铁塔6500座建设高低视频监控点位7207个、雷达监测点位300余个,覆盖超400个区县重点水域,为渔政执法提供智慧监管服务,有效解决违法行为发现难、取证固证难、执法处置慢、人工成本高、监管任务重等难题,显著提升了长江保护数字治理水平。

通信世界网版权及免责声明:
1、凡本网注明“来源:通信世界全媒体”及标有原创的所有作品,版权均属于通信世界网。未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载我方内容的单位,也必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和本站来源。
2、凡本网注明“来源:XXX(非通信世界网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。
3、如因作品内容、版权和其它问题需要同本网联系的,请在相关作品刊发之日起30日内进行。
发表评论请先登录
...
热点文章
    暂无内容