中国信通院牵头的两项数字人国际标准发布在即

责任编辑:甄清岚 2022.02.15 07:16 来源:通信世界网

通信世界网消息(CWW)2022年1月28日,国际电信联盟标准化局(ITU-T)在第16研究组的全会上正式冻结了中国信息通信研究院(以下简称“中国信通院”)云计算与大数据研究所牵头制定的两项数字人标准——ITU-T F.748.15 “Framework and metrics for digital human application system”(数字人应用系统基础框架和评测指标)和ITU-T F.748.14 “Requirements and evaluation methods of non-interactive 2D real-person digital human application system”(非交互式2D真人形象类数字人应用系统指标要求和评估方法)。两项国际标准即将于近期发布。

数字人作为一种全新的生成式人工智能技术,市场前景广阔,目前已经在传媒内容播报、金融客户服务、电商直播带货等场景孵化出典型应用。一方面能够推动数字内容生产从劳动密集型向科技密集型转变,打造数字内容生成新范式;另一方面可塑造视听双通道的多模态交互体验,有效赋能行业。2021年以来,在元宇宙概念的刺激下,数字人技术应用呈现蓬勃发展态势。但由于技术实力和成本等原因,市场上数字人产品质量良莠不齐,造成各行业对数字人的应用信心不足。

为引导数字人产业健康发展,促进数字人技术、产品进步,2021年4月,中国信通院牵头在ITU-T SG16的Q5(第五课题组——Artificial intelligence-enabled multimedia applications)成功立项了“数字人应用系统基础框架和评测指标”和“非交互式2D真人形象类数字人应用系统指标要求和评估方法”的标准研制项目。这两项标准在研究与编制过程中受到了多方关注,经过与英国、加拿大、俄罗斯、美国、日本等国际专家的深入研讨,最终在2022年1月的SG16全会上就技术内容达成一致,获全会通过,成功冻结。

ITU-T F.748.15聚焦于数字人应用系统,首次明确了数字人(“digital human”)的定义,提出了数字人应用系统的参考框架,并分别从形象、语音、动作、交互处理、多模态输入、多模态输出等维度规范了相应的技术评估指标。该标准作为数字人技术、产品和服务评估指南,可以帮助相关方评估和比较不同的数字人应用系统,对于数字人应用系统研发、选型、测试等都具有很强的指导意义。

ITU-T F.748.14则是面向非交互式2D真人形象类数字人应用系统,定义了2D数字人、2D真人形象类数字人、非交互式数字人的相关概念,并结合ITU-T F.748.15,从形象、语音、动作、多模态输入、多模态输出等维度提出了相应的指标要求以及具体的评估方法。该标准的输出,对指导非交互式2D真人形象类数字人应用系统的设计与开发,促进相应产品成熟,具有非常深远的意义。

这两项数字人国际标准均由中国信通院牵头并担任编辑人(Editor)。其评测指标和测试方法均采纳了中国人工智能产业发展联盟及内容科技产业推进方阵的评估规范和中国通信标准化协会行业标准的相关内容,参与单位包括百度、腾讯、南京新一代人工智能研究院有限公司、凌云光、网易、商汤、央视网、科大讯飞、北京航空航天大学等20余家企业、高校及科研机构。

数字人国际标准的正式冻结,标志着我国在数字人领域评测能力得到了国际认可,是我国数字人科研人员对国际标准化研究的重要贡献,也为我国数字人技术、产品和评测走出国门开辟了道路。


通信世界网版权及免责声明:
1、凡本网注明“来源:通信世界全媒体”及标有原创的所有作品,版权均属于通信世界网。未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载我方内容的单位,也必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和本站来源。
2、凡本网注明“来源:XXX(非通信世界网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。
3、如因作品内容、版权和其它问题需要同本网联系的,请在相关作品刊发之日起30日内进行。
发表评论请先登录
...
热点文章
    暂无内容