国际AI顶会CVPR季军!天翼云AI团队在情感识别任务中实现新突破

责任编辑:朱文凤 2023.03.28 14:53 来源:通信世界全媒体

近日,国际人工智能顶会CVPR 2023举办的第5届自然场景情感行为分析挑战赛(5th Workshop and Competition on Affective Behavior Analysis in-the-wild,简称ABAW)公布比赛结果,天翼云AI团队(CtyunAI)在情感分类任务中表现出色,凭借极高的性能指标荣获本届大赛季军。

据了解,CVPR会议是由IEEE主办的关于计算机视觉和模式识别的国际学术会议,收录了该领域最新的研究成果和技术发展,是全球计算机视觉三大顶级会议之一。

ABAW竞赛是由国际顶级计算机视觉研究者和科学家们共同发起的竞赛,致力于解决自然情境下计算机对人的情感行为进行分析的问题,并以此提升人机交互系统的场景应用能力,目标是创造出能够理解人的感觉、情绪和行为的机器和机器人,从而让机器能够以“以人为本” 的方式与人类互动,并有效地作为人类的数字助手。

比赛共吸引了来自世界各地的100多支团队参加,其中不乏业内知名的机构和公司,如网易、思图等。参赛队伍需要对来源于现实场景的594个视频共300万帧图像进行分析,通过视频中的图像、人物、声音来预测指定人物在连续时间下的情感。

相较上届竞赛,本届竞赛的数据标签极度不平衡且标签噪声多,给参赛队伍带来了一定挑战。由于现实世界的环境不受条件控制,所以竞赛所使用的视频数据相较往届呈现更加多样的视频录制条件、背景和显示方式。同时,为了考验算法对不同拍摄环境、不同人群等情况的适应能力(迁移学习能力),竞赛数据的样本分布极不均衡,也增加了竞赛难度。

天翼云AI团队在本次竞赛中使用了多模态融合技术,通过不同模型同时提取视频的图像和音频特征,将这些特征进行融合后利用时域卷积网络(Temporal Convolutional Network,TCN)和Transformer对数据在时间维度上进行建模,从而使模型能够通过视频的上下文对结果进行预测,大大提升了模型的任务表现。在情感识别任务中,该模型针对人类的六个基本情感(快乐、厌恶、悲伤、愤怒、惊奇、恐惧),以及中立情感进行识别,实现了F1-score超过0.35的好成绩。

本次天翼云AI团队能够在竞争激烈的ABAW竞赛中取得优异成绩,得益于天翼云多年来在图像、音频及多模态领域的深厚积累和不断创新。通过在更广阔的人工智能领域中继续研究和探索,天翼云致力于以更先进的技术和更优秀的成果回报社会和用户,将有助于推动千行百业共享数字化发展成果。


通信世界网版权及免责声明:
1、凡本网注明“来源:通信世界全媒体”及标有原创的所有作品,版权均属于通信世界网。未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载我方内容的单位,也必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和本站来源。
2、凡本网注明“来源:XXX(非通信世界网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。
3、如因作品内容、版权和其它问题需要同本网联系的,请在相关作品刊发之日起30日内进行。
发表评论请先登录
...
热点文章
    暂无内容