近日,国际人工智能顶会CVPR 2023举办的第5届自然场景情感行为分析挑战赛(5th Workshop and Competition on Affective Behavior Analysis in-the-wild,简称ABAW)公布比赛结果,天翼云AI团队(CtyunAI)在情感分类任务中表现出色,凭借极高的性能指标荣获本届大赛季军。
据了解,CVPR会议是由IEEE主办的关于计算机视觉和模式识别的国际学术会议,收录了该领域最新的研究成果和技术发展,是全球计算机视觉三大优异会议之一。
ABAW竞赛是由国际优异计算机视觉研究者和科学家们共同发起的竞赛,致力于解决自然情境下计算机对人的情感行为进行分析的问题,并以此提升人机交互系统的场景应用能力,目标是创造出能够理解人的感觉、情绪和行为的机器和机器人,从而让机器能够以“以人为本” 的方式与人类互动,并有效地作为人类的数字助手。
比赛共吸引了来自世界各地的100多支团队参加,其中不乏业内知名的机构和公司,如网易、思图等。参赛队伍需要对来源于现实场景的594个视频共300万帧图像进行分析,通过视频中的图像、人物、声音来预测指定人物在连续时间下的情感。
相较上届竞赛,本届竞赛的数据标签极度不平衡且标签噪声多,给参赛队伍带来了一定挑战。由于现实世界的环境不受条件控制,所以竞赛所使用的视频数据相较往届呈现更加多样的视频录制条件、背景和显示方式。同时,为了考验算法对不同拍摄环境、不同人群等情况的适应能力(迁移学习能力),竞赛数据的样本分布极不均衡,也增加了竞赛难度。
天翼云AI团队在本次竞赛中使用了多模态融合技术,通过不同模型同时提取视频的图像和音频特征,将这些特征进行融合后利用时域卷积网络(Temporal Convolutional Network,TCN)和Transformer对数据在时间维度上进行建模,从而使模型能够通过视频的上下文对结果进行预测,大大提升了模型的任务表现。在情感识别任务中,该模型针对人类的六个基本情感(快乐、厌恶、悲伤、愤怒、惊奇、恐惧),以及中立情感进行识别,实现了F1-score超过0.35的好成绩。
本次天翼云AI团队能够在竞争激烈的ABAW竞赛中取得优异成绩,得益于天翼云多年来在图像、音频及多模态领域的深厚积累和不断创新。通过在更广阔的人工智能领域中继续研究和探索,天翼云致力于以更先进的技术和更优秀的成果回报社会和用户,将有助于推动千行百业共享数字化发展成果。