互联网 频道

“AI看视频”谁最牛?中国两团队分获冠亚军德国第三

  【IT168 应用】日前,ActivityNet组织者通过官网宣布,2017年度的“Kinetics视频行为分类比赛”结束,来自百度的Genome团队在ActivityNet 2017中获得Kinetics行为分类比赛的第一名,香港中文大学获得第二名,德国创业公司TwentyBN获得第三名。

  ActivityNet是目前视频动作分析领域影响力最大的赛事,每年都会吸引MSRA、CUHK、CMU、UTS等众多高校和科研机构积极参加。ActivityNet Challenge今年共有五项任务,新增“Kinetics”和“ActivityNet Captioning”两个数据集。其中“Kinetics视频行为分类比赛”,由Deepmind 主办,有400个动作类别,大约20万训练语料, 也是ActivityNet“含金量”最高的任务。

  在此之后,CVPR大会邀请了ActivityNet各项任务第一名队伍并发表获奖报告。Genome团队介绍了其在ActivityNet Kinetics数据集上的视频识别任务解决方案,包含四种全新的视频行为分类方法,可以显著地改进大规模视频分类任务的效果。百度AI开放平台显示,该项技术已经运用在百度手机客户端上,通过视频内容分析技术,对视频进行语音、文字、人脸、物体等多维度分析,自动抽取视频内容标签,解决新视频冷启动推荐问题,实现个性化推荐;此外,快速为视频生成热门标签,解决了视频缺乏关键词无法露出的问题。

  利用类似的算法,Genome团队还在YouTube-8M大规模视频理解竞赛中进入三甲,参赛队伍多达650只。Youtube-8M数据集由谷歌今年2月在Kaggle平台发起,拥有约800万的已标注视频,是目前全球规模最大的视频数据集之一。

  与文本内容不同,视频通常需要预先标注出关键字,才能被用户检索到,进而决定是否打开。但大量的视频因缺乏内容标签,一方面无法被检索,另一方面用户也很难快速知道视频内容,造成用户找不到想要的内容,视频的播放量无法有效提升的状况。如何分析视频内容并进行有效分类,成为业界最关注的核心问题之一。值得一提的是,视频分类技术可快速为视频生成热门标签,解决视频缺乏关键词无法露出的问题,对Feed流短视频自动进行分类,供短视频的个性化推荐和内容检索服务使用,既能提升视频服务效果,又可以节省人力标注成本。

  作为重要的内容载体,视频已经成为信息获取的重要来源之一。根据QuestMobile发布的《移动互联网2017春季报告》中的数据,包括在线视频、网络直播、短视频等行业,移动视频的用户月度总规模首次突破10亿,同比增长36.5%。短视频正处于爆发的关键节点。而在中国,目前国内短视频正在“风口”,用户通过视频获取信息的需求日益增长,feed信息流是其中非常简单高效的一种方式,许多公司已将短视频内容放置于应用首页的关键位置大力推举。

  专家表示,无论是ActivityNet竞赛还是YouTube-8M,都是将在大型数据集上的预训练泛化到其它数据集上,帮助开发者于几天时间内就在数百万个样本上完成模型的训练,带来在视频理解和表征学习上的进步,本届Kinetics比赛取得的突破显示,从为普通用户提供更多更全的分类标签开始,AI技术与视频的结合即将规模化应用于生活场景,这将带来全新的巨大市场机会。

0
相关文章