CVPR 2018 | 密歇根大学&谷歌提出TAL-Net:将Faster R

选自arXiv [原文来自:www.11jj.com]

作者:Yu-Wei Chao等 [好文分享:www.11jj.com]

机器之心编译

参与:Geek AI、路

近日,密歇根大学和谷歌研究院的一项研究提出了时序动作定位网络 TAL-Net,该网络将之前常用于图像目标检测的 Faster R-CNN 网络应用于视频时序动作定位中。在 THUMOS"14 检测基准上,TAL-Net 在动作提名(action proposal)和定位上都取得了目前最好的性能,并且在 ActivityNet 数据集上取得了具有竞争力的性能。目前,该论文已被 CVPR 2018 大会接收。

对人类动作的视觉理解是构建辅助人工智能系统所需的核心能力。在传统的研究中,这个问题通常在动作分类的范畴内被研究 [46, 37, 30],其目标是对一个按照时序剪辑的视频片段进行强制选择(forced-choice)分类,分类为若干动作类型中的一类。尽管人们在此领域的研究取得了累累硕果,但这种分类的设定是不现实的,因为现实世界中的视频通常是没有剪辑过的,而且我们感兴趣的行为通常也内嵌在与其不相关的活动背景中。最近的研究关注点已经逐渐向未剪辑视频中的时序动作定位转移 [24, 32, 47],其任务不仅仅是识别动作的类别,还需要检测每个动作实例的开始和结束时间。时序动作定位的改进可以推动大量重要课题的发展,从提取体育运动视频中的精彩片段这样的即时应用,到更高级的任务,如自动视频字幕。

时序动作定位,和目标检测一样,都属于视觉检测问题的范畴。然而,目标检测旨在生成物体在二维图像中的空间边界框,时序动作定位则是要在一维的帧序列中生成时序片段。因此,许多动作定位的方法从目标检测技术的进展中得到启发。一个成功的例子是:基于区域的检测器的使用 [18, 17, 33]。这些方法首先从完整的图像中生成一个与类别无关的候选区域的集合,然后遍历这些候选区域,对其进行目标分类。要想检测动作,我们可以遵循这一范式,先从整个视频中生成候选片段,然后对每个候选片段进行分类。

在基于区域的检测器中,Faster R-CNN [33] 由于其在公开的对比基准上极具竞争力的检测精度,被广泛应用于目标检测。Faster R-CNN 的核心思想是利用深度神经网络(DNN)的巨大容量推动候选区域生成和目标检测这两个过程。考虑到它在图像目标检测方面的成功,将 Faster R-CNN 用到视频时序动作定位也引起了研究者极大的兴趣。然而,这种领域的转变也带来了一系列挑战。本论文作者回顾了 Faster R-CNN 在动作定位领域存在的问题,并重新设计了网络架构,来具体地解决问题。研究者重点关注以下几个方面:

1. 如何处理动作持续时间的巨大差异?与图像中物体的大小相比,动作的时间范围差别很大——从零点几秒到几分钟不等。但是,Faster R-CNN 根据共享的特征表示对不同规模的候选片段(即 anchor)进行评估,由于特征的时间范围(即感受野)和 anchor 跨度在对齐时存在偏差,因此 Faster R-CNN 可能无法捕获相关的信息。研究者提出使用 multi-tower 网络和扩张时序卷积(dilated temporal convolution)来执行此类对齐工作。

2. 如何利用时序上下文(temporal context)?动作实例之前和之后的时刻包含用于定位和分类的关键信息(可能比目标检测中的空间上下文更重要)。直接简单地将 Faster R-CNN 应用于时序动作定位可能无法利用时序上下文。研究者提出通过扩展生成候选片段和动作分类的感受野来显性地对时序上下文进行编码。

自媒体 微信号:11jj 扫描二维码关注公众号
爱八卦,爱爆料。

小编推荐

  1. 1

    特价机票同程(机票预订同程)

    大家好,小豪今天来为大家解答特价机票同程以下问题,机票预订同程很多人还不知道,现在让我们一起来看看吧!1、 价格是否低于平均水平:你可

  2. 2

    从头肉到尾的小说(从头肉到尾的小说)

    大家好,小豪今天来为大家解答从头肉到尾的小说以下问题,从头肉到尾的小说很多人还不知道,现在让我们一起来看看吧!1、我只看过一部这样的

  3. 3

    白 鸽

    凡夫夕拾 2024-04-09 11:44 上海我没有想到,像我如许一个无足轻重的知青,期近将与我插队生活了八年的松树沟道别的最后一刻,竟会有这么多老乡来

  4. 4

    死沼巨鳄在什么位置(死沼巨鳄在什么位置)

    大家好,小伟今天来为大家解答死沼巨鳄在什么位置以下问题,死沼巨鳄在什么位置很多人还不知道,现在让我们一起来看看吧!1、就在尘泥沼泽中

  5. 5

    我市以新乡人、原乡人、归乡人为主体,将新农人队伍建设作为推进乡村振兴“换人超车”之举——万千现代新农人 筑梦绿水青山间

    村庄振兴,人才先行。本年中央一号文件凸起强调了“强大村庄人才部队”,就村庄人才振兴作出了周全布置。这也表明,落实村庄人才振兴计谋既

  6. 6

    测手速的软件游戏(测手速的手机软件)

    大家好,小伟今天来为大家解答测手速的软件游戏以下问题,测手速的手机软件很多人还不知道,现在让我们一起来看看吧!1、《我手速超快》《我

  7. 7

    绍兴事业单位招聘网(绍兴事业单位招聘网官网怎么登录)

    大家好,小娟今天来为大家解答绍兴事业单位招聘网以下问题,绍兴事业单位招聘网官网怎么登录很多人还不知道,现在让我们一起来看看吧!1、

  8. 8

    本科一批b(本科一批b段可以报几个志愿)

    大家好,小伟今天来为大家解答本科一批b以下问题,本科一批b段可以报几个志愿很多人还不知道,现在让我们一起来看看吧!1、本科一批B是指高考

Copyright 2024.依依自媒体,让大家了解更多图文资讯!