余华,谷歌大脑提出NAS-FPN:这是一种学会主动架构查找的特征金字塔网络,qq通讯录

频道:今日头条 日期: 浏览:283
虎骨蝌蚪纹图片赏识

选自arXiv

作者:Golnaz Ghaisi、Tsung-Yi Lin、Ruoming Pang、Quoc V. Le

机器之心编辑部

方针检测也能用神经架构查找,这是一个自动查找的特征金字塔网络。

神经架构查找现已在图画识别上展现出很强的才能,不论是可微架构查找的速度,仍是根据强化学习查找的精确度,许多时分自动架构查找现已逾越了咱们手动规划的版别。与此一起,学习视觉的特征表明是核算机视觉中的一个基本问题。不论是图画分类仍是方针检测,抽取图画特征才是最首要的。

在曩昔几年里,用于图画分类和方针检测的深度卷积网络在架构查找方面取得了很大发展。与猜测图画类别概率的图画分类不同,方针检测在大范围的标准和方位上检测和定位多个方针时存在本身的应战。为了处理这个问题,许多现代方针检测器遍及运用金字塔特征表明,它表明具有多标准特征层的图画。

在这篇论文中,谷歌大脑的囚夺小厮 Quoc V. Le 等研究者提出了一种新的架构查找办法 NAS-FPN。他们期望凭借神经架构查找的优势,并学习更好的方针检测特征金字塔网络架构。现在 NAS-FPN 完成了优于当时最佳方针检测模型的精确率和推迟权衡

金梅瓶

方针检测中的神经架构查找

特征金字塔网络(FPN)是方针检测中生成金字塔形状特征表明的代表性模型架构之一。它选用一般为图画分类规划的主干模型,然后经过自上而下和横向衔接,并组合不同的特征层来构建李丹辽中特征金字塔。FPN 替代了检测器(如 Fa口爆店ster R-CNN)中的特征提取器,并生成更高质量的金字塔特征图。

图注:特征金字塔网络,选自 arXiv: 1612.03144。

FPN 由自下而上和自上而下途径组成。其间自下而上的途径是用于提取特征的常用卷积网络,空间分辩率自下而上地下降。当空间分辩率下降,且检测到更高层的结构时,每层的语义值增加。

规划特征金字塔架构的应战在于其巨大的规划空间。组合不同标准的或许衔接数量跟着网络层数的增加呈指数级增加。puremature最近,神经架构查找算法在巨大的查找空间中有效地发现了用于图画分类的高功能架构。为了完成这个范畴的成果,Quoc V. Le 等研究者提出生成金字塔表明的可扩展架构查找空间。

NAS-FPN:一种灵敏的方针检测新办法

本文的首要奉献是规划查找空间蒂雅莉,掩盖一切或许的跨标准衔接,已生成多标准特征表明。在查找过程中,研究者的方针是发现具有相同输入和输出特征等级而且能够被重复运用的微粒架构。模块化查找空间使得查找金字塔架构变得易于办理。模块化金字塔架构的另一个优点是能够随时检测方针(即「early exit」),尽管这种「early exit」办法现已被尝试过,但手动规划这种架构仍旧适当困难。

研究者构建的架构,即 NAS-FPN,在构建方针检测架构方面具有很大的灵敏性。NAS-FPN 与各种主干模型合作得很好,如 MobileNet、ResNet、AmoebaNet。它为移动端模型和高精确率模型在速度和精确率方面供给了更好的权衡。

在相同的推理时刻下,与 RetinaNet 结构中的 MobileNetVdoubles~刑警二人组2 主干模型相结合,它的功能逾越当时最佳的移动检测模型(与 Mob余华,谷歌大脑提出NAS-FPN:这是一种学会自动架构查找的特征金字塔网络,qq通讯录ilenetV2 结合的 SSDLite)2 个 AP。与强壮的 AmoebaNet-D 主干模型结合,NASFPN 在单个测验规划中达到了 48.3 的 AP 单模型精确率。其检测精确率逾越了 Mask RCNN,一起运用的推理时刻更少。几种模型的详细成果如图 林婉馨的大学生活1 所示。

图 1:移动设备上精确型模型(上)和快速型模型(下)的均匀精度与揣度时刻联络。绿色折线是 NASFPN 与 RetinaNet 相结合的成果。详情请看图 9。

论文:NAS-FPN: Learning Scalable Feature Pyramid Architecture for Object Detection

论文地址:https://arxiv.邱小雄org/pdf/1904.07392.pdf

摘要:当时最先进的方针检fakeagent测卷积架构都是人工规划的。在这项作业中,咱们的方针是学习更好的方针检测特征金字塔网络架构。咱们选用了神经架构查找,在一个包括一切跨标准衔接的新的可扩展查找空间中发现了一个新的特征金字塔架构。这个名为 NAS-FPN 的架构包括自上而下和自下而上的衔接,以交融各种标准的特征。NAS-FPN 与 十分简略的野鸡套RetinaNet 结构中的若干主干模型相结合,完成了优于当时最佳方针检测模型的精确率和推迟权衡。该架构将移动检测精确率提高了 2 A余华,谷歌大脑提出NAS-FPN:这是一种学会自动架构查找的特征金字塔网络,qq通讯录P,优于 [32] 中的当时最佳模型——与 MobileNetV2 相结合的 SSDLite,达到了 48.3 AP,逾越了 Mask R-CNN [10] 的检测精确率,且核算时刻更少。

办法

本文中的办法根据 RetinaNet 结构 [23],由于该结构简略、高效。RetinaNet 结构有两个首要的组成部分:一个骨架网络(一般是当时最优余华,谷歌大脑提出NAS-FPN:这是一种学会自动架构查找的特征金字塔网络,qq通讯录的图画分类网络)和一个特征金字塔网络(FPN)。本文算法的方针是为 RetinaNet 结构发现更好的 FPN 架构。图 2 所示为 RetinaNet 架构。

图 2:带有 NAS-FPN 的 RetinaNet。在本文中,特征金字塔网络将由神经架构查找算法来查找。主干网络和用于类和框猜测的子网络遵从 RetinaNet [23] 中的原始规划。FPN 的架构能够堆叠屡次,以取得更高的精确率。

为了找到更好的 FPN,研究者使用 Quoc Le 等人在「Neural architecture search with reinforcement余华,谷歌大脑提出NAS-FPN:这是一种学会自动架构查找的特征金字塔网络,qq通讯录 learning」中提出的神经架构查找(NAS)结构。NAS 使用强化学习练习控制器在给定的查找空间中挑选最优的模型架构。控制器使用子模型在查找空间中的精确度作为奖赏信号来更新其参数。因而,余华,谷歌大脑提出NAS-FPN:这是一种学会自动架构查找的特征金字塔网络,qq通讯录经过重复试验,控制器逐步学会了怎么生成更好的架构。

研究者还为 FPN 规划了一个查找空间来生成特征金字塔表征。为了完成 FPN 的可扩展性,研究者强制 FPN 在查找过程中重复 N 次,然后衔接到一个大型架构中。他们将这一特征金字塔架构命名为 NAS-FPN。

试验

这一部分描绘了学习一个 RNN 余华,谷歌大脑提出NAS-FPN:这是一种学会自动架构查找的特征金字塔网络,qq通讯录控制器来发现 NAS-FPN 架构的神经架构查找试验。然后,研究者证明晰他们发现的 NAS-FPN 在不同的主干模型和图画巨细下都能很好地作业。在金字塔网络中,经过改动叠加层鱼牛的故事数和特征维数,能够很容易地调整 NAS-FPN 的容量。此外,作者还在试验中展现了怎么构建精确、快小寡妇上坟哭十二月苦速的架构。

图 5:左:强化学习练习的奖赏。核算奖赏的办法为在署理使命上采样架构的 AP。右:采样的共同架构数与架构总数。跟着控制器逐步收敛,控制器会采样到越来越多的相同架构。

图 6:5 个输入层(黄色)和 5 个输出特征层(蓝色)的 NAS-FPN 中发现的 7-merging-cell 金字塔网络架构。GP:大局池化;R-C-B:ReLU-Conv-BatchNorm。

图 7:NAS-FPN 的架构图。每个点代表一个特征层,同一行的特征层具有相同的分辩率,分辩率由下往上递减。箭头表明内层之间的衔接,该图的结构是输入层位于左边。金字塔网络的输入用绿色圆圈符号,输出用赤色圆圈符号。(a)基线 FPN 架构。(b~f)在 RNN 控制器的练习中经过神经架构查找发现的 7-cell NAS-FPN 架构。(f)试验中最终收敛得出的 NAS-FPN。

图 8:NAS-FPN 的模型容量。(a)叠加金字塔网络,(b)改动主干架构,(c)增加金字塔网络中的特征维度。一切的模型都是在 640x640 的图画巨细上练习/测验的。符号上方的数字表明在 NAS-FPN 中金字塔网络的数量。

图 9:检测精确率和推理时刻的折衷(左)、浮点数(中)、参数(右)。(a)研究者将其与其他高精确率模型进行了比照。一切模型的推理时刻都是在一个搭载 P100 GPU 的设备上核算出来的。绿色折线显现的是具有不同主干架构的 NAS-FPN 成果。该符号上的数字表明在 NAS-FPN 中金丫鬟郑媛字塔网络的重复次数。在每个数据点周围都表明晰 NAS-FPN/FPN 的特征维数法兰西组曲和输入图画巨细。(b)研究者将自己的模型与其他快速模型进行了比照,其间一切模型的输入图画巨细为 320x320,推理时刻是在 Pixel 1 CPU 上核算的。本文中的模型是用 MobileNetV2 的轻型模型练习的。

表 1:NAS-FPN 和其他当时最优检测器在 COCO 测验人形恶屌数据集上的功能体现同仁圣方。

图 10:特征维数为 256 或 384 的 NAS-FPN 在练习时有无 DropBlock (DB) 的功能比照。模型和 ResNet-50 主干模型在巨细为 1024x1024 的图画上练习。当咱们在金字塔网络中增加特征维数时,增加 DropBlock 变得更重要。

本文为机器之心编译,转载请联络本大众号取得授权。

声明:该文观念仅代表作者自己,搜狐余华,谷歌大脑提出NAS-FPN:这是一种学会自动架构查找的特征金字塔网络,qq通讯录号系信息发布渠道,搜狐仅供给蓝地女装官方旗舰店信息存储空间效劳。
热门
最新
推荐
标签