【Feature Pyramid Networks for Object Detection】

Feature Pyramid Networks for Object Detection

    • 摘要
    • 引言
    • 2 相关工作
    • 3 FPN
    • 4 应用

摘要

特征金字塔是识别系统中用于检测不同尺度对象的基本组件。但是,最近的深度学习对象检测器已经避免了金字塔表示,部分原因是它们在计算和内存方面都很密集。在这篇论文中,我们利用深度卷积网络的固有多尺度、金字塔层次结构来构建特征金字塔,额外的成本几乎可以忽略不计。我们开发了一种自顶向下的架构,通过横向连接来构建所有尺度的高级语义特征图。这种架构被称为特征金字塔网络(FPN),在多个应用中作为通用特征提取器显示出显著的改进。在基本的Faster R-CNN系统中使用FPN,我们的方法在COCO检测基准上实现了最先进的单模型结果,无需任何额外的技巧,超过了所有现有的单模型条目,包括COCO 2016挑战赛的获胜者。此外,我们的方法可以在GPU上以6 FPS的速度运行,因此是一种实用且准确的多尺度对象检测解决方案。代码将公开提供。

引言

识别不同尺度的物体是计算机视觉中的一个基本挑战。基于图像金字塔构建的特征金字塔(简称为特征化图像金字塔)构成了一种标准解决方案的基础【1】(图1(a))。这些金字塔在某种意义上是尺度不变的,因为物体的尺度变化可以通过在金字塔中移动其层级来抵消。直观上,这一特性使得模型能够通过在不同位置和金字塔层级上扫描,检测出各种尺度范围内的物体。

在手工设计特征的时代,特征化图像金字塔被广泛使用【5,25】。它们是如此关键,以至于像DPM【7】这样的目标检测器需要密集的尺度采样(例如,每个倍频有10个尺度)才能取得良好的效果。在识别任务中,手工设计的特征已经很大程度上被深度卷积网络(ConvNets)计算的特征所取代【19,20】。除了能够表示更高级别的语义外,ConvNets还对尺度变化更具鲁棒性,从而有助于通过单一输入尺度的特征进行识别【15,11,29】(图1(b))。但即便具备这种鲁棒性,金字塔仍然是获得最准确结果所必需的。在最近的ImageNet【33】和COCO【21】检测挑战中,所有顶尖的参赛作品都使用了特征化图像金字塔的多尺度测试(例如【16,35】)。对图像金字塔的每一层进行特征化的主要优势在于,它生成了一个多尺度特征表示,其中所有层级都具有较强的语义,包括高分辨率层级。
在这里插入图片描述
图1. (a) 使用图像金字塔构建特征金字塔。特征是在每个图像尺度上独立计算的,这样做速度较慢。(b) 近期的检测系统选择仅使用单一尺度特征进行快速检测。© 另一种方法是重用ConvNet计算出的金字塔特征层级,将其视为特征化的图像金字塔。(d) 我们提出的特征金字塔网络(FPN)与(b)和©一样快速,但更加准确。在此图中,特征图由蓝色轮廓表示,较粗的轮廓表示语义上更强的特征。

尽管如此,对图像金字塔的每一层进行特征化仍然存在明显的局限性。推理时间显著增加(例如,增加四倍【11】),这使得这种方法在实际应用中变得不切实际。此外,在图像金字塔上端到端训练深度网络在内存方面也是不可行的,因此如果使用图像金字塔,它们只在测试时使用【15,11,16,35】,这在训练和测试时间推理之间造成了不一致性。出于这些原因,Fast R-CNN和Faster R-CNN【11,29】在默认设置下选择不使用特征化图像金字塔。

然而,图像金字塔并不是计算多尺度特征表示的唯一方法。深度卷积网络(ConvNet)逐层计算特征层次结构,随着子采样层的引入,特征层次结构具有固有的多尺度、金字塔形状。这种网络内部的特征层次结构生成了不同空间分辨率的特征图,但由于深度不同而引入了巨大的语义差异。高分辨率特征图具有低级特征,这些特征会削弱其在目标识别中的表示能力。

单次检测器 (SSD) [22] 是首次尝试将卷积网络(ConvNet)的金字塔特征层次结构视为特征化图像金字塔的工作之一(图1©)。理想情况下,SSD风格的金字塔将重用在前

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/742475.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

PD虚拟机支持M3吗 PD虚拟机怎样配置图形卡

最近有很多人在问M3芯片的苹果电脑和M2相比,有哪些提升的功能。实际上,M3芯片的苹果电脑拥有与M2相同的CPU与GPU数量,但比M2多50亿个晶体管,并引入了动态缓存、增强型神经网络引擎等技术,性能、功能均进一步加强。面对…

业务架构交付物

背景 业务的核心元素、扩展元素以及它们的协同关系,业务架构和其他架构的关系等等已经有了不少认识,那么,通过对业务架构的还原和分析,到底能够得到什么业务架构的内容呢?它可以是一套流程框架体系,也可以…

基于SpringBoot前后端分离在线骑行网站设计和实现(源码+LW+调试文档+讲解等)

💗博主介绍:✌全网粉丝10W,CSDN作者、博客专家、全栈领域优质创作者,博客之星、平台优质作者、专注于Java、小程序技术领域和毕业项目实战✌💗 🌟文末获取源码数据库🌟感兴趣的可以先收藏起来,还…

C语言实现的飞机票系统解析

前言 操作系统:Windows下运行。如果需要在Linux运行(单机版),则需要修改删除conio.h,自己写个头文件获取键盘输入。我已经写好了getch.h文件,需要将其导入使用。 开发环境:CodeBlocks || VS C…

2024高考-优先选专业还是优先选学校

分数限制下,选好专业还是选好学校? 24年高考帷幕落下,一场新的思考与选择悄然来临。对于每一位高考考生,学校和专业都是开启大学新生活的两个前置必选项。但有时候“鱼与熊掌不可兼得”,在分数受限的条件下&#xff0…

作业6.20

1.已知网址www.hqyj.com截取出网址的每一个部分(要求,该网址不能存入文件中) 2.将配置桥接网络的过程整理成文档,发csdn 步骤i:在虚拟机设置中启用桥接模式 1. 打开VMware虚拟机软件。 2. 选择您想要配置的虚拟机,点击菜单栏中的“…

减少液氮罐内液氮损耗的方法

监测与管理液氮容器的密封性能 液氮容器的密封性能直接影响液氮的损耗情况。一个常见的损耗源是容器本身的密封不良或老化导致的泄漏。为了有效减少液氮损耗,首先应当定期检查液氮容器的密封性能。这可以通过简单的方法如肉眼检查外观,或者更精确的方法…

在线客服源码系统全端通用 源码完全开源可以二次开发 带完整的安装代码包以及搭建教程

系统概述 在线客服源码系统采用了先进的技术架构,包括前端界面、后端服务、数据库等部分。前端界面采用了响应式设计,能够自适应不同的设备屏幕尺寸,为用户提供良好的使用体验。后端服务采用了高性能的服务器架构,确保系统的稳定…

中国首例!「DataKit」上架亚马逊云科技 Marketplace add-ons

在 2022 年的 re:Invent 大会上,亚马逊云科技宣布了一项重大更新:亚马逊云科技 Marketplace 为 Amazon Elastic Kubernetes Service(Amazon EKS)提供了附加组件的支持。这一创新功能极大地丰富了 EKS 的生态系统,使用户…

【力扣】重排链表

🔥博客主页: 我要成为C领域大神 🎥系列专栏:【C核心编程】 【计算机网络】 【Linux编程】 【操作系统】 ❤️感谢大家点赞👍收藏⭐评论✍️ 本博客致力于分享知识,欢迎大家共同学习和交流。 给定一个单链表…

大模型训练数据

自《中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见》发布以来,我国数据要素建设不断深入,在国家数据局等 17 部门联合印发的《“数据要素 ” 三年行动计划(2024 - 2026 年)》进一步明确 “建设高质量语料库和基础…

邮件推送服务的高级功能有哪些?怎么使用?

邮件推送服务的效果如何评估?怎么选择邮件营销服务? 邮件推送服务不断发展,提供了丰富的高级功能,帮助企业提升营销效果,优化客户体验。AokSend将探讨一些邮件推送服务的高级功能,并说明它们如何为企业带来…

HTTP、MQTT、CoAP大比拼:谁才是物联网通信的王者?

物联网(IoT)时代,数以亿计的设备需要相互连接和通信,而超文本传输协议(HTTP)作为互联网的基石,凭借其简单易用、广泛应用等优势,也成为了物联网通信协议的有力竞争者。本文将深入浅出…

Windows重新安装安全中心解决白屏问题

重新安装Windows安全中心(Windows Security Center)涉及多个步骤,包括重置Windows安全功能和重新安装Windows安全应用。以下是详细的步骤: 1. 通过PowerShell重置Windows安全中心 打开PowerShell: 在开始菜单中搜索“PowerShell”…

ClickHouse vs. Elasticsearch:十亿行数据的较量

本文字数:15291;估计阅读时间:39 分钟 审校:庄晓东(魏庄) 本文在公众号【ClickHouseInc】首发 Meetup活动 ClickHouse 上海首届 Meetup 讲师招募中,欢迎讲师在文末扫码报名! 引言 这…

mysql 主从延迟

mysql 主从延迟 下面这句话,不知道对不对 注意:开启并行复制后,如果想要Xtrabackup进行全量备份的话,那就必须还要开启gtid复制而不是传统的位点复制 精华推荐 | 【MySQL技术专题】「主从同步架构」全面详细透析MySQL的三种主从…

怎么加密文件夹?文件夹加密软件推荐

文件夹加密是保护电脑数据的重要方法,那么你知道怎么加密文件夹吗?下面小编就为大家推荐两款文件夹加密软件,帮助你安全保护重要文件夹。 文件夹加密超级大师 在加密电脑文件夹时,文件夹加密超级大师是你必须要了解的文件夹加密软…

基于Java仓储出入库管理系统设计和实现(源码+LW+调试文档+讲解等)

💗博主介绍:✌全网粉丝10W,CSDN作者、博客专家、全栈领域优质创作者,博客之星、平台优质作者、专注于Java、小程序技术领域和毕业项目实战✌💗 🌟文末获取源码数据库🌟感兴趣的可以先收藏起来,还…

基于Jmeter的分布式压测环境搭建及简单压测实践

写在前面 平时在使用Jmeter做压力测试的过程中,由于单机的并发能力有限,所以常常无法满足压力测试的需求。因此,Jmeter还提供了分布式的解决方案。本文是一次利用Jmeter分布式对业务系统登录接口做的压力测试的实践记录。按照惯例&#xff0…

【linux学习十七】文件服务管理

一、FTP FTP server:FTP(File Transfer Protocol,文件传输协议 )是 TCP/IP 协议组中的协议之一 软件包:vsftpd/安装 yum -y install vsftpd//准备文件 touch /var/ftp/abc.txt //注释:FTP服务器的主目录:“/var/ftp/”,是FTP程序分享内容的本机目录…