目标检测中Anchor的介绍以及设置

lijingle · 2021-5-20 14:11:27

1.目标检测的框的表示方法
目标检测中一般使用框进行框出需要检测的异物，这里框的表示方法有几种，其一为直接使用坐标点来进行表示，其二使用归一化的图像的点进行表示，还有一种是使用中心坐标的方法进行表示各个表示如图所示：

直接使用坐标点进行表示

归一化使用坐标进行表示，这样根据scale就可以计算出相应的原始坐标

使用中心点进行表示，其中有h和w表示框的长宽。
我们目标检测一般使用中心点进行表示

2.anchor的作用
这里先讲下没有出现anchor之前，传统的目标检测算法是怎么进行工作的，我们如果对一张图片进行人脸检测，首先就是使用不同比例的框对整个图片进行滑动，也就是穷举法，然后在用算法提取特征，提取完特征后在使用分类网络进行分类。这种方法简单，好理解。但是效果相对来说不是很好，并且中间出现了大量的无用计算。

在深度学习时代，这种方法会使得计算量及其大，导致无法进行实时检测，进而算法的实用性不高。

这里我们就引入anchor，anchor实际上就是不同尺寸不同大小的参照框，例如在图片中，猫或者够的框的一般为正方形或者长方形，我们只需要通过某种方式计算出通用的长宽比就可以包含大量的猫或者狗。Anchor Box的生成是以CNN网络最后生成的Feature Map上的点为中心的（映射回原图的坐标）以Faster R-CNN为例，使用VGG网络对对输入的图像下采样了16倍，也就是Feature Map上的一个点对应于输入图像上的一个16×16的正方形区域（感受野）。根据预定义的Anchor,Feature Map上的一点为中心就可以在原图上生成9种不同形状不同大小的边框，如下图：

同理在以SSD为例，在38x38、19x19、10x10、5x5、3x3、1x1的六个特征图上，每个点分别设置4、6、6、6、6、4个大小不同的长宽比的anchor，如下图所示：

总共38x38x4+ 19x19x6+ 10x10x6+ 5x5x6+ 3x3x4+ 1x1x4= 8732个anchor。

		自动登录	找回密码
密码			立即注册

Tic商业评论

目标检测中Anchor的介绍以及设置

浏览过的版块

关于我们

网站地图

资讯

视频

活动

电话咨询: 135xxxxxxx

关注微信