Tic商业评论

关注微信公众号【站长自定义模块】,定时推送前沿、专业、深度的商业资讯。

 找回密码
 立即注册

QQ登录

只需一步,快速开始

微信登录

微信扫码,快速开始

目标检测中Anchor的介绍以及设置

0
回复
3234
查看
[复制链接]
已绑定手机

49

主题

4

回帖

1194

积分

管理员

积分
1194
QQ
来源: 2021-5-20 14:11:27 显示全部楼层 |阅读模式
1.目标检测的框的表示方法
目标检测中一般使用框进行框出需要检测的异物,这里框的表示方法有几种,其一为直接使用坐标点来进行表示,其二使用归一化的图像的点进行表示,还有一种是使用中心坐标的方法进行表示各个表示如图所示:

save.jpg
直接使用坐标点进行表示

save.jpg
归一化使用坐标进行表示,这样根据scale就可以计算出相应的原始坐标

save.jpg
使用中心点进行表示,其中有h和w表示框的长宽。
我们目标检测一般使用中心点进行表示

2.anchor的作用
这里先讲下没有出现anchor之前,传统的目标检测算法是怎么进行工作的,我们如果对一张图片进行人脸检测,首先就是使用不同比例的框对整个图片进行滑动,也就是穷举法,然后在用算法提取特征,提取完特征后在使用分类网络进行分类。这种方法简单,好理解。但是效果相对来说不是很好,并且中间出现了大量的无用计算。
save.jpg

在深度学习时代,这种方法会使得计算量及其大,导致无法进行实时检测,进而算法的实用性不高。

这里我们就引入anchor,anchor实际上就是不同尺寸不同大小的参照框,例如在图片中,猫或者够的框的一般为正方形或者长方形,我们只需要通过某种方式计算出通用的长宽比就可以包含大量的猫或者狗。Anchor Box的生成是以CNN网络最后生成的Feature Map上的点为中心的(映射回原图的坐标)以Faster R-CNN为例,使用VGG网络对对输入的图像下采样了16倍,也就是Feature Map上的一个点对应于输入图像上的一个16×16的正方形区域(感受野)。根据预定义的Anchor,Feature Map上的一点为中心 就可以在原图上生成9种不同形状不同大小的边框,如下图:
save.jpg
同理在以SSD为例,在38x38、19x19、10x10、5x5、3x3、1x1的六个特征图上,每个点分别设置4、6、6、6、6、4个大小不同的长宽比的anchor,如下图所示:
save.jpg
总共38x38x4+ 19x19x6+ 10x10x6+ 5x5x6+ 3x3x4+ 1x1x4= 8732个anchor。


回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册
电话咨询: 135xxxxxxx
关注微信