文章
Portal
站长自定义
零售前沿
智能科技
泛文娱
教育
大健康
新消费
区块链
文章2
BBS
站长自定义
零售前沿
智能科技
泛文娱
教育
大健康
新消费
区块链
图像处理
站长自定义
零售前沿
智能科技
泛文娱
教育
大健康
新消费
区块链
Tic商业评论
关注微信公众号【站长自定义模块】,定时推送前沿、专业、深度的商业资讯。
用户名
Email
自动登录
找回密码
密码
登录
立即注册
只需一步,快速开始
微信扫码,快速开始
登录
注册
搜索
搜索
搜索
热搜
数据分析
图像分类
discuz
本版
文章
帖子
用户
本版
文章
帖子
用户
深度学习
Linux
环境搭建
c++
好友
收藏
道具
勋章
任务
淘帖
动态
日志
相册
分享
记录
留言板
广播
群组
门户
导读
排行榜
设置
我的收藏
退出
技术改变生活
›
深度学习
›
目标检测
›
目标检测中Anchor的介绍以及设置
发布主题
返回列表
目标检测中Anchor的介绍以及设置
0
回复
7800
查看
[复制链接]
lijingle
当前离线
积分
1244
lijingle
已绑定手机
49
主题
4
回帖
1244
积分
管理员
积分
1244
收听TA
发消息
来源:
2021-5-20 14:11:27
显示全部楼层
|
阅读模式
1.目标检测的框的表示方法
目标检测中一般使用框进行框出需要检测的异物,这里框的表示方法有几种,其一为直接使用坐标点来进行表示,其二使用归一化的图像的点进行表示,还有一种是使用中心坐标的方法进行表示各个表示如图所示:
直接使用坐标点进行表示
归一化使用坐标进行表示,这样根据scale就可以计算出相应的原始坐标
使用中心点进行表示,其中有h和w表示框的长宽。
我们目标检测一般使用中心点进行表示
2.anchor的作用
这里先讲下没有出现anchor之前,传统的目标检测算法是怎么进行工作的,我们如果对一张图片进行人脸检测,首先就是使用不同比例的框对整个图片进行滑动,也就是穷举法,然后在用算法提取特征,提取完特征后在使用分类网络进行分类。这种方法简单,好理解。但是效果相对来说不是很好,并且中间出现了大量的无用计算。
在深度学习时代,这种方法会使得计算量及其大,导致无法进行实时检测,进而算法的实用性不高。
这里我们就引入anchor,anchor实际上就是不同尺寸不同大小的参照框,例如在图片中,猫或者够的框的一般为正方形或者长方形,我们只需要通过某种方式计算出通用的长宽比就可以包含大量的猫或者狗。Anchor Box的生成是以CNN网络最后生成的Feature Map上的点为中心的(映射回原图的坐标)以Faster R-CNN为例,使用VGG网络对对输入的图像下采样了
16
倍,也就是Feature Map上的一个点对应于输入图像上的一个16×16的正方形区域(感受野)。根据预定义的Anchor,Feature Map上的一点为中心 就可以在原图上生成9种不同形状不同大小的边框,如下图:
同理在以SSD为例,在38x38、19x19、10x10、5x5、3x3、1x1的六个特征图上,每个点分别设置4、6、6、6、6、4个大小不同的长宽比的anchor,如下图所示:
总共38x38x4+ 19x19x6+ 10x10x6+ 5x5x6+ 3x3x4+ 1x1x4= 8732个anchor。
回复
使用道具
举报
返回列表
发表新帖
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
Copyright @ 2019 Comsenz Inc. Powered by
Discuz!
Licensed
浙ICP备19002707号-2
电话咨询: 135xxxxxxx
关注微信