SSD固态硬盘会成为专业全景相机的主流柔软
SSD(单次多盒检测)用于实时物体检测
AI 研习社按:本文为字幕组编译的技术博客,原标题SSD(Single Shot Multi-Box Detection) for real time object detection,作者 Rabin Poudyal。
翻译 | 陶玉龙 校对 | 佟金广 整理 | 孔令双
卷积神经络在检测图像中的物体时优于其他神经络结构。很快,研究人员改进了 CNN 来进行对象定位与检测,并称这种结构为 R-CNN(Region-CNN)。R-CNN 的输出是具有矩形框和分类的图像,矩形框围绕着图像中的对象。以下是 R-CNN 的工作步骤:
使用我们称为选择性搜索的算法扫描输入图像,进而查找可能的对象,生成大约 2000 个候选区域,
在每个候选区域上运行 CNN,
获取每个 CNN 的输出并将其输入:
SVM 来区域进行分类
线性回归器来收紧对象的边界框,如果对象存在
R-CNN 运用于目标检测
虽然与传统的 CNN 相比,R-CNN 在目标定位,检测和分类方面都取得了很大进步,但在实现目标实时检测方面依旧存在问题。以下是其中的一些问题:
1、训练数据很难处理,而且耗时很长
2、训练分为两个阶段进行(即:候选区域的选择和分类)
3、络在推理阶段很慢(处理非训练数据时)
为了改进 R-CNN,研究人员们相继提出了其他算法,如 Fast-RCNN,Faster-RCNN 等。 这些算法为目标检测提供了更准确的结果。 但它们对于实时检测来说显得有点慢。SSD 就在这个时候应运而生,它在准确性和计算速度方面具有良好的平衡
。
SSD(单发多边框检测器)的含义
单发:目标定位和分类在络的单个前向传递中完成 :
多框:边界框回归的技术
检测器:对检测到的对象进行分类
结构
SSD 结构
SSD 的结构建立在 VGG-16 的基础上。但在这里对 VGG-16 进行了一些微小调整,从 Conv6 层开始,我们用一系列辅助卷积层来代替原先全连接层。因为 VGG-16 可以提供高质量的图像分类和迁移学习来改善结果,我们将其作为 SSD 的基础络。通过使用辅助卷积层,我们可以提取图像多个尺度的特征,并逐步减小每个卷积层的尺寸。我已在下一节讨论了它的工作原理。您可以看到 VGG-16 架构的以下图像, 它包含全连接层。
VGG-16 结构
工作机制
为了训练我们的算法,我们需要一个包含带有对象的图像的训练集,这些对象必须在它们上面有边界框。 通过这种方式学习,算法学习如何在对象上放置矩形框以及放置在何处。 我们通过调参使预测出的边界框和实际的边界框之间的误差最小,从而优化我们的模型以正确地检测对象。与 CNN 不同,我们不仅预测图像中是否存在物体,还需要预测物体在图像中的位置。在训练期间,算法也要学习调整对象边界框中的高度和宽度。
上图是我们用于目标检测的训练数据集的示例。 这些数据集必须包含在图像中标记类别的对象。 更多默认框会有更准确的检测,但会以速度牺牲作为代价。
Pascal VOC 和 COCO 数据集对初学者而言是一个很好的入门。
处理尺度问题
在左边是一张有几匹马的图像。我们将输入图像划分为格集。 然后我们围绕这些格制作几个不同宽高比的矩形框。 我们在这些框中应用卷积来研究这些格中是否存在对象。这里的一匹黑马在图像中更靠近摄像头。因此,我们绘制的边界框无法识别是否是马,因为边界框没有任何可以识别马匹的特征。
如果我们看上述 SSD 的架构,我们可以看到在 conv6 层之后的每个步骤中图像的大小在显著减小。 我们讨论的关于划分格和在这些格上查找对象的每个操作都适用于从络的后面到前面的卷积的每个步骤。 分类器也应用在每个步骤中来检测对象。 因此,由于物体在每个步骤中变得更小,它很容易识别。
SSD 算法还知道如何从一个卷积操作返回到另一个卷积操作。 它不仅会前向运算而且会后向运算。 例如,如果它在 conv4 中看到马,那么它可以返回到 conv6 并且将在马周围绘制矩形框。
原文链接:
(公众号:) AI 研习社编译。
号外号外~
一个专注于
AI技术发展和AI工程师成长的求知求职社区
诞生啦!
欢迎大家访问以下链接或者扫码体验
原创文章,未经授权禁止转载。详情见转载须知。
活血化瘀的外用药油
小儿便秘怎么调理
南方医院泰成逸园分院蔡志军
心梗治疗哪里好大庆治疗睾丸炎医院
患上前列腺增生怎么办
-
看考场不是走过场,2022中考考场踩点注记,踩点前必看!
对于将要参与初高中的小伙伴们来说,到贡院“踩点”则是初高中之外的另一...
2024-09-21
-
为什么你会为爱情而扭曲
为什么你会为爱人情而改变,只是因为,你厌恶夺去。当你恐惧夺去一个人的...
2024-09-16
-
微信原先增加这个功能!
、 5月20日 网易公布最新公告 网易视频号的平台 将展示出客户端IP归属 全文...
2024-08-31
-
喜报 | 广州市天河职业职业学校现代学徒制项目录取率100%
喜报见到 佛山市天河职业技能高级中学的现代学徒制新项目毕业生100% 为了全...
2024-08-11
-
无儿无女的梁朝伟妻子,抱着李湘女儿挺有慈母样,一身黑装有气质
哈喽,大家好,我是biu风尚,很高兴又和大家透过明星风尚与混和擅长!想要...
2024-07-14
-
北水动向|北水成交净卖出35.65亿 汽车股继续分化 理想(02015)、长城汽车(02333)遭暴
7月末6日港股产品,北水作价;大销售35.65亿,其中港股道通(沪)作价;大销售...
2024-06-19