https://www.boyuai.com/elites/
Task09:目标检测基础;图像风格迁移;图像分类案例1
一、目标检测基础
1、锚框
目标检测算法怎样实现 1、区域采样 2、判断区域中是否包含我们感兴趣的目标 3、调整区域边缘 的功能?
锚框(anchor box)是以每个像素为中心生成多个大小和宽高比(aspect ratio)不同的边界框。
区域采样:画出图像中以某个像素为中心的所有锚框
判断区域中是否包含我们感兴趣的目标
调整区域边缘
算法工程师的技能点是否包含自己写工具函数?如:
生成锚框的方法已实现在`MultiBoxPrior`函数中。指定输入、一组大小和一组宽高比,该函数将返回输入的所有锚框。
为了描绘图像中以某个像素为中心的所有锚框,我们先定义`show_bboxes`函数以便在图像上画出多个边界框。
算法工程师的技能点:1、熟悉算法平台如pytorch、熟悉函数库如numpy、熟悉算法平台和函数库中的工具函数用法;2、自己会写一些工具函数如MultiBoxPrior、show_bboxes;3、掌握机器学习、深度学习算法推导和理解需要的统计学基础;4、能够复现最新发表的文章中算法;5、改动现有算法以服务于当前业务。
将Jaccard系数称为交并比(Intersection over Union,IoU),即两个边界框相交面积与相并面积之比。
1.1 生成多个锚框
1.2 标注训练集的锚框
1.3 输出预测边界框
在训练集中,我们将每个锚框视为一个训练样本。为了训练目标检测模型,我们需要为每个锚框标注两类标签:一是锚框所含目标的类别,简称类别;二是真实边界框相对锚框的偏移量,简称偏移量(offset)。
在目标检测时,我们首先生成多个锚框,然后为每个锚框预测类别以及偏移量,接着根据预测的偏移量调整锚框位置从而得到预测边界框,最后筛选需要输出的预测边界框。
算法图文描述:
之后可以标注锚框的类别和偏移量。
这个算法体现了从程序员业门槛,也是自己欠缺的。
根据锚框与真实边界框在图像中的位置来分析这些标注的类别。
2、多尺度目标检测
减少锚框个数,方法1在输入图像中均匀采样一小部分像素,并以采样的像素为中心生成锚框;方法2在不同尺度下,生成不同数量和不同大小的锚框。
较小目标比较大目标在图像上出现位置的可能性更多。因此,当使用较小锚框来检测较小目标时,我们可以采样较多的区域;而当使用较大锚框来检测较大目标时,我们可以采样较少的区域。
课后习题:
没彻底完成算法实践,约花费2小时。
二、图像风格迁移
三、图像分类案例1