这篇我从12月1日就开始读的文章,战线拉得可真长啊。那就写一下,我对于这篇文章的看法吧。历时将近一个月,我终于在刚才把这篇文章写完了。(其实真正集中用的时间,应该是五六天,而且我发现,这篇文献对于很多东西讲得十分清楚)我现在来捋一捋整个文章的思路,为后面的复现做准备。
摘要:
文章的题目为《未知类型计数》,顾名思义就是说,可以对于训练集中没有见到过的类型,也能实现计数。也就是要做出能数出任何类别物体的模型。本文的主要贡献或创新点分别为以下三个方面:(1)提出通用匹配网络GMN(Generic Matching Network)结构;(2)将“计数问题”重新调整为'“匹配问题”:利用用于“追踪任务”的已经被做好标记的丰富的视频数据,来训练GMN网络,视频数据中包含有很多“自然重复(natural repetitons)”;(3)使GMN能够满足不同的用户需求:设计出利用很小的开销便能够满足上述要求的适配器模型,例如使用一些标记好的实例,通过调整很少的一部分训练参数来实现。上述方法称为“few-shot(文章中也称“low-shot”)”,这种方法适用于囿于专业知识的局限,而无法对一些数据添加标注的领域。
文章演示了该模型在现有的多种计数方面的基准数据集上所显示出的灵活性:特别是细胞计数、车辆计数、人群计数。该模型在细胞和人群计数问题上,表现得良好。在车辆计数问题上,仅利用3张训练图像,便取得了超过最先进(state-of-the-art)的方法的效果,当使用整个车辆数据集中的图像进行训练时,该文章所提出的模型,效果远远优于现存的所有方法。
介绍
现有的计数方法主要分为以下两类:(1)基于检测的计数;(2)基于回归的计数。第一种方法,依赖于一个视觉物体检测装置(可定位一幅图片中的物体实例),这种方法针对不同的类需要训练不同的检测器,而且当数据集的标注太少时,这种方法便不再适用。