以往的:
· 没有考虑上下文
· 重叠部分由重复计算
· 多阶段预处理和前向传播导致难以调优
端到端
整张图片作为输入,直接输出图片中人群数量
解决问题:在人群计数方法上进行创新,提出了一个端到端的卷积神经网络,将整张图片作为输入,直接输出计数结果;但是将整张图片作为输入,整张图片相比一个个patch会带有更多背景噪声和更少目标区域;因此使用Local counts;
提出方法:在利用重叠区域的共享计算时,我们的方法在预测本地和全局计数时利用上下文信息。
结果:在几个具有挑战性的数据集上进行实验,结果不错;