ECCV 2016 person re-identification相关 第五篇
作者采用的方法是无监督学习,由于没有用有监督学习 所以作者放宽了对discriminativity的定义——Instead of enforcing that data points corresponding to the same person to be as close as possible whilst being further away from other people in the learned subspace as in supervised learning, we constrain the visually similar people to be close to each other.
作者通过在字典学习中引入graph Laplacian regularisation term(这是啥我也不懂)来实现无监督学习
但是 传统的graph Laplacian regularisation term在reID这个领域有两个问题。1、传统的graph Laplacian regularisation term使用L2范数,使得这个term对outliers特别敏感。而reID正是有许多data outliers(caused by various reasons such as the person detection boxes being imperfect and severe (self-)occlusions. ) 2、不懂The visual similarity is encoded in a graph whose topology and edge weights are all determined by distances computed using the original high-dimensional low-level features. However, these features are not ideal for people matching, hence learning a new representation in the first place. As illustrated in Fig. 1(a), a graph constructed using the low-level features connects many visually dissimilar neighbours to each node. This diminishes the power of the graph regularisation term as a visual similarity constraint.
所以在这篇文章里,作者引入一个鲁棒的graph regularisation term ,and propose to learn the new representation and the optimal graph jointly.他用了L1范数来应对outliers,但是L1的话是非光滑且非凸的,所以作者又想了一个迭代优化的方法来解决这个问题。
最后采用cos作为度量
主要思想之一 Robust Graph Regularisation
传统的目标函数长这样:
s.t.约束项是为了让D紧凑(di是D的一列) 正则项是为了让X在低维空间的表示更加稀疏
接下来是数据的图表示:
V是每个数据点,这是一个无向图,用W表示邻接矩阵。
因为reID问题关注cross view的data point,所以要限制这个图只连接不同相机的data points
这里的正则项不用常规的这个:
而是用这个:
可以想象,这样做可以让不同数据点之间变得平滑
但是这个二范数是不适用的,原因上面讲过,outliers
所以作者提出了Robust Graph Regularisation:
其中下面这个式子是特征值分解:
Lw是拉普拉斯矩阵(不懂),Dii是度矩阵:
然后由于上面的4式是二范数,作者改用下面这个式子来替代1式中的正则项:
最后的目标函数就变成这样:
这样做的两个好处:
-
非线性(不懂)
- 稀疏性(因为采用了L1范数)
主要思想之二 Joint graph and dictionary learning
上面这段话对第二个正则项的解释我不是很懂, 第二个约束的意思大概就是,因为一个相机中的一个人应该只能匹配另一个相机中的一个人。(single shot)
优化
然后就是对7式的优化求解了,原文的2.3 Optimisation一节写的比较详细,因为比较多,而且都是数学式子,就不贴了,有兴趣的童鞋可以自己去看。
用于测试集测试 Cross-View Matching
在有监督学习上也能拓展
在有label标注的时候,这要把标注信息反映在W邻接矩阵上就好了。
特征
作者采用三种特征结合的形式,一是HS RGB Lab 二是HOG 三是LBP