SuperGlue: Learning Feature Matching with Graph Neural Networks
个人感受:
这个是继SuperPoint 后该组又一次推进,感觉效果更加强了,如果superpoint只是在尝试学习传统方法的流程,LFNet end-to-end training就在benchmark上超越了SIFT,近来CVPR19的D2Net 就直接跳出了传统方法的检测范式,但是特征点定位还不够精确,那么 R2D2 ASLFeat真的就看不出深度学习还有啥不足(精确,泛化,鲁棒等等…… 要说也就除了速度吧,不过SIFT本身也很慢不能用在SLAM中,用在重建等速度不敏感的地方似乎也没啥必要性)。
现在看到的这个工作,就像文中说的“We believe that, when combined with a deep front-end, SuperGlue is a major mile�stone towards end-to-end deep SLAM.”,之前工作无论怎么样都还是在生成描述比较距离然后进行匹配,深度学习就是在模拟matching前的步骤,这个工作直接超越这个工作流程,将local feature后的matching步骤也包含进去,得到了更高的精度和鲁棒性(RANSAC、Voting)。个人感觉这种比直接两张图输出位姿的方法更可以被解释,而且泛化性更好,从这里开始做end-to-end slam道路更加平坦,现有很多直接去做end-to-end slam的工作都只能运行个数据集的程度。而且这种工作故事更好,之前这个领域做深度学习总感觉:“何必费这么大劲学一个传统方法的替代品?”总是觉得动机不够,难以实际应用,但是这个把matching步骤也学习了,而且效果又全面超越了,这样就有使用深度学习的动机了吧。
我先去Hpatch benchmark测试下吧,论文里找到想要的数据。