1 语义目标分割概述
一般来的语义目标分割流程如下,先用滤波器组或视觉描述子获得图像的局部外观目标,然后再根据监督或无监督方法获得的码本将局部外观目标量化为纹理基元或视觉词,最后将纹理基元或视觉词的直方图作为分类器的输入,预测目标类标签。
2. 局部视觉名词和方法概述
2.1 滤波器组和视觉描述子介绍
2.1.1 滤波器组
(暂略,还没怎么了解,后续看了再补)
2.1.2 SIFT——尺度不变特征变换(最常用)
该视觉描述子对于光照、旋转、尺度以及最小范围视角变化具有最佳不变。一般我们会利用不同尺度的高斯差分滤波器极值获得关键点,对每一个关键点选择其方向和尺度。为了实现方向不变性,我们会将描述子的坐标和梯度方向扭转到关键点方向,光照不变性则是将描述子的特征向量归一化。而关键点的描述子则通过以下方法:首先计算关键点邻域像素的梯度幅值和方向,然后使用关键点的尺度来选择合适的高斯核将图像模糊化。
2.1.3 HOG——方向梯度直方图
一般用作计算不同子区域的梯度方向直方图,在一个密集的大小统一的方格单元上使用空间重叠的局部对比度归一化方法计算局部外观目标。
2.1.4 MSER——最大稳定极值区域
一般用作检测比周围物体更暗或者更亮的区域,基于分水岭那样的概念,指的是对图像二值化以后,由全黑变全白的过程中区域面积阈值变化很小的连通区域。
2.1.5 SURF——加速稳健特征
一个稳健的图像识别和描述算法,一般先将像素邻域均匀变换到P×Q的空间单元,然后,类加各单元空间的Haar小波(哈尔小波,离散小波变换)响应和得到描述子(对于每一个空间小区域而言,SURF描述子为一个四维向量),最后做归一化。
2.2 纹理基元和视觉词
按照无监督方法来讲,K-means硬分类是最常用的码本生成方法之一,也就是一个图像特征精准地指定一个视觉单词。如果图像特征与多个纹理基元或者视觉单词有关,则选择其中最好的一个,如果在马本种没有能恰当表示图像特征的码字,仍然将其中最好的一个码字指定给那个图像特征。其余方法还有基于聚类树的极度随机森林(随机森林决策 方法)、监督学习等方法构建码本。
2.3 基于判别方法的目标分割技术概述
2.3.1 局部外观分类器
我们通常将局部区域的纹理基元或视觉词直方图获得的局部外观特征作为分类器输入,以此预测目标标签,而我们通常使用的目标类外观建模方法为SVM以及Boosting,但这些分类器有一个缺陷,即不能捕捉其他上下文特征的局部一致性。
2.3.2 CRF——条件随机场
目前,大多数的CRF模型都用的是多尺度条件随机场,即用表示局部分类器、区域特征、全局特征三种不同空间尺度,然后通过各分量的条件分布乘积得出条件分布P(Z | X),其中,X ={}为图像块,Z={}为目标类标签,其公式代表如下:
其大概的统计结构如图:
局部分类器给出了当给定输入是图像块时,标签的分布。区域特征表示目标之间的局部几何关系,避免了一些不合常理的相邻目标间不合理组合,并且使得分割结果更具空间平滑。
(未完,待续)