第一章
图像的概念:
1.什么是图像?
图 —— 物体投射或反射光的分布,是客观存在;
像 —— 人的视觉系统对图的接收在大脑中形成的印象或认识,是人的感觉;
数字图像的概念
数字图像是图像的数字表示,像素是其最小单位。
数字图像的描述有:
- 无彩色图像
- 彩色图像
图像处理的研究目的
目的:满足人的视觉、心理需要;实际应用或某种目的的要求
数字图像处理的定义、特点
图像处理:对图像信息进行性加工(处理)和分析
特点:
优:精度高、内容丰富、方法易变、灵活度高;
缺:处理速度较慢。
数字图像处理研究的主要内容及其特点
包括图像数字化、图像变换、图像编码、图像增强、图像恢复、图像分割、图像分析与描述、图像的理解和识别。
图像数字化:将非数字形式的图像信号通过数字化设备转换成数字图像,包括采样和量化。
图像变换:对图像信息进行变换以便于在频域对图像进行更有效的处理。
图像增强:增强图像中的有用信息,削弱干扰和噪声,提高图像的清晰度,突出图像中感兴趣的部分。主要技术有:直方图修正、图像平滑、图像锐化、同态系统、伪彩色技术
图像压缩编码: 对待处理图像进行压缩编码以减少描 述图像的数据量,以便节省图像传输、处理时间、减少存储空间。
图像复原:是寻找图像降质的起因,尽可能恢复图像本来面目。
图像分割:根据选定的特征将图像划分成若干个有意义的部分,这些选定的特征包括图像的边缘、区域等。
目的:提取出感兴趣的对象,为进一步的理解和识别做准备。
主要方法:灰度阈值分割、基于纹理的分割、区域生长法
图像分析与描述: 主要是对已经分割的或正在分割的图像各部分的属性及各部分之间的关系进行分析表述。
图像识别分类:根据从图像中提取的各目标物的特征,与目标物固有的特征进行匹配、识别,以识别出目标物。
图像工程相关概念
包括图像处理、图像分析和图像理解三个层次。把这三个层次综合集成在一个整体框架上进行,这个框架就是图像工程。
数字图像处理系统的组成
一个基本的数字图像处理系统由图像输入、图像输出、图像存储、图像通信、图像处理和分析五个模块组成。
图像的数学表示
I=f(x,y,z,λ,t)
(1)静止图像:I = f(x,y,z, λ)
(2)灰度图像:I = f(x,y,z,t )
(3)平面图像:I = f(x,y,λ,t)
而对于平面上的静止灰度图像,其数学表达式可简化
为:
I = f(x,y)
第二章
人眼视觉特点
①总范围很宽( c=10^8 )
②人眼适应某一环境亮度后,范围限制
适当平均亮度下:c=10^3
很低亮度下: c = 10
对比度概念
C=Bmax/Bmin
相对对比度:cr=(B-B0)/B0
色度学基础
各种表示颜色的方法,称做颜色模型。目前使用最多的是面向机器(如显示器、摄像机、打印机等)的RGB 模型和面向颜色处理(也面向人眼视觉)的 HIS/HSV模型。
图像的数字化
所谓的图像数字化,是指将模拟图像经过离散化之后,得到用数字表示的图像
一幅图像必须要在空间和灰度上都离散化才能被计算机处理。空间坐标的离散化叫做空间采样,而灰度的离散化叫做灰度量化。图像的空间分辨率主要由采样所决定,而图像的幅度分辨率主要由量化所决定。
采样和量化相关概念
采样是指将在空间上连续的图像转换成离散的采样点(即像素)集的操作。位置上离散化为采样点,称为像素(pixel)
量化是将各个像素所含的明暗信息离散化后,用数字来表示。一般的量化值为整数
分辨率相关概念、特点
图像分辨率:区分细节的程度;
影响因素:采样点数( M,N)和灰度级数G。
采样点数越多空间分辨率越高,G越多图像幅度分辨率越高
数字图像类型、常见文件格式
数字图像的特点:信息量大、占用频带宽、像素间相关性大、视觉效果的主观性大
常见文件按格式:两种存储模式,一种点阵图又称位图模式,另一种是矢量图模式。BMP、TIFF、GIF、JPEG、PNG、WMF。视频文件格式:AVI、MOV、RM、MPEG、WMV
领域相关概念
4邻域——N4(p)
对角邻域——ND(p)
8邻域——N8(p)
第三章
图像变换的目的、方法
目的:方便处理、便于抽取特性
方法:傅立叶变换、离散余弦变换、沃尔什-哈达玛变换
频谱各部分意义
Fourier变换后的图像,中间部分为低频部分,越靠外边频率越高。
因此,我们可以在Fourier变换图中,选择所需要的高频或是低频滤波。
第四章
图像增强的目的、方法
目的:目的是根据应用需要突出图像中的某些“有用”信息,削弱或去除不需要的信息,以达到扩大图像中不同物体特征之间的差别。
主要技术有:直方图修正、图像平滑、图像锐化、同态系统、伪彩色技术
点运算的概念、特点
所谓点运算是指像素值(像素点的灰度值)通过运算之后,可以改善图像的显示效果。这是一种像素的逐点运算。
点运算与相邻的像素之间没有运算关系,是原始图像与目标图像之间的影射关系。又称为“对比度增强”、“对比度拉伸”、“灰度变换”
点运算方法包括:灰度变换、直方图变换
灰度变换
直方图均衡化概念、基本思想、步骤
例:设图象有64*64=4096个象素,有8个灰度级,灰度分布如表所示。进行直方图均衡化。
直方图规定化概念、基本思想、步骤
修改一幅图像的直方图,使它与另一幅图像的直方图匹配或具有一种预先规定的函数形状
模板的概念、作用,模板卷积基本步骤
图像平滑的目的、方法(空间域、频率域)
邻域平均法(线性的)和中值滤波法(非线性的)
噪声的类型、特点
类型:
设备元器件及材料本身引起的噪声
系统内部设备电路所引起的噪声
电器部件机械运动产生的噪声
特点:
叠加性
分布和大小的不规则性
噪声与图像之间具有相关性
邻域平均法(均值滤波)基本思想、步骤
与模板相乘求其平均值
中值滤波法基本思想、步骤
按从小到大的顺序排列取中间数值
均值滤波和中值滤波的比较
对大的边缘高度,中值滤波较邻域均值滤波好得多,而对于较小边缘高度,两种滤波只有很少差别。
中值滤波是非线性的。
中值滤波在抑制图像随机脉冲噪声方面甚为有效。且运算速度快,便于实时处理。
中值滤波去除孤立线或点干扰,而保留空间清晰度较均值滤波为好;但对高斯噪声则不如均值滤波。
前面使用的邻域平均法属于低通滤波的处理方法。它在抑制噪声的同时使图像变得模糊,即图像的细节(例如边缘信息)被削弱,如果既要抑制噪声又要保持细节可以使用中值滤波。
低通滤波
双线性插值具有低通滤波器的性质,使高频分量减弱,所以使图像的轮廓在一定程度上受损。
- 理想低通滤波器
- 巴特沃思低通滤波器
- 指数型低通滤波器
- 梯形低通滤波器
图像锐化的目的、方法(空间域、频率域)
图像锐化的目的:是加强图像中景物的细节边缘和轮廓,锐化作用是使灰度反差增强,锐化算法的实现基于微分作用
方法:图像的景物细节特征,一阶微分锐化方法、二阶微分锐化方法
一阶锐化各方法的特点和区别
单方向的一阶锐化是指对某个特定方向上的边缘信息进行增强。
因为图像为水平、垂直两个方向组成,所以,所谓的单方向锐化实际上是包括水平方向与垂直方向上的锐化。
这种锐化算法需要进行后处理,以解决像素值为负的问题。
后处理的方法不同,则所得到的效果也就不同。
后处理方法:
整体加一个整数——》可以得到类似浮雕的效果
取绝对值—————》可以获得对边缘的有方向提取
无方向一阶锐化
Sobel算法与Priwitt算法的思路相同,属于同一类型,因此处理效果基本相同。
Roberts算法的模板为2*2,提取出的信息较弱。
单方向锐化经过后处理之后,也可以对边界进行增强。
二阶锐化各方法的特点和区别
高通滤波
图像轮廓是灰度陡然变化的部分,包含着丰富的空间高频成分。
把高频分量相对突出,显然可使轮廓清晰。
高频滤波器使高频分量相对突出,而低频分量和甚高频分量则相对抑制。 - 理想高通滤波器
- 巴特沃思高通滤波器
- 指数形高通滤波器
- 梯形高通滤波器
两种颜色模型概念、特点
假彩色增强:把真实的自然彩色图像或遥感多光谱图像处理成假彩色图像。
伪彩色增强:把黑白图象处理成伪彩色图象。
伪彩色处理的概念、分类
伪彩色增强方法:
灰度分层法
伪彩色变换
频域滤波
图像几何变换概念、分类、方法
图像的几何变换(Geometric Transformation)是指图像处理中对图像平移、旋转、放大和缩小,这些简单变换以及变换中灰度内插处理等
几何变换不改变像素值,而可能改变像素所在的位置。
空间变换(齐次坐标、图像的平移、图像的缩小、图像的放大、图像的镜像)、灰度插值(最邻近插值法、双线性插值、高阶插值)
第五章
图像复原的目的、常用方法
目的:是寻找图像降质的起因,尽可能恢复图像本来面目。是当给定退化的图像g(x,y)及系统h(x,y)和噪声n(x,y)的某种了解或假设,估计出原始图像f(x,y)
方法:代数复原法、逆滤波复原法、中值滤波复原法
退化模型
图像退化的常见点扩展函数
第六章
图像分割目的、方法
图像分割的目的是把图像分成一些具有不同特征的有意义区域,将图像中有意义的特征或者应用所需要的特征信息提取出来,以便进一步分析和说明。
基于阈值的图像分割方法
基于边界的图像分割方法
基于区域的图像分割方法
图像分割算法:三类(阈值法、边缘检测、区域提取)
常见分割算法的基本思想、步骤:阈值分割法、区域生长法、分裂合并法
阈值化分割的基本原理就是利用图像中要提取的目标物与其背景在灰度特性上的差异,选取一个或多个处于图像灰度取值范围之中的灰度阈值,然后将图像中各个像素的灰度值与阈值进行比较,并根据比较的结果将图像中的像素分成不同等级,从而把图像分成互不交叉重叠的区域的集合,达到图像分割的目的。
基于边界的图像分割方法就是根据图像不同区域边界的像素灰度值变化比较剧烈的情况,首先检测出图像中可能的边缘点,再按一定策略连接成轮廓,从而实现不同区域的图像分割
区域生长也称为区域生成,其基本思想是将一幅图像分成许多小的区域,并将具有相似性质的像素集合起来构成区域。相似性准则可以是灰度级、彩色、组织、梯度或其他特性,相似性的测度可以由所确定的阈值来判定。从满足检测准则的点开始,在各个方向上生长区域,当其邻近点满足检测准则就并入小块区域中。当新的点被合并后再用新的区域重复这一过程,直到没有可接受的邻近点时生成过程终止。
区域生长的主要步骤
对图像进行逐行扫描,找出尚没有归属的像素;
以该像素为中心检查它的邻域像素,即将邻域中的像素逐个与它比较,如果灰度值小于预先确定的阈值,将它们合并;
以新合并的像素为中心,返回步骤2,检查新像素的邻域,直到区域不能进一步扩张;
返回到步骤1,继续扫描到不能发现没有归属的像素,则结束整个生长过程
图像阈值分割法可以认为是从上到下对图像进行分开,而区域生长法相当于从下往上不断对像素进行合并。将这两种方法结合起来对图像进行划分,便是分裂合并法。
- 四叉树
基本思路:将图像任意分成若干子块,对每个子块的属性进行计算。 - 当属性表明该子块包含不同区域的像素,则该子块再分裂成若干子块。
-
如果几个子块的属性相似,则这几个相似属性的子块合并成一个大的区域。
第九章
图像压缩编码目的、不同方法的特点
是在满足一定图像质量条件下,用尽可能少的比特数来表示原始图像,
以提高图像传输的效率和减少图像存储的容量。在信息论中称为信源编码。
图像冗余
对于一个图像,很多单个像素对视觉的贡献是冗余的。
图像编码方法常用评价参数:熵H、平均码字长度R、编码效率n、压缩比,等
信息冗余度为:
每秒钟所需的传输比特数bps为:
压缩比r为:
图像编码算法
哈夫曼编码基本思想、步骤
哈夫曼编码是一种利用信息符号概率分布特性的变字长的编码方法。对于出现概率大的信息符号编以短字长的码,对于出现概率小的信息符号编以长字长的码。
算术编码基本思想、步骤
算术编码方法是将被编码的信源消息表示成0~1之间的一个间隔,即小数区间,消息越长,编码表示它的间隔就越小;
以小数表示间隔,表示的间隔越小所需的二进制位数就越多,码字就越长。反之,间隔越大,编码所需的二进制位数就少,码字就短。
算术编码将被编码的图像数据看作是由多个符号组成的字符序列,对该序列递归地进行算术运算后,成为一个二进制分数;
接收端解码过程也是算术运算,由二进制分数重建图像符号序列。
行程编码基本思想、步骤
编码思想:去除像素冗余。
用行程的灰度和行程的长度代替行程本身。
例:设重复次数为 iC, 重复像素值为 iP
编码为:iCiP iCiP iCiP
编码前:aaaaaaabbbbbbcccccccc
编码后:7a6b8c