本系列随笔将以中科院刘定生老师的视频教程为依托,全面讲解自己在学习过程中的理解与实践,争取一遍拿下数字图像处理。希望能与有缘的读者共勉。
什么是图像
- "
图
"是物体投射或反射光的分布,“象
”是人的视觉系统对图的接受在大脑中形成的印象或者反映。 - “一幅图像是一个东西的另一个表示”,是其所表示物体的信息的一个浓缩和高度概括
- 是客观和主观的结合
- 图像是对客观存在的物体的一种相似性的生动模仿或描述。是物体的一种不完全、不精确,但在某种意义上是适当的表示。
图像的分类
注释
:其中的光图像主要指通过光源产生的一些图像,例如投影仪、灯光等;不可见的物理图像主要指代通过不可见光源产生的图像,例如:CT、B超等;数学函数主要是通过数学函数例如波形图产生的图像(模拟图像等)。
模拟图像
物理上为了将图像进行进行展示一般通过图像的模拟信号进行图象的展示,模拟图象通过函数:I=f(x,y,z,λ,t)或者I=f(x,y)的方式进行图象重构,其中,I表示亮度(灰度),x,y,z表示三维坐标系中的坐标,λ表示波长,t表示时间。
模拟图像一般由以下一些特点:
- 三维空间连续
- 时间上连续(多指影视图像)
- 波普上连续(灰度连续变化)
- 不可见物理图像(多指CT、MRI等通过不可见光产生的图像)
- 想象中的虚拟图像
这些东西还不是很具体,通过查阅资料,对虚拟图像进行了补充:
- 百度百科来源
模拟图像:
又称连续图像,是指在二维坐标系中连续变化的图像,即图像的像点是无限稠密的,同时具有灰度值(即图像从暗到亮的变化值)。连续图像的典型代表是由光学透镜系统获取的图像,如人物照片和景物照片等,有时又称模拟图像。
数字图像:
计算机的图象是以数字的方式存储与工作的,它把图像按行与列分割成m×n个网格,然后每个网格的图像表示为该网格的颜色平均值的一个像素,亦即用一个m×n的像素矩阵来表达一幅图像,m与n称为图像的分辨率.显然分辨率越高,图像失真越小.也是因为计算机中只能用有限长度的二进制位来表示颜色的缘故,每个像素点的颜色只能是所有可表达的颜色中的一种,这个过程称为图像颜色的离散化.颜色数越多,用以表示颜色的位数越长,图像颜色就越逼真.
模拟图像简介:
以计算机断层扫描技术为基础发展起来的X-CT,MRI,PET和SPECT等是对X射线或其它激发源激发出来带有体内信息的信号(投影)进行数字化图像信息采集和处理,用投影-卷积-反投影方法根据投影数据单准则或多准则来重构的图像.由于这类断层扫描成像系统的主机存储容量有限,最终仍然要以胶片等硬拷贝来载带并储存重构的模拟图像.因此这类医学图像成像技术一般称之为本质上的模拟图像技术.
模拟图像的采集:
由于目前的计算机只能处理数字信息,我们得到的照片、图纸等原始信息都是连续的模拟信号,必须将连续的图像信息转化为数字形式。可以把图像看作是一个连续变化的函数,图像上各点的灰度是所在位置的函数,这就要经过数字化的采样与量化。下面简单介绍图像数字化采样的方法。
对连续图像f(x,y)进行等间隔采样,在(x,y)平面上,将图像分成均匀的小网格,每个小网格的位置可以用整数坐标表示,这样采样值就对应了这个位置上网格的灰度值。若采样结果每行像素为M个,每列像素为N个,则整幅图像对应于一个M x N 数字矩阵,这样就获得了数字图像中关于像素的两个属性:位置和灰度。 - 豆丁网来源
数字图像与模拟图像的区别:
现实中的图像是一个二维函数,可用I(x, y) 来表示,其中(x, y) 表示位置信息,
I表示亮度信息,亮度的取值范围是是实数集。用旧式的胶片照相机,磁带摄像机等得到的图像是模拟图象,模拟图像所在的空间是连续空间。因为计算机只能处理可进行二进制转化的数据,所以计算机不能直接处理模拟图像。为了在计算机上处理图像,不得不对图像进行量化,这样就出现了数字图像,其实数字图像是模拟图像的量化,数字图像所在的空间是离散的。图1.1显示了模拟信号与数字信号的不同。现在流行的数码相机拍摄的图像是数字图像,可以被计算机处理。图1.2 比较了模拟图像和数字图像。
看完以上的两个来源的内容相信对于数字图像和模拟图象已经有了清晰的认识,我们继续课程流程。
形成数字图像的基本过程
其中A/D转换为模数转换,将模拟信号转换为数字信号。
数字图像的表示---------二位矩阵
将图像划分为m*n的矩阵,每个足够小,每个矩阵都有自己对应的坐标x,y,每个像素值,是该位置内灰度值的平均值,大致图示如下:
数字图像的基本要素------像素
如图1.2所示,一副图像可分成m×n 个小的网格,我们也可以说这是一幅m×n大小的图像。模拟图像一个网格中可以有亮的部分,也可以有暗的部分,但是数字图像单一网格内的亮度值必须是固定的,这个网格就叫做像素。像素是数字图像的基本单元。比如我们常说的100×100的分辨率,表示一共有10000个像素点填充了一个行列都为100的矩阵。如果每一个像素只有一个亮度值,那么这幅图像又称为灰度图,而像素的亮度又称为灰度,表1.1给出了一般图像的像素数大小和灰度值的取值。当灰度取值只有2个的情况下,该图像称为二值化图像,灰度的值不是0就是1。一般灰度图像素的取值范围为[0,255]。像素多的数字图像看起来和模拟图像差不多,但是当你将图像放大的时候就可以看到一个个小的网格,也就是像素。如果一个像素的亮度有几个值构成,该图像则为彩色图像。一般的彩色图像有3个亮度值,分别称为R(红色素),G(绿色素),和B(蓝色素)。
具体效果展示如下:
谈到这里就不免会有一些疑惑,你可能会对像素的像素坐标系有些许疑惑,对于这方面的问题,我通过查阅博客对相机成像原理进行了了解:以下内容转载自:计算机视觉:相机成像原理:世界坐标系、相机坐标系、图像坐标系、像素坐标系之间的转换,也可参考世界坐标系和像素坐标系,图像坐标系的关系
本部分内容主要讲解像素的坐标表示以及相机的成像原理,即各种坐标系的坐标转换。
1.正文
图像处理、立体视觉等等方向常常涉及到四个坐标系:世界坐标系、相机坐标系、图像坐标系、像素坐标系。例如下图:
构建世界坐标系只是为了更好的描述相机的位置在哪里,在双目视觉中一般将世界坐标系原点定在左相机或者右相机或者二者X轴方向的中点。
接下来的重点,就是关于这几个坐标系的转换。也就是说,一个现实中的物体是如何在图像中成像的。
1.1世界坐标系与相机坐标系
于是,从世界坐标系到相机坐标系,涉及到旋转和平移(其实所有的运动也可以用旋转矩阵和平移向量来描述)。绕着不同的坐标轴旋转不同的角度,得到相应的旋转矩阵,如下图所示:
那么从世界坐标系到相机坐标系的转换关系如下所示:
1.2相机坐标系与图像坐标系
从相机坐标系到图像坐标系,属于透视投影关系,从3D转换到2D。
此时投影点p的单位还是mm,并不是pixel,需要进一步转换到像素坐标系。
1.3图像坐标系与像素坐标系
像素坐标系和图像坐标系都在成像平面上,只是各自的原点和度量单位不一样。图像坐标系的原点为相机光轴与成像平面的交点,通常情况下是成像平面的中点或者叫principal point。图像坐标系的单位是mm,属于物理单位,而像素坐标系的单位是pixel,我们平常描述一个像素点都是几行几列。所以这二者之间的转换如下:其中dx和dy表示每一列和每一行分别代表多少mm,即1pixel=dx mm
那么通过上面四个坐标系的转换就可以得到一个点从世界坐标系如何转换到像素坐标系的。
其中相机的内参和外参可以通过张正友标定获取这里查看张正友标定的资料。通过最终的转换关系来看,一个三维中的坐标点,的确可以在图像中找到一个对应的像素点,但是反过来,通过图像中的一个点找到它在三维中对应的点就很成了一个问题,因为我们并不知道等式左边的Zc的值。
最后在强调一下,像素坐标系中的像素坐标是按照行列的方式进行标定的,像素灰度值为该像素区域内灰度平均值:
数字图像的基本要素------像素值
像素值:
对单个像素灰度值进行数字化采样,即一个像素值用多少位表示,位数越多说明表示的色彩范围越大,图像对比度也就越大,图像色彩(灰度)信息更丰富。
数字图像的基本要素------图像大小(像素值是图像中的最小单位)
图像尺寸:数字图像矩阵的大小
数字图像处理与分析概述
数字图像处理与分析的哲学观点
- 连续与离散
物理图像——时、空与辐射强度均连续的自然物体的表示——I=f(x,y,z,λ,t),物理图像也即模拟图像
数字图像——物理图像某一时刻二维空间离散采样点的集合——I=f[x,y] - 表示与处理
物理图像——可用连续函数进行较好地描述、分析与处理
数字图像——时空与幅度均为离散的数据矩阵,常借助连续函数的分析结果与处理方法进行离散处理
信息与通讯理论(香农)
图像处理理论将通信理论中的一维问题推广到二维空间。通信理论研究一维空间的信息,图像理论则研究二维空间的信息。
- 通信理论——研究时间域和频率域的问题
- 图像理论——研究空间域和空间频率域(或变换域)的问题
- 通信理论认为——任何一个随时间变化的波形都是由许多频率不同、振幅不同的正玄波组合而成
- 图像理论认为——任何一副平面图像是由许多频率不同、振幅不同的X-Y方向的空间频率波叠加而成,高空间频率波决定图像的细节,低空间频率波决定图像的背景和动态范围。
欢迎关注我的个人微信公众号,免费送计算机各种最新视频资源!你想象不到的精彩!