内容概括:
- 基本概念
- 图像的表示(二维数组表示)
- 图像的质量
- 人类的视觉模型
- 图像的颜色
- 图像的描述
- 图像的直方图
图像的数字化
关于图像的数字化,主要包括两个方面:采样、量化
- 采样是对空间坐标X、Y进行数字化,也即离散化;
- 量化是幅度值即I=f(x,y,z,λ,t)的I值进行数字化。此处的量化需要对整个灰度级进行数字化,然后根据对应的I值进行对应。
图像采样
- 在取样时,若横向的像素数(列数)为M ,纵向的像素数(行数)为N,则图像总像素数为M*N个像素。
- 一般来说,采样间隔越大,所得图像像素数越少,空间分辨率低,质量差,严重时出现马赛克效应;采样间隔越小,所得图像像素数越多,空间分辨率高,图像质量好,但数据量大。
- 采样又可分为均匀采样和非均匀采样。
- 图像均匀采样量化——像素灰度值在黑白范围较均匀分布的图像。
-
图像非均匀采样量化——对图像中像素灰度值频繁出现的灰度值范围,量化间隔取小一些,而对那些像素灰度值极少出现的范围,则量化间隔取大一些。
图像量化
量化等级越多(对从白到黑的亮度进行数字化),所得图像层次越丰富,灰度分辨率高,图像质量好,但数据量大;量化等级越少,图像层次欠丰富,灰度分辨率低,会出现假轮廓现象,图像质量变差,但数据量小.
-
非统一的图像的量化
- 在边界附近使用较少的灰度级。剩余的灰度级
可用于灰度级变化比较平滑的区域 -
避免或减少由于量化的太粗糙,在灰度级变化
比较平滑的区域出现假轮廓的现象
很明显,数字图像的质量在很大程度上取决于取样和量化中所用的样本数和灰度级。一般,当限定数字图像的大小时, 为了得到质量较好的图像可采用如下原则:
(1) 对缓变的图像, 应该细量化, 粗采样, 以避免假轮廓。
(2) 对细节丰富的图像,应细采样,粗量化, 以避免模糊(混叠)。
- 在边界附近使用较少的灰度级。剩余的灰度级
数字图像的描述
-
黑白图像
指图像的每个像素只能是黑或者白,没有中间的过渡,故又称为2值图像。2值图像的像素值为0、1。
-
灰度图像
灰度图像是指每个像素的信息由一个量化的灰度级来描述的图像,没有彩色信息。
-
彩色图像
彩色图像是指每个像素的信息由RGB三原色构成的图像,其中RBG是由不同的灰度级来描述的。
关于这两幅图的理解:
以下是我在学习过程中,对于这两幅图片理解上的一些困惑,由于没怎么学过图像图像,所以很low
疑问:一张图用方格表示像素,一张用点表示像素,其实第二张图中的每个点代表了图片一种的一个方格,更或者说是方格中的像素值,我猜想的演化过程应该按照如下的方式进行对照演化:
图像的质量
灰度和灰度级
- 灰度——表示图像像素明暗程度的数值
- 灰度级——表明图像中不同灰度的最大数值(图像数据的实际灰度级越多,图像视觉效果越好)
对比度(明暗程度的反差)
- 对比度——反映一幅图像中灰度方差的大小
-
对比度=最大灰度值/最小灰度值(对比度低的图像会表现出来灰蒙蒙的状态)
当然除了对比度以外还有亮度、饱和度等,但是这些都属于主观评价——通过人眼主管视觉效果进行判断,除此之外还有客观评价——通过客观的测量给出量化指标
客观评价
传统的客观评价方法
通过计算恢复图像(编码以后的图像或处理以后的图像)偏离原始图像的(灰度值)误差来衡量恢复图像的质量,最常用的有均方误差(MSE)和峰值信噪比(PSNR)
-
均方误差(MSE)
-
峰值信噪比(PSNR)
注:其中N、M分别是x方向、y方向图像像素点的个数;
带有下标的f函数,分别表示原始图像和测试图像在(i,j)点上的取值;
L是图像中灰度取值的范围,对于8比特的灰度图像而言,L=255
具体计算过程示例:
当然还有基于人眼视觉特性的客观评价方法和基于人眼视觉心理特性的客观评价方法等。
人类的视觉模型
对于人类的视觉模型的内容,其实不是本内容的关键,具体的可以参考刘定生老师第三个ppt,在此只保留自己感兴趣的内容做记录。
-
关于图像的几个重要概念的理解
理解图像中基本概念:色调、色相、饱和度、对比度、亮度- 对比度:
对比度指不同颜色之间的差别。对比度越大,不同颜色之间的反差越大,即所谓黑白分明,对比度过大,图像就会显得很刺眼。对比度越小,不同颜色之间的反差就越小。
亮度:
亮度指照射在景物或图像上光线的明暗程度。图像亮度增加时,就会显得耀眼或刺眼,亮度越小时,图像就会显得灰暗。 - 色调:
色调是各种图像色彩模式下原色的明暗程度,级别范围从0到255,共256级色调。例如对灰度图像,当色调级别为255时,就是白色,当级别为0时,就是黑色,中间是各种程度不同的灰色。在RGB模式中,色调代表红、绿、蓝三种原色的明暗程度,对绿色就有淡绿、浅绿、深绿等不同的色调。
色调是指色彩外观的基本倾向。在明度、纯度、色相这三个要素中,某种因素起主导作有用,可以称之为某种色调 - 色相:
色相就是颜色,调整色相就是调整景物的颜色,例如,彩虹由红、橙、黄、绿、青、蓝、紫七色组成,那么它就有七种色相。顾名思义即各类色彩的相貌称谓,如大红、普蓝、柠檬黄等。色相是色彩的首要特征,是区别各种不同色彩的最准确的标准。事实上任何黑白灰以外的颜色都有色相的属性,而色相也就是由原色、间色和复色来构成的 - 饱和度:
饱和度是指图像颜色的浓度。饱和度越高,颜色越饱满,即所谓的青翠欲滴的感觉。饱和度越低,颜色就会显得越陈旧、惨淡,饱和度为0时,图像就为灰度图像。可以通过调整电视机的饱和度来进一步理解饱和度的概念。
- 对比度:
在图像处理中,常见的颜色模型包括HSB(色相、饱和度、亮度)、RGB(红色、绿色、蓝色)、CMYK(青色、品红、黄色、黑色)和CIE Lab*等,因此,相应的颜色模式也就有RGB、CMYK、Lab等。在HSB颜色模型中,色相、饱和度、亮度是对图像属性的基本描述。
色相或者色调(Hue)是从物体反射或透过物体传播的颜色。在0°到360°的标准色轮上,按位置度量色相。通常情况下,色相由颜色名称标识,如红色、橙色或绿色。
饱和度(Saturation,又称彩度)是指颜色的强度或纯度。饱和度表示色相中灰色分量所占的比例,它使用从0%(灰色)至100%(完全饱和)的百分比来度量。在标准色轮上,饱和度从中心到边缘递增。
亮度(Brightness或者intensity)是颜色的相对明暗程度,通常使用从0%(黑色)至100%(白色)的百分比来度量
*图像的色调通常是指图像的整体明暗度,例如,如果图像亮部像素较多的话,则图像整体上看起来较为明快。反之,如果图像中暗部像素较多的话,则图像整体上看起来较为昏暗。对于彩色图像而言,图像具有多个色调。通过调整不同颜色通道的色调,可对图像进行细微的调整。
- 在图像处理的各种颜色模型中,HSB模型以人类对颜色的感觉为基础,描述了颜色的3种基本特性。
视觉三基色假说——格拉斯曼定律
- 所有颜色都可由相互独立的三基色得到
- 假如三基色的混合比相等,则色调和色饱和度也相等
- 任意两种颜色混合产生的新颜色与采用三基色分别合成这两种颜色的各自组成分混合起来得到的结果相等
-
混合色的光亮度是原来各分量光亮度的总和
*任意彩色的颜色方程为:
-
加色系统:其基色是红、绿、蓝;不同比例的三基色光相加得到彩色称为相加混色
红+绿=黄;红+蓝=紫;蓝+绿=青;红+绿+蓝=白
-
减色系统;其基色是黄、青、紫(或品红);通常为绘画颜料或者燃料,颜色能吸收入射光光谱中的某些成分,未吸收的部分被反射,从而形成了该颜料特有的颜色,这就是相减混色。当不同比例的颜料混合在一起的时候,他们吸收光谱的成分也随之改变,从而得到不同的颜色
在图像处理以及工业生产中的三种颜色模型
- RGB
主动产生颜色的光源(显示器) - CMYK(青、品红、黄、黑)
用于印刷、绘画等 - HSI(色调、色饱和度、亮度)
用于调整颜色分量
一幅图像在计算机中用RGB空间显示;用RGB或HSI空间编辑处理;打印输出时要转换为CMYK空间;如果要印刷,则要转换成CMYK四副印刷分色图,用于套印彩色印刷品。
-
颜色模型——RGB模型
- RGB颜色模型是三维直角坐标颜色系统中的一个单位正方体
-
在正方体的对角线上,各原色的量相等,产生由暗到亮的白色,即灰度,(0,0,0)为黑,(1,1,1)为白,正方体的其他6个角点分别为红、黄、绿、青、蓝、品红
-
颜色模型——CMY模型
- CMY 为相减混色,他与相加混色的RGB空间正好互补,也即用白色减去RGB空间中的某一色彩值就等于同样色彩在CMY空间中的值。
-
由于彩色墨水和颜料的化学特性,用等量的CMY三基色得到的褐色不是真正的褐色,因此在印刷术中常加一种真正的黑色(black ink),所以CMY又写成CMYK
-
颜色模型——HSI模型
- 从人的视觉系统出发,用色调(Hue)、色饱和度(Saturation或Chroma)、和亮度(Intensity或Brightness)来描述色彩。
- 它比RGB色彩空间更符合人的视觉特性。
- 在图像处理和计算机视觉中大量算法都可在HSI色彩空间中方便的使用。
- H、S、I可以分开处理而且相互独立。
- 在HSI色彩空间可以大大简化图像分析和处理的工作量。
- HSI色彩空间和RGB色彩空间只是同一物理量的不同表示法,因而他们之间存在着转换关系。
-
I :表示光照强度或称为亮度,它确定了像素的整体亮度,而不管其他颜色是什么,其最亮值为1,0为最暗
、
-
H:表示色度,由角度表示(0~360°)。反映了该颜色最接近什么样的光谱波长(即彩虹中的那种颜色)0°为红色,120°为绿色,240°为蓝色。
-
S:表示色饱和度,色饱和度参数是色环的原点到色彩点的半径长度。在环的外围圆周是纯的或称饱和的颜色,其饱和度值为1,在中心是中性(灰)影调,即饱和度为0。
-
颜色模型之间的转换
-
颜色模型的应用
图像文件格式
图像数据以计算机数据文件方式存储,像素自己的安排方式与操作系统有关(windows、unix、mac),不同的操作系统可能采取不用的文件存储方式。图像的编码方式有:无压缩、无损压缩、有损压缩。常见的文件格式有:裸数据存储:RAW;格式化数据存储:BMP、JPEG、TIFF、GIF等。
-
图像数据的裸格式存储(如下图的格式存储),常用于遥感图像数据的存储,基本格式:(三波段图像为例)
-
BIP:波段像素交叉格式
2.BIL:波段行交叉格式
3.BSQ:波段景交叉格式
-
-
图像数据的格式化存储
像素颜色深度——1,2,4,8.16,24bits/pixel
压缩方式:LZW、rle、CCITT3、CCITT4、JPEG、JPEG2000。。。。。
BMP 文件格式:
windows操作系统的标准文件格式
虽然大部分BMP文件对图像数据不压缩,但它本身可支持图像压缩,如rle格式(行程长度编码,runlength encoding)和LZW压缩格式等。
BMP文件结构
BMP图像文件头
BMP图像信息头(一)
BMP图像信息头(二)
BMP图像信息头(三)
BMP图像信息结构
调色板和图像数据
其他图像数据格式特点:
图像中像素之间的距离
两个像素(i,j)和(h,k)之间的距离定义为:
-
欧几里得距离:
-
小区距离:
棋盘距离:
像素的邻域——描述与像素相邻的其他像素
-
4邻域与8邻域
- 区域——一组连续相邻的像素集合
图像的统计特性
灰度直方图
直方图是用来表达一幅图像灰度级分布情况的统计表
横坐标:灰度——r
纵坐标:为某一灰度值r_i的像素个数n_i或称之为r_i出现的频率
从概率的观点,灰度出现的频率可看作其出现的概率,这样直方图就对应于概率密度函数p,而概率分布函数就是直方图的累积和,即概率密度函数的积分,如下图所示:
对于离散图像
数字图像的直方图计算
对(M,N)大小的图像,设灰度级为L:
- 初始化;hist[k]=0; k=0,1,......L-1
- 统计:hist[f(x,y)]++;x,y=0,...M-1,0,.....,N-1
- 归一化:hist[f(x,y)]/M*N
Example:
直方图的性质
- 所有的空间信息全部丢失。
- 每一灰度级的像素个数可直接得到。
- 任何一幅图像,具有唯一对应的直方图:但任何一个直方图,可能对应多幅图像。
- 一幅图像各子区的直方图之和等于该全图的直方图。
直方图的用途
- 数字化参数
直方图给出了一个简单可见的指示,用来判断一幅图像是否合理的利用了全部被允许的灰度级范围。一般一幅图应该利用全部全部或者几乎全部可能的灰度级,否则等于增加了量化间隔,丢失的信息将不能恢复。 - 边界阈值选取
假设某图像的灰度直方图具有二峰性,则表明这个图像的较亮的区域和较暗的区域可以较好地分离,确定这一点味阈值点,可以得到好的二值处理的效果。
欢迎关注我的个人微信公众号,免费送计算机各种最新视频资源!你想象不到的精彩!