音频 | 例子 | 图像/视频 | 例子 |
---|---|---|---|
采样率 | 表示每秒的采样次数,如16khz, 44.1khz | 视频中对应帧率 | 耳朵比眼睛灵敏,眼睛还有视觉残留,所以帧率比音频采样率低很多,如30fps |
位深度/采样精度(bit depth / bit per sample) | 音频的位深度决定动态范围。常见的16Bit(16比特),可以记录大概96分贝的动态范围。即每一个比特大约可以记录6分贝的声音。同理,20Bit可记录的动态范围大概就是120dB;24Bit就大概是144dB。 | 采样精度 | 最常见的为8bit(2^8=256) |
声道 | 左右声道为2 | 通道 | 灰度为1;RGB为3 |
音频是一维的,无此概念 | 分辨率(resolution) | 图像是二维的,分辨率指长和宽分别有几个像素。像素是一种虚拟化的数字,大小可以任意,或者说没有实际的物理尺寸大小。 |
计算码率(bit rate)
音频:
CD音质,一般2通道,原始音频数据1秒钟的数据量是44.1k(采样率)*16(位深度)*2(声道数)=1411.2kbits,可求得整个音频文件的大小=时长(300s)*码率(1411.2)/1024/8=51.67M。压缩成128kbps的MP3,1秒钟数据就变成了128kbits了。
视频:
图像原始的格式是RGB888,一秒钟的数据量就是30(帧率)*8(采样精度)*3(通道数)*1920*1080(1080P分辨率)= 1,492,992kbits。同样视频也存在压缩算法,如H.264,压缩完1秒钟的数据就叫码率。假设H.264压缩1080p的视频,码率是10Mbps,就是说1秒中的数据量为10*1024*1024= 10,485,760 bits。压缩比=压缩前的码率/压缩后的码率