音频理论知识

音频数字化

将模拟信号（Analog Signal）转成数字信号（Digital Signal）后进行存储。这一过程称为：音频数字化。声音属于模拟信号。

音频数字化

脉冲编码调制

音频数字化的常见技术方案是脉冲编码调制（PCM，Pulse Code Modulation），主要过程是：采样 → 量化 → 编码。

脉冲编码调制

采样（Sampling）：每隔一段时间采集一次模拟信号的样本，是一个在时间上将模拟信号离散化（把连续信号转换成离散信号）的过程。
- 采样率（Sampling Rate）：每秒采集的样本数量，称为采样率。比如，采样率44.1kHz表示1秒钟采集44100个样本。
量化（Quantization）：将每一个采样点的样本值数字化。
- 位深度（Bit Depth）：使用多少个二进制位来存储一个采样点的样本值。位深度越高，表示的振幅越精确。常见的CD采用16bit的位深度，能表示65536个不同的值。DVD使用24bit的位深度，大多数电话设备使用8bit的位深度。
编码：将采样和量化后的数字数据转成二进制码流。

比特率（Bit Rate）

指单位时间内传输或处理的比特数量，单位是：比特每秒（bit/s或bps）。
比特率 = 采样率 * 位深度 * 声道数
通常，采样率、位深度越高，数字化音频的质量就越好，也就是比特率越高，数字化音频的质量就越好。

采样率44.1kHZ、位深度16bit的1分钟立体声（双声道）PCM数据有多大？

公式：采样率 * 位深度 * 声道数 * 时间（比特率 * 时间）
（44100 * 16 * 2 * 60） / 8 /1024 / 1024 ≈ 10.09MB

编码（Encode）

PCM数据可以理解是未压缩的原始音频数据，体积比较大。为了便于存储和传输，一般都会使用某种音频编码对它进行编码压缩，然后再存成某种音频文件格式。

编码

压缩

压缩分为无损压缩和有损压缩

无损压缩
- 解压后可以完全还原出原始数据
- 压缩比小，体积大（压缩比 = 未压缩大小 / 压缩后大小）
有损压缩
- 解压后不能完全还原出原始数据，会丢失一部分信息
- 压缩比大，体积小
- 压缩比越大，丢失的信息（舍弃原始数据中对人类听觉不重要的部分）就越多，还原后的信号失真就会越大

解码（Decode）

当需要播放音频时，得先解码（解压缩）出PCM数据，然后再进行播放。

解码

常见的音频编码

无损

FLAC（Free Lossless Audio Codec）
是一种无损的音频编码和文件格式，文件扩展名为.flac。FLAC技术先进，占用资源更低，有更多的平台及硬件产品支持FLAC。

有损

MP3（MPEG Audio Layer III）
是非常流行的一种有损音频编码和文件格式，文件扩展名为.mp3。
AAC（Advanced Audio Coding）
是由Fraunhofer IIS、杜比实验室、AT&T、Sony、Nokia等公司共同开发的有损音频编码和文件格式，压缩比通常为18:1。
Opus
是由Xiph.Org基金会开发的一种有损音频编码和文件格式，文件扩展名为.opus。经过多次盲听测试，在任何给定的比特率下都比其他标准音频格式具有更高的质量，包括MP3、AAC。

常见的音频文件格式

WAV（Waveform Audio File Format）
是由IBM和Microsoft开发的音频文件格式，扩展名是.wav，通常采用PCM编码，常用于Windows系统中。

WAV的文件格式

WAV的文件格式1

WAV的文件格式2

AIFF（Audio Interchange File Format）
由Apple开发的音频文件格式，扩展名是.aiff、.aif。跟WAV一样，通常采用PCM编码，常用于Mac系统中。

最后编辑于：2022.05.28 00:03:39

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 217,542评论 6赞 504
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 92,822评论 3赞 394
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 163,912评论 0赞 354
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,449评论 1赞 293
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,500评论 6赞 392
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,370评论 1赞 302
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,193评论 3赞 418
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 39,074评论 0赞 276
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,505评论 1赞 314
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,722评论 3赞 335
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 39,841评论 1赞 348
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,569评论 5赞 345
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,168评论 3赞 328
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,783评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,918评论 1赞 269
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 47,962评论 2赞 370
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,781评论 2赞 354

音频理论知识

音频数字化

脉冲编码调制

比特率（Bit Rate）

采样率44.1kHZ、位深度16bit的1分钟立体声（双声道）PCM数据有多大？

编码（Encode）

压缩

解码（Decode）

常见的音频编码

无损

有损

常见的音频文件格式

WAV的文件格式

推荐阅读更多精彩内容