Rtmp 分析参见:https://blog.csdn.net/fdsafwagdagadg6576/article/details/109462544
本文主要内容来自:FLV格式详解 https://blog.csdn.net/weixin_42462202/article/details/88661883
该文一层一层介绍了FLV格式.本文对其内容增加了思维导图并补充了实例.
1 定义:
FLV是一种文件格式.类似的还有Mp4.
作用:
将H264,Aac裸流封装成文件格式.
为什么要对裸流做文件格式封装?即FLV文件和原始文件区别?
1 文件播放. 原始文件播放读一帧解析一帧. 没有整体时长,不能拖拽,倍速播放等音视频控制了.
FLV文件因为有FLV tag保存音视频信息。所以可以显示视频时长,播放进度,拖拽,倍速播放等.
2 是协议支持,rtmp协议要求,数据必须Flv格式. rtc协议数据才是裸流。
关键字:tag
****2 整体介绍:****
Flv由 “Flv header” 和 “Flv Body”组成。
Flv Body由一系列的Tag组成,每个Tag又有一个preTagSize字段,标记着前面一个Tag的大小
2.1 Flv Header
Header长度一般都是固定的9个字节:
2.2 Flv Body
Flv Body由一个一个Tag组成,每个Tag都有一个preTagSize字段,标记着前面一个Tag的大小。
Tag有三种类型,Audio Tag(音频Tag),Video Tag(视频Tag),script Tag(又称Metadata Tag).
每个Tag由“Tag Header”和“Tag Data”组成.Tag=Tag Header+Tag Data.
对于不同类型的Tag,“Tag Header”的格式都是相同的,“Tag Body”的格式就不一样了.
2.2.1 Tag header:
图片说明:3种tag的tag header格式一样,只有Tag type 域的值不同,分别是08(音频),09(视频),12(script data).
Notes:注意Flv header和Flv tag header是不同的.
下面这张图归纳一下上面讲的内容,看完后对flv应该有个总体的了解了
一般一个flv文件由一个头部信息,一个script Tag,以及若干个video Tag和audio Tag组成。
图片说明:tag之间是previous tag size
2.2.2 每种类型的Tag Data详解
Flv有三种tag:“Audio Tag Data”、“Video Tag Data”、“Script Tag Data”
1)、Audio Tag Data
如果SoundFormat=10,那么音频数据就是AAC AUDIO DATA。
notes:音频参数只有一个字节
- **AAC ** AUDIO DATA 格式如下:
2)、Video Tag Data
a) 视频参数:
对于H.264数据来说,CodecID = 7。
当CodecID = 7时,视频数据就是AVCVIDEOPACKET格式。
b) 视频数据:
下面讲解一下AVCVIDEOPACKET。
- 如果 AVCPacketType = 0,那么Data就是AVCDecoderConfigurationRecord格式。
以下是AVCDecoderConfigurationRecord的结构
notes: SPS/PPS 说明
- 如果 AVCPacketType = 1,那么Data结构就简单多了。
notes: I,P,B帧.h264 没有start code 0x00 00 00 01
c) 实例分析:
i)Tag Header:
Type:09(Tag的类型,包括音频(0x08)、视频(0x09)、script data(0x12))
Datasize:00 00 2e(Tag Data 部分的大小)
Timestamp:00 00 00(时间戳)
Timestamp_ex:00(时间戳的扩展部分)
StreamID:00 00 00(总是0)
ii) Tag data:
FrameType | CodecID:17(keyframe | AVC)(视频tag的参数)
因为CodecID=7,所以视频数据就是AVCVIDEOPACKET格式
- AVCVIDEOPACKET:
AVCPaketType:00(ACVPacket的类型,0: AVC sequence header;1: AVC NALU;2: AVC end of sequence)
CompositionTime:00 00 00
因为ACVPaketType==0,所以Data=AVCDecoderConfigurationRecord
- AVCDecoderConfigurationRecord:
configurationVersion:01
AVCProfileIndication:64
profile_compatibility:00
AVCLevelIndication:1e
lengthSizeMinusOne:ff (NALUSize的长度,计算方法为:1 + (lengthSizeMinusOne & 3)=4)
numOfSequenceParameterSets:e1(低五位为SPS的个数,计算方法为:numOfSequenceParameterSets & 0x1F=1)
sequenceParameterSetLength:00 18(SPS的长度,24)
sequenceParameterSetNALUnits:67 64 00 1e ac d9 40 a0 33 b0 11 00 00 03 02 47 00 00 6d 34 0f 16 2d 96(SPS)
numOfPictureParameterSets:01(PPS的个数)
pictureParameterSetLength:00 06(PPS的长度)
pictureParameterSetNALUnits:68 eb e3 cb 22 c0(PPS)
previousTagSize:00 00 00 39
3) Script Tag Data
该类型Tag又通常被称为MetadataTag,会放一些关于FLV视频和音频的元数据信息如:duration、width、height等。通常该类型Tag会跟在FileHeader后面作为第一个Tag出现,而且只有一个。
notes:用amf语法实现metadata数据key-value存储.amf 数据的都是"类型+[长度]+值"的形式.
结构如下图所示
AMF包:第一个字节表示AMF包的类型
第一个AMF包:
第一个字节一般为0x02,表示字符串,第2-3个字节表示字符串的长度,一般为0x000A,后面跟的就是字符串,一般为"onMetaData"。
第二AMF包:
第一个字节为0x08,表示数组,第2-5个字节表示数组元素个数,后面跟着就是数组的元素,格式为:元素名长度(UI16) + 元素名(UI8[n]) + 元素的值(double),最后以“009”结尾。
常见的数组元素
补充: Nginx-rtmp之 AMF0 的处理 https://www.cnblogs.com/jimodetiantang/p/8975945.html
这篇blog:有具体的抓包实例分析. 对script tag data论述更详细.
notes: amf0和amf3有什么区别?:通常都是amf0, amf3是它的特殊补充.
参见 https://blog.csdn.net/HandSome696/article/details/72518927
总结:
图片说明:此图没有对script tag,video tag,audio tag做区分和具体介绍.
其他参考:多媒体文件格式之FLV: https://www.cnblogs.com/jimodetiantang/p/8992425.html
(有audio,video各个域的详细说明)