一、问题
当h264流没有b帧、帧参考关系如上图所示时,期望输入1帧数据给解码器后,解码器能立即输出解码帧。但事实上intel解码器会缓存若干帧后才输出解码帧,引起了延迟。
二、分析结果
由于解码器解码1帧后,不确定后续是否b帧、且p帧也可能乱序,因此默认情况下intel解码器会等到DPB(Decoded Picture Buffer)满了才输出解码帧。为了降低缓存导致的延迟,需要改变编码器参数:
1、将sps.pic_order_cnt_type设置为2(pic_order_cnt_type=2时,显示顺序与解码顺序一致,解码器会立即输出解码帧) or
2、将MaxDpbSize设置为1,MaxDpbSize限制了DPB的大小
三、h264相关知识
1、显示顺序与解码顺序
解码顺序由frame_num决定,frame_num存在slice header中,默认情况下frame_num=上一个参考帧的frame_num+1。
显示顺序由POC决定,有3种计算方式:
type 0,POC最低有效位记录在slice header中,最灵活,但是需要的数据量最大
type 1,在sps中指定参考帧与上一个参考帧的增量、非参考帧和上一个参考帧的增量,每个非参考帧可以指定Delta POC。POC offset(和上一个参考帧的POC的差值) = sps中指定的增量 + Delta POC。
type 2,POC=frame_num,显示顺序和解码顺序一样
2、如何计算MaxDpbSize
sps.vui_parameters.max_dec_frame_buffering在H.264 Annex E中定义,为可选参数。
如果max_dec_frame_buffering参数存在,那么MaxDpbSize=max_dec_frame_buffering。
如果max_dec_frame_buffering参数不存在,MaxDpbSize可以通过level和画面大小求出,下面例子展示计算过程。
MaxDpbSize计算公式:
MaxDpbSize = min(floor(MaxDpbMbs / (PicWidthInMbs * FrameHeightInMbs)), 16)
该h264流的level=4.2,对应的MaxDpbMbs=34816
PicWidthInMbs=(pic_width_in_mbs_minus1+1)= 120
由于frame_mbs_only_flag==1,因此FrameHeightInMbs=pic_height_in_mbs_minus1+1=68
MaxDpbSize = min(floor(34816 / (120 * 68)), 16) = 4,意味着intel解码器会缓存4个解码后的帧。