合批:把N个物体合到一起来提交给GPU,GPU一次绘制,这个过程叫做合批
DrawCall:Cpu给GPU下达一次渲染指令,叫做DrawCall
批次数目/Drawcall数目:提交绘制一个游戏场景,场景中的物体分几次提交给GPU进行绘制的次数
合批常用技术
基本的大原则,哪些物品会合批:同一材质的物体,有合批的可能
美术处理:场景美术把场景做到一个物体里面,或少数几个物体里面(把关卡做成一个fbx模型)
-
静态合批
游戏引擎将“能够合批”(同一材质球)的“静态物体”(标记为静态不可移动的物体),合到一起,提交给GPU,预先合并好这些静态物体成一个整体网格,提交给GPU渲染局限性:a物体时静态的
b预先计算好合并整体网格,增加合并后的内存开销
c把所有的网格合并到一起,1000个树,合并之后,会有1000个网格,内存暴涨,不合并的话,只需要1个网格
CPU的开销和drawcall减少得到我们性能提升之间来做平衡
d具有相同的实例的材质球
-
动态合批
游戏引擎将“能动态合批的”(同一材质球)的物体的每个顶点,CPU根据它的矩阵,来计算合批物品的每个顶点对应的世界空间的坐标,然后就把这些物体的顶点(世界空间的顶点)+单位矩阵提交个GPU,GPU就会一起把他们绘制出来
(基于世界空间的坐标系,我们重新给这些动态合批的物体来重新建模,所有的顶点+材质给GPU绘制)动态合批是一个双刃剑 CPU消耗运算性能(需要CPU把顶点转到世界空间下,非动态合批时GUP转换的),但可以带来性能提升,使用时,需要关注一下
动态合批的限制:顶点数目不应过多,俩个相同的物体,当俩个物体三个轴向的负缩放的个数为偶数个时(0,2)时,可以合批,当俩个物体中任意一个物体或俩个物体同时三个轴向的负缩放的个数为奇数时,不合批
材质球实例相同
有光照纹理数据,必须要相同
多个Pass的着色器不会被合批
延迟渲染无法合批 GPU Instancing合批
本质提交一个物体,GPU绘制出这个物品的N个实列,通过GPU里面绘制N次到不同的位置(位置,选择,缩放)
1000个小兵,可以在一个批次进行完成
满足合批的条件,同一物体,材质球(材质球属性可不同)
数量需要小于GPU每次出来的极限
Shader需要开启GPU Instancing的支持
4.合理安排物品的绘制顺序,不要打乱合批
3D物体:引擎自动计算,尽可能的在3D场景里面使用同一个材质(shader+纹理)
尽可能在同一个渲染队列里面使用同一个材质
尽可能在3D场景里面使用同一种Shader,不要根据渲染顺序来回切换Shader(Set pass call开销很大)
2D UI:尽可能安排同一个图集的物体在一个绘制顺利里面
5.将多个物体的纹理合并到一起
游戏物体:将地图与地图上的物体,使用同一个纹理
6.手动合并Mesh