在对应用进行优化时原生内存是非常关键的一部分,因为大部分的引擎代码是常驻内存的。当你把代码集成到原生控件时,你可以很直接控制,然而想要在Unity内部系统中控制和优化原生内存的消耗却不总是可行的。内部系统使用不同的缓冲区和资源,而且如何影响内存消耗也不总是透明的。下面的章节会详细介绍Unity内置系统并且解释会在原生profiler中经常看到的内存数据。
原生缓冲区
Unity使用了很多不同的原生分配器和缓冲区。其中的一些是永久的,例如常量缓冲区,另外一些则是动态的,比如后置缓冲。
ScratchPad【暂存器】
Unity在一个4MB缓冲池中存储常量,并且在帧之间循环使用这些池。这个池在生命周期受到GPU的限制,并且可以通过XCode或者Snapdragon等帧截取工具查看。
块分配器
Unity在一些内部系统中也会使用到块分配器。当Unity需要分配一个新的内存页块的时候就会导致内存和CPU很高。通常情况下,分配的新的内存页块比较大,分配只会发生在Unity第一次使用这个系统的时候。当首次分配之后,内存页块能够被重用。对于如何使用这些块分配器,内部系统会有略微的差异。
AssetBundles
当第一次加载AssetBundle的时候,额外的CPU和内存被用来作为快分配器使用,允许Asset Bundle系统分配第一个内存页块。
Asset Bundle继续分配的时候,Unity会重用内存块,然而,如果你想一次性加载多个AssetBundle,可能就需要再分配第二个或者第三个内存块了。这些已经分配的内存块会持续占用,直到应用退出。
Resources
Resources系统会使用一个和其他系统公用的块分配器,所以当从Resources中加载Asset的时候,不会造成额外的CPU或者内存消耗,因为这个块分配已经在启动的早期就已经完成。
Ringbuffer 环形缓冲区
Unity使用环形缓冲区来将纹理推送给GPU。你可以通过 QualitySettings.asyncUploadBufferSize接口调整这个异步的缓冲区。注意::当Unity分配之后,你就不能将这个环形缓冲区的内存还给系统。
Assets
Assets会在运行时同时影响原生和托管内存。除了托管内存之外,Unity会在不需要的时候将原生的内存返还给操作系统。基于内存的每个字节都很珍贵,尤其是在移动平台上,下面是用来减少原生运行内存消耗的一些尝试手段:
- 移除网格中没有用到的频道
- 移除动画中冗余的关键帧
- 在Quality Setting中使用maxLOD来去掉LODGroup中更高的细节网格
- 在构建之后检查Editor.log文件来确保磁盘上的每个Asset的运行内存消耗是合适的
- 通过使用Quality Setting设置中的Rendering部分的Texture Quality选项,通过mipmaps减少纹理分辨率来降低传送给GPU的内存
- 法线贴图和漫反射贴图不需要保持一样大小(1:1),所以你可以使用一个更小分辨率的法线贴图,也可以保证很高的视觉保真度并且节省硬盘空间。
需要清楚的是,托管内存影响要大于原生内存的问题,因为托管内存的碎片化会比较严重。
克隆的材质
对于克隆的材质需要清楚的是,获取任何渲染器材质属性都会导致材质被克隆一份,即使没有改变材质的任何属性。这个被克隆的材质并不会被垃圾回收,只有当切换场景或者调用Resources.UnloadUnusedAssets()的时候才会被清除。如果只想读取一个只读的材质,可以使用customRenderer.sharedMaterial。
卸载场景
调用UnloadScene()来销毁和卸载掉和场景相关的GameObject。注意:这个方法并不会卸载掉关联的Asset。如果想要卸载掉Asset,释放掉托管和原生内存,你需要在场景被卸载之后调用Resources.UnloadUnusedAssets()。
音频
虚拟声音
Unity会将声音动态设置成虚拟的(Virtual)或者真实的(Real),取决于平台的事实可听度(real time audibility)。例如,Unity会将很远的声音或者很小的声音设置为虚拟的,但是如果这些声音靠近或者音量增大,Unity就会将这些变成真实的。Audio Settings中的默认值对于移动设备来讲是非常合适的。
Max Virtual Voice Count | Max Real Voice Count | |
---|---|---|
Default | 512 | 32 |
Maximum | 4095 | 255 |
DSP缓冲区大小
Unity使用DSP缓冲区大小来控制混合器延迟(mixer latency)。底层的音频系统FMOD将平台依赖于DSP缓冲区大小。缓冲区的大小会影响延迟,所以需要认真考虑。默认的缓冲区数目为4。Unity中的音频系统使用如下的样本数:
Latency = Samples * Number of Buffers | Samples | Number of Buffers |
---|---|---|
Default | iOS & Desktop: 1024 Android: 512 | 4 |
Best latency | 256 | 4 |
Good latency | 512 | 4 |
Best performance | 1024 | 4 |
音频导入设置
使用正确的设置可以节省运行内存和CPU性能。
- 如果音频文件不需要立体声效果的话,开启Force to mono;这样做可以减少运行内存和节省硬盘空间。当在只有单声道的移动平台上通常会这样做。
- 比较大的音频片段(AudioClip)需要被设置成Streaming。Unity5.0版本中的Streaming会有200KB的额外消耗,所以对于小于200KB的音频文件,设置成Compressed into Memory。
- 对于比较长的音频,将其倒入设置成Compressed into Memory来节省运行内存(如果这些片段没有设置成Streaming)
- 只有当内存充足,CPU性能受限的时候才使用Decompress On Load选项,因为这个选项会消耗大量的内存。【Reference:AudioClip】
不同的平台也应该设置不同的压缩格式(Compression Format)来节省内存和硬盘空间:
- 对于非常短的音频片段,例如需要经常播放的音效。将Compression Format设置成ADPCM。ADPCM提供了固定的3.5:1的压缩比率,解压的消耗很小。
- 在Android平台上,对于比较长的音频使用Vorbis格式。Unity并没有使用硬件加速解码。
- 在iOS平台上,对于比较长的音频使用MP3或者Vorbis。Unity没有使用硬件加速解码。
- MP3或者Vorbis需要更多的资源来解压,但是文件的体积会更小一些。高品质的MP3文件需要更少的资源来解压,然而中等或者低品质的文件(无论哪种格式)都需要消耗同样的CPU时间解压缩。
- 提示:对于长时间需要循环的声音使用Vorbis格式,因为这种格式更利于循环。MP3包括提前确定大小的数据,因此如果循环不是块大小的整数倍,MP3编码就会造成静默的时间,然而Vorbis格式不会出现这种情况。