网络模型小型化--量化

网络模型量化

模型量化

以更少位数的数据类型用于近似表示32位有限范围浮点型数据的过程

模型的输入输出依然是浮点型

达到减少模型尺寸大小、减少模型内存消耗及加快模型推理速度等目标

原理

  • 模型量化桥接了定点与浮点,建立了一种有效的数据映射关系,使得以较小的精度损失代价获得了较好的收益
  • 由浮点到定点的量化
  • 由定点到浮点反量化

优缺点

好处

  • 减小模型尺寸,如8位整型量化可减少75%的模型大小
  • 减少存储空间,在边缘侧存储空间不足时更具有意义
  • 易于在线升级,模型更小意味着更加容易传输
  • 减少内存耗用,更小的模型大小意味着不需要更多的内存
  • 加快推理速度,访问一次32位浮点型可以访问四次int8整型,整型运算比浮点型运算更快
  • 减少设备功耗,内存耗用少了推理速度快了自然减少了设备功耗
  • 支持微处理器,有些微处理器属于8位的,低功耗运行浮点运算速度慢,需要进行8bit量化

缺点

  • 模型量化增加了操作复杂度,在量化时需要做一些特殊的处理,否则精度损失更严重
  • 模型量化会损失一定的精度,虽然在微调后可以减少精度损失,但推理精度确实下降

TF模型的两类量化方式

针对已经训练好的模型进行量化

  • TensorFlow Lite converter

  • TensorFlow Lite Optimizing COnverter(toco命令工具)

  • 需要结合业务场景及所拥有的硬件资源选择量化的方式,目的是以最小损失达到最大化模型量化效果

  • 训练后量化几种方案

    • 混合量化--仅量化权重

      • 浮点型的权重量化为int8整型,可将模型大小直接减少75%、提升推理速度最大3倍
      • 推理的过程中,需要将int8量化值反量化为浮点型后再进行计算
      • 如果某些Ops不支持int8整型量化,那么其保存的权重依然是浮点型的
    • 全整型量化--权重和激活值都进行量化

      • 试图将权重、激活值及输入值均全部做int8量化,并且将所有模型运算操作置于int8下进行执行,以达到最好的量化效果
      • 需要一个具有代表性的小数据集,用于统计激活值和输入值等的浮点型范围,以便进行精准量化
    • 半精度float16量化--仅量化权重

      • 将权重量化为半精度float16形式,其可以减少一半的模型大小、相比于int8更小的精度损失
      • 如果硬件支持float16计算的话那么其效果更佳
      • 在CPU运行时,半精度量化也需要像int8量化一样进行反量化到float32在进行计算
      • GPU可以支持float16运算

TF量化感知训练(Quantization-aware training)

  • 伪量化的过程

  • 在可识别的某些操作内嵌入伪量化节点(fake quantization nodes)

    • 用以统计训练时流经该节点数据的最大最小值,便于在使用TOCO转换tflite格式时量化使用并减少精度损失

    • 需要对训练和推理过程添加代码

      • 第一步,在训练图结构内添加伪量化节点
      • 第二步,重写推理图结构并保存为新的模型
      • 第三步,转换模型为全量化模型

两种方式的有缺点比较

  • 两者均可达到模型量化的作用
  • 两者的推理工作原理是一样的
  • 两者都可工作在Tensorflow lite推理框架下并进行相应加速
  • 训练后量化工作量稍微简单些,而量化感知训练工作量更繁琐一些
  • 量化感知训练比训练后量化损失的精度更少,官方推荐使用量化感知训练方式
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 211,817评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,329评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,354评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,498评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,600评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,829评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,979评论 3 408
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,722评论 0 266
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,189评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,519评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,654评论 1 340
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,329评论 4 330
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,940评论 3 313
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,762评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,993评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,382评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,543评论 2 349