MLP-Mixer, FNet 2021-05-29

传统CNN,卷积加下采样进行特征提取,全连接进行全局的特征融合

视觉任务一直是以CNN为主流,2020年出现了基于NLP领域Transformer的模型Vision Transformer,用自注意力机制来替换CNN,而同一团队今年发表了MLP-Mixer,表示也许CNN和Attention都不是必须的。最原始的神经网络模型 MLP就能达到媲美(稍逊)CNN的效果。

MLP 处理视觉任务

MLP Mixer : https://arxiv.org/pdf/2105.01601.pdf

对图片的处理类似ViT。

首先如ViT中一样处理图片,分成不同的patch,压扁,进行线性变换得到指定的通道数。不同的patch用不同颜色表示。核心部分mixer layer只使用了全连接层,辅以GeLU激活函数,归一化方法和跳跃连接。实现起来也很简单,只不过需要的训练数据有亿点点大,比如说有3亿图片的JFT-300M。

在详细看mix layer之前,不妨回顾一下MLP和CNN的特点和区别。

MLP 和 CNN的区别

全连接层和卷积层都是简单的加权求和,但是全连接的结果来自于上一层所有神经元,卷积的结果来自于上一层所有通道的局部的神经元。如果单单从特征融合这个角度来观察,全连接层中,融合的是一个维度中各个位置的特征,而在卷积层中,进行了局部的不同位置上的特征融合,又进行该局部的不同通道上的特征融合。

而只能在一个维度上进行的全连接,有没有办法做到和卷积层一样的效果呢,可以的,分两次进行就好啦。

( 注意力机制也可以同时进行两者。)

Mixer Layer

那就是这篇论文的主角 Mixer Layer的策略:

先看输入部分,通过线性变换我们得到一个二维矩阵,一维是channel,另一维是patch,每个patch的长度是之前压扁的二维图像。既然MLP只能在一个维度上进行,作者就通过矩阵转置,让MLP在每个通道的不同位置进行一次,再在同一个patch的不同通道进行一次。

MLP1和2分别被称为 token-mixing 和 channel-mixing。

Mixer Layer : 先在同一通道中的不同patch中进行 (token-mixing MLP),再在同一patch的不同通道中进行 (channel-mixing MLP)。

虽然说MLP-Mixer表示不使用卷积,然而官方实现的第一步就是用的卷积操作。。。正如LeNet作者LeCun的twitter所抱怨的,其实就是个核的大小和步长都等同于patchsize的卷积罢了。 至于后面的全连接操作,同样也可以用1*1卷积来实现。

LeNet解释卷积的关键在于局部连接和共享参数,MLP Mixer通过划分patch达到了局部连接的目的,由于MLP的参数共享,所以这个关键也算达成了。MLP Mixer的论文表示,MLP可以干CNN的活,然而这个MLP在实现中用的又是卷积的函数。其实叫全连接或者卷积并不重要,毕竟矩阵乘法表示,相煎何太急。

其他

LN比起BN可以保持样本之间的独立性,
如果在数据集不够大,使用dropout之类的正则化技术也能炼成比较理想的模型。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 218,546评论 6 507
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,224评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,911评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,737评论 1 294
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,753评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,598评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,338评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,249评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,696评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,888评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,013评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,731评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,348评论 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,929评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,048评论 1 270
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,203评论 3 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,960评论 2 355

推荐阅读更多精彩内容