登录注册写文章

赋有美感的设计——torch平台cnn-dot-attention的设计及实现

小小兰哈哈

赋有美感的设计——torch平台cnn-dot-attention的设计及实现

1.背景：分类任务

2.cnn层的设计：

思路：将embedding维度（300维）的向量映射为新的embedding，new-embedding的数目最好比原来的大，因此设计256+256+512，在embedding维做

concat，如果numlayer为3层，则new_emb = 1024; 若为2层，则new_emb= 512, 比原有的embedding大，多层设计，适当的增加权重与网络复杂度。

cnn层的实现如下图解所示：

3.dot-attention的设计

思路：在许多应用场景下，如问答等，决定分类的不是一只是一个seq，设计一个显示两个seq相关性的算子网络段。

实现图解：

4.loss 的问题：

这是pytorch的一个坑，crossentropyloss相当于softmax加nullloss，与交叉熵不太相关。

crossentropyloss

如果要使用二进制交叉熵的话，

使用binary_crossentroyloss, 该函数是BCEloss的拓展，经过笔者实验，是mean(BCEloss),如果weight设置是平均的，

weight*BCEloss = binargy_crossentroyloss

最后编辑于：2018.12.04 16:09:29

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

<转载>TensorFlow Wide And Deep 模型详解与应用
该文章为转载文章，作者简介：汪剑，现在在出门问问负责推荐与个性化。曾在微软雅虎工作，从事过搜索和推荐相关工作。 T...
名字真的不重要阅读 5,361评论 0赞 3
Faster R-CNN论文翻译——中英文对照
文章作者：Tyan博客：noahsnail.com | CSDN | 简书声明：作者翻译论文仅为学习，如有侵权请...
SnailTyan阅读 9,316评论 0赞 16
Single Shot MultiBox Detector论文翻译——中英文对照
文章作者：Tyan博客：noahsnail.com | CSDN | 简书 | 云+社区声明：作者翻译论文仅为...
SnailTyan阅读 3,043评论 0赞 8
cs231n学习笔记-CNN-目标检测、定位、分割
cs231n学习笔记-CNN-目标检测、定位、分割 cite from: http://blog.csdn.net...
江州司马binbin阅读 21,973评论 4赞 85
奶奶与教育
刚刚奶奶问：“哪个国家拿了最多金牌？” “美国”，我说。 “美国那么厉害？！”他们人多还是我们人多？” “我们人多...
小视界阅读 190评论 0赞 0

1赞2赞

赞赏

手机看全文