7
0
写了 9018 字,被 11 人关注,获得了 5 个喜欢
写了 704974 字,被 8152 人关注,获得了 5857 个喜欢
写了 0 字,被 228 人关注,获得了 320 个喜欢
写了 0 字,被 1 人关注,获得了 0 个喜欢
谷歌推出的Bert,最近有多火,估计做自然语言处理的都知道。据称在SQuAD等11项任务当中达到了state of the art。bert的原理可参考论文,或者网上其他人翻...
写了 17481 字,被 193 人关注,获得了 147 个喜欢
mask的部分加上-10000.0,不mask的部分加上0,是因为还没有下一步要进行的是softmax,e^-1000000与等于0, 让模型对pad的部分(没有意义的部分)不要基于过多的注意力,
笑给我看 评论自Bert模型tensorflow源码解析(详解transformer encoder数据运算)
写了 2360 字,被 6 人关注,获得了 13 个喜欢
写了 1140 字,被 6 人关注,获得了 13 个喜欢