240 发简信
GGZ
IP属地:广西
  • 勘误:举例部分 奇数位的指数错误,例如第二个维度:应该为 cos(3/(10000.0^(0/128))位 才对

    Transformer中的positional encoding

    作用 Transformer与CNN和RNN等模型不一样,CNN使用的是卷积,相当于是局部的注意力机制,而RNN本来就是可以处理时序信息,当抛弃循环神经网络结构,完全采用At...

  • 120
    今日头条狂卷知乎大V,IP经济争夺战到底谁能笑到最后?

    8月29日下午,还没到下班的时间,几乎所有的新媒体群已经被一条关于今日头条的消息给刷屏了,微博名为“老雅痞”的认证用户在微博上转发疑似知乎大V“恶魔奶爸”的朋友圈截图。截图中...