这个在解码的时候,是不是没有用ctc进行联合解码🤔
减少全连接神经元个数,加入CTC损失训练将d_ff由2048 减小到 1024 ctc_weight 设置为0.1 模型大小为 51.4M 参数个数为13929234 训练到epoch.20 测试结果: 训练到ep...
这个在解码的时候,是不是没有用ctc进行联合解码🤔
减少全连接神经元个数,加入CTC损失训练将d_ff由2048 减小到 1024 ctc_weight 设置为0.1 模型大小为 51.4M 参数个数为13929234 训练到epoch.20 测试结果: 训练到ep...
transformer 视频原作者:https://www.bilibili.com/video/BV1Di4y1c7Zm?p=4&spm_id_from=pageDrive...