bert bert是有一个固定的词表(不把words当成tokens,而是将wordpieces(是一种subword)当做tokens)中的,预训练模型中有词表中的embe...
![240](https://cdn2.jianshu.io/assets/default_avatar/7-0993d41a595d6ab6ef17b19496eb2f21.jpg?imageMogr2/auto-orient/strip|imageView2/1/w/240/h/240)
IP属地:内蒙古
bert bert是有一个固定的词表(不把words当成tokens,而是将wordpieces(是一种subword)当做tokens)中的,预训练模型中有词表中的embe...
最近transformer的结构改进论文挺多的,总结一下。 transformer是一个seq2seq模型。 从RNN谈起 缺点:不能处理过长的句子。 LSTM可以一定程度上...
版权所有,转载请注明出处 参考Lasagne官网tutorial进行总结而来。 一、简介 Lasagne is a lightweight library to build ...
小长假来听听 NN 的故事吧。 本文参考:这个地址不错,深入浅出讲深度学习的,推荐感兴趣的朋友看一下。 当你听到深度学习,你想到了什么? Deep Learning is a...
CRF++ ( 空格分隔): nlp [TOC] http://x-algo.cn/index.php/2016/02/29/crf-name-entity-recognit...
这篇文章主要参考了[1]刘峤,李杨,段宏,刘瑶,秦志光. 知识图谱构建技术综述[J]. 计算机研究与发展,2016,(03):582-600. 其实知识图谱这块内容在我自己做...