在接到翻译任务的时候,我们的初始状态是拥有待翻译的单语文本。一般来说只有这个。所以第一步其实是,如何制作单语术语列表。 1.利用术语提取pipeline进行机器术语提取 当然...
在接到翻译任务的时候,我们的初始状态是拥有待翻译的单语文本。一般来说只有这个。所以第一步其实是,如何制作单语术语列表。 1.利用术语提取pipeline进行机器术语提取 当然...
在自然语言处理的任务当中,术语在相当一部分中占有了优化效果的作用。与优化算法、语料清洁等等一样,它能够带来的效果也会十分可观,而且人们对由术语产生的提升察觉度也十分高。下面针...
中文小说的海外市场日益扩大,这些年来,翻译中文网络小说的网站如雨后春笋般不断涌现。在这篇文章中我要介绍的是提供精翻中文网络小说的几个大站。 1. Wuxiaworld 说到中...
目录 一、安装NVIDIA驱动 二、gcc降级 三、安装cuda 四、安装cudnn 五、安装Anaconda 六、安装Tensorflow 七、配置IPython(使用ip...
以前如果你搜「最佳编程字体」,得到的推荐离不开这么几个: 熟悉 Mac 的用Monaco、特别怀旧的用Courier、喜欢 Windows 的用Consolas,最多再来一个...
BERT 简介 BERT是2018年google 提出来的预训练的语言模型,并且它打破很多NLP领域的任务记录,其提出在nlp的领域具有重要意义。预训练的(pre-train...
思路一:先求句向量,然后求余弦相似度 1.求得两个句子的句向量 生成文本词频向量用词频来代替,句子,当然这样做忽略近义词信息、语义信息、大量文本下运算等诸多问题。如果两段很长...
为什么需要实体识别 普通的工具如hanlp,htp,不能识别特定领域的专有名词,所以需要实体识别的算法。下面就以医疗专业为例子来谈一下医疗专业的命名实体识别。 标注 人工标注...
本文的目的是学习论文:ACL2017- Deep Pyramid Convolutional Neural Networks for Text Categorization ...