最近有同学问nlp中如何做data augmentation,这篇总结下目前知道的方法。 数据增强 数据增强技术已经是图像领域的标配了,如旋转、镜像、翻转等。由于图像本身的特...
最近有同学问nlp中如何做data augmentation,这篇总结下目前知道的方法。 数据增强 数据增强技术已经是图像领域的标配了,如旋转、镜像、翻转等。由于图像本身的特...
这两周玩了一下ccf 2020 中的房产聊天问答匹配[https://www.datafountain.cn/competitions/474]比赛,虽然还没完赛,但是先总结...
更好的阅读体验请跳转至Knowledge Distillation (1) 模块替换之bert-of-theseus-下篇[https://xv44586.github.i...
更好的阅读体验请跳转至Knowledge Distillation (1) 模块替换之bert-of-theseus-上篇[https://xv44586.github.io...
深度神经网络由于其巨大的参数量,可以很方便的拟合非常复杂的非线性关系,同时,巨大的参数量也给模型带来了过拟合的问题。为了解决这个问题,也有人提出了早停和加入正则项等手段。而在...
yolov4出来后,简单做下测试,看到结果还是相当给力的。 注意看中间有个被遮挡的马,在yolov3中是检测不到的,yolov4中检测出来了,精度确实提升了。 那再来测试一下...
更好的阅读体验请跳转至词向量小结[https://xv44586.github.io/2019/10/22/w2v-summary/] 本文主要讨论Glove和word2ve...
更好的阅读体验请跳转至分词算法综述[https://xv44586.github.io/2019/10/22/cutwords/] NLP的底层任务由易到难大致可以分为词法分...
一、整体思路获取词向量基本上有两种思路:1.利用全局统计信息,进行矩阵分解(如LSA)来获取词向量,这样获得的词向量往往在词相似性任务上表现不好,表明这是一个次优的向量空间结...