记录一下备用:使用https://github.com/hellohaptik/multi-task-NLP/[https://github.com/hellohaptik/...
记录一下备用:使用https://github.com/hellohaptik/multi-task-NLP/[https://github.com/hellohaptik/...
数据集 RACE数据集 RACE: Large-scale ReAding Comprehension Dataset From Examinations,相关介绍可参考:h...
下载地址 https://www.cs.cmu.edu/~glai1/data/race/ 论文地址 Race: Large-scale reading comprehens...
下载地址 https://allenai.org/data/sciq 论文地址 Crowdsourcing multiple choice science questions...
背景 相关前置背景知识见博客://www.greatytc.com/p/d11cb1fe1201 HMM三个问题回顾 1.状态问题:已知状态转移概率矩阵、输出概率矩...
集成学习 着重于在训练集上做文章:将训练集划分为各种子集或权重变换后用较弱的基模型拟合,然后综合若干个基模型的预测作为最终整体结果。 两种算法:Bagging method、...
支持向量机 最初用于解决线性问题,加入核方法后可以用于解决非线性问题。能适应“小样本数量、高特征维度”问题,甚至是特征维度大于样本数量的情况。目标:使得与超平面最近的样本点(...
梯度下降 用于迭代求解函数最优解,是大数据领域用于求解问题的常用思想。步长:每一步梯度下降时向目标方向前进的长度。前期可以使用较大步长,加快训练速度,后期可以使用较短步长,保...
线性回归 OLS、Ridge、Lasso的优缺点对比:OLS 最小二乘法:优点:计算方便(套入公式即可) 缺点:数据维度越高,参数值越大、更容易过拟合,且计算过程涉及矩阵求逆...
1,今天工作非常忙,十点半忙完后想休息一下,先后尝试看电影《风暴》,看电视剧《马大帅》,看youguan视频片段,看抖音,看头条新闻和视频,但是好像都没有达到放松的效果,反而...
背景 参照博客:https://blog.csdn.net/macanv/article/details/85684284参照代码:https://github.com/ma...
背景 最近在用CRF做人名和时间的实体识别实验,在此记录一下实验的一点心得,供以后借鉴 心得 1.首先对自己的测试集,调研已有实体识别模型效果,如ltp、jieba、百度实体...
最近突然想到,之前的缺点现在还是缺点,虽然有一点点进步,但是太慢,反思了一下自己,谨记:1.如果你如今的短板在几个月甚至几年前也是短板,那么你就该反思一下:自己这几年为什么没...
机器学习中的一种特殊方法,使用神经网络这种结构来描述计算过程,通过输入海量数据,计算神经网络中的各级参数。一般有如下原则: 1,交替使用线性和非线性单元,即层 2,使用链式法...
背景 0.概率图:用图来表达变量之前相关关系的概率模型。其中图中的点表示一组随机变量,边表示随机变量之间的概率相关关系1.有向图模型/贝叶斯网:有向无环图。当变量之间有明确的...