比赛链接 数据介绍:数据 *注 : 报名参赛或加入队伍后,可获取数据下载权限。数据包含2个csv文件: train_set.csv:此数据集用于训练模型,每一行对应一篇文章...
比赛链接 数据介绍:数据 *注 : 报名参赛或加入队伍后,可获取数据下载权限。数据包含2个csv文件: train_set.csv:此数据集用于训练模型,每一行对应一篇文章...
决策树算法梳理 1. 信息论基础(熵 联合熵 条件熵 信息增益 基尼不纯度) 1.1 熵 (entropy) 在信息论与概率统计中,熵表示随机变量不确定性的度量。设X是...
逻辑回归算法梳理 1、 逻辑回归的原理 逻辑回归就是这样的一个过程:面对一个回归或者分类问题,建立代价函数,然后通过优化方法迭代求解出最优的模型参数,然后测试验证我们这个求解...
线性回归算法梳理 1. 机器学习的一些概念 1.1 有监督(supervised learning)和无监督 1.1.1 有监督: 1.1.2 无监督: 1.1.3比喻 例如...
本文从实践的角度,来讲一下如何构建LSTM+CNN的模型对文本进行分类。 本文Github RNN网络与CNN网络可以分别用来进行文本分类。RNN网络在文本分类中,作用是用来...
我的是在 anaconda中的root环境下运行以下命令,在其他环境下发现没有效果 1 pip install jupyter_contrib_nbextensions ju...
机器学习: 对于给定的任务T,在合理的性能度量方案P的前提下,某计算机程序可以自主学习任务T的经验E,随着提供合适、优质、大量的经验E,该程序对于任务T的性能逐步提高。 有监...
距离 设特征空间X是n维实数空间的距离定义为: 这里.当p=2时,称为欧式距离(Euclidean distance)当p=1时,称为曼哈顿距离(Manha...
1数学期望 定义:设离散型随机变量X的分布律为:若级数绝对收敛,则称级数的和为随机变量X的数学期望,记为,即设连续型随机变量X的概率密度函数为,若积分绝对收敛,则称积分的值为...