![240](https://cdn2.jianshu.io/assets/default_avatar/9-cceda3cf5072bcdd77e8ca4f21c40998.jpg?imageMogr2/auto-orient/strip|imageView2/1/w/240/h/240)
1:更新brew: /bin/zsh -c "$(curl -fsSL https://gitee.com/cunkai/HomebrewCN/...
1. get_dummies: one-hot 赋值,每个特征值一列,产生大量0,1稀疏数据 2. 缺失数据处理: df.fillna(),缺失值填充
先说 groupBy: groupby的过程就是将原有的DataFrame按照groupby的字段,划分为若干个分组DataFrame,被分为多...
1. 读excel 1000行: pd.read_excel('path', nRows=1000) head(10), tail(10) 2....
原因是 nbconvert 6.xx 把 template_path 改成了 template_paths,出现了不兼容 解决办法就是 把nbc...
jupyter notebook 默认的代码补全使用 jedi,需要每次敲 tab键,才能调起代码补全,非常不方便,所以,接下来的步骤,需要禁掉...
给定一个数据集D={(x1,y1),(x2,y2),……,(xm,ym)},yi∈{-1,+1}。对于分类学习来说,最基本的想法就是找出一个超平...
前言 神经网络是模仿生物的神经网络来做的一种机器学习方法,可以分类也可以回归。 本质就是:一组输入,分别给所有的 隐藏层神经元(假设隐藏层只有一...
需要掌握的知识前提:信息熵、信息增益、增益率 1. 信息熵(information entropy) ,之所以加负号,是因为 信息熵通常都用来表...