240 发简信
IP属地:北京
  • mac 使用graphviz 报错:FileNotFound dot.py

    1:更新brew: /bin/zsh -c "$(curl -fsSL https://gitee.com/cunkai/HomebrewCN/...

  • pandas 机器学习特征工程常用

    1. get_dummies: one-hot 赋值,每个特征值一列,产生大量0,1稀疏数据 2. 缺失数据处理: df.fillna(),缺失值填充

  • pandas的变换操作

    先说 groupBy: groupby的过程就是将原有的DataFrame按照groupby的字段,划分为若干个分组DataFrame,被分为多...

  • pandas基本操作随笔记录

    1. 读excel 1000行: pd.read_excel('path', nRows=1000) head(10), tail(10) 2....

  • 启动 jupyter notebook,出现config option `template_path` not recognized

    原因是 nbconvert 6.xx 把 template_path 改成了 template_paths,出现了不兼容 解决办法就是 把nbc...

  • Resize,w 360,h 240
    启用代码自动补全

    jupyter notebook 默认的代码补全使用 jedi,需要每次敲 tab键,才能调起代码补全,非常不方便,所以,接下来的步骤,需要禁掉...

  • Resize,w 360,h 240
    第六章 支持向量机

    给定一个数据集D={(x1,y1),(x2,y2),……,(xm,ym)},yi∈{-1,+1}。对于分类学习来说,最基本的想法就是找出一个超平...

  • 第五章 神经网络

    前言 神经网络是模仿生物的神经网络来做的一种机器学习方法,可以分类也可以回归。 本质就是:一组输入,分别给所有的 隐藏层神经元(假设隐藏层只有一...

  • 第四章 决策树

    需要掌握的知识前提:信息熵、信息增益、增益率 1. 信息熵(information entropy) ,之所以加负号,是因为 信息熵通常都用来表...