240 发简信
IP属地:广东
  • 120
    TASL05 模型建立和评估

    库的作用的了解 numpy:多用于科学计算中存储和处理大型矩阵,是数据科学实践中最常用的模块 pandas:数据处理模块,之前数据读入,检查重复、缺失值,分组聚合等一系列的数...

  • 120
    Task04:数据可视化

    可视化思路 单个变量单个定性变量:柱状图,条形图,饼图,环形图。反映定性变量的各个水平的频数分布或占比单个定量变量:直方图,箱线图。反映数据的分布情况,包括对称性,是否有离散...

  • 120
    Task03:数据重构

    1.数据合并 1.1数据合并方法对比 pd.merge:数据横向合并,merge(左表,右表)输入两个数据框,设置on参数就是按照某共同列合并,how设置连接方式有左连接,右...

  • Task02:数据清洗及特征处理

    此任务主要是对数据进清洗,包括缺失值、重复值的处理;特征观察与处理:分箱、分类变量的one-hot编码处理。此外还涉及到了从Name中提取Titles的特征。 1缺失值观察与...

  • Task01:数据加载及探索性数据分析

    读入数据 读入少量数据 查看或修改工作目录 读入数据.xlsx数据:pd.read_excel(r"路径",sheet_name)。要注意当有多个sheet时需要设置shee...

  • 120
    线性回归

    总结 线性回归是有监督学习里最常见也是最简单的一种形式,可以分为一元线性回归和多元线性回归,适用情况为是连续型数据,为任意数据。内容主要分为:基本思想,参数估计及解读,假设检...

  • 抽样学习过程中遇到的Python问题

    1. from···import···与import···as··· from A import b,相当于A.b,即从A包中引入b类/函数。举例: import A as ...

  • 关于Jupyter Notebook的一些非常基础的问题的解决

    写在前面:纯粹是个人的学习笔记,防丢失用,也都附上了参考网址,如有侵权一定删除。 jupyter notebook的帮助文档 问题1:如何解决pip install时下载速度...

  • 120
    anaconda的安装与环境配置

    PS:非计算机专业,不懂专业术语,不能帮助解决问题,只是提供一个经过多次实验都没有问题的安装办法。 1.下载 关于下载有两个方法:①anaconda官网下载下载地址https...

  • 120
    R文本挖掘—Rwordseg包的安装

    1.JAVA的JDK的安装与环境变量配置 (1)JDK的下载 网址:https://www.oracle.com/technetwork/java/javase/downlo...