1 前言
Python拥有著名的重量级科学计算库Numpy和数据分析库Pandas,他们在工业界拥有着举足轻重的地位。但今天我们要介绍的是一个轻量级的数据分析库DaPy,其致力于节约数据科学家对数据集分析过程中的时间和成本,提高数据科学家的工作效率。
2 丰富且专业的功能
数据分析的过程大致为:数据载入,描述性统计,数据清洗,推断性统计,模型开发与调试。
在数据载入方面,DaPy的数据结构清晰简洁利于数据科学家 "感受" 数据;函数功能丰富且高效,节约数据科学家对于复杂数据的处理时间。在描述性统计方面,DaPy已经提供了全面的计算公式,可以帮助数据科学家快速了解数据特征。
3 特性
3.1 优异的性能
3.2 多种在CMD中呈现数据的方式
3.3 符合Python语法习惯的二维数据表结构
3.4 与SQL语法相似的函数封装方法
3.5 封装了许多常用的数据预处理或者特征工程方法
3.6 支持多种文件格式的I/O工具 (支持格式:.html, .xls, .db, .csv, .sav)
3.7 内建基本机器学习模型(决策树、多层感知机、线性回归等)
详细的使用指南请查询官方网站:https://github.com/JacksonWuxs/DaPy