前言 好久没碰MySQL了,这次碰巧在研究superset的时候需要将一份csv格式的数据文件导入到数据库中。正好借此机会可以重温下MySQL。 数据来源网盘密码 : g5x...
前言 好久没碰MySQL了,这次碰巧在研究superset的时候需要将一份csv格式的数据文件导入到数据库中。正好借此机会可以重温下MySQL。 数据来源网盘密码 : g5x...
前言 好久没更新了,最近出了点意外手摔骨折了。不能写代码的日子真的是非常难受。。。不过最近拆了石膏手指是能动了,但是手腕还是有点僵硬。 简介 Scrapy是一个为了爬取网站数...
使用pandas和seaborn绘图 Series和DataFrame自带的生成图表方法: 使用pandas做一张堆积柱状图 展示每天各种聚会规模的数据点的百分比 为了方便以...
matplot API入门 如何引入: 一个简单的例子: 效果如下: Figure和Subplot matplot的图像都位于Figure对象中,相当于一个画板,如何创建Fi...
前言 在网上找到了个用Python分析2018世界杯夺冠热门的项目,感觉很有意思准备拿来练练手。因为目前还没有学到图形可视化部分,所以这部分内容会完全借鉴网上的教程。 分析目...
前言 现在已经学到了数据规整与合并这一章,为了加深对数据分析的理解接下来需要做个小项目练习一下。 目的 通过项目能够真实的了解到数据分析是做什么的 加深对pandas的熟悉程...
移除重复数据 DataFrame中常常会出现重复行。如下面这个例子: DataFrame的duplicated方法返回一个布尔型Series,表示各行是否是重复行: 还有一个...
重塑层次化索引 层次化索引为DataFrame数据的重排任务提供了一种良好一致性的方式。主要功能: stack: 将数据的列”旋转“为行 unstack:将数据的行“旋转”为...
索引上的合并 **比如DataFrame中连接键位于其索引中的情况,传入left_index=True或right_index=True以说明索引应该被用作连接键: 上面例子...
层次化索引 层次化索引让你能在一个轴上拥有多个索引级别。层次化索引我个人理解是对索引进行了分组,比方说一部分数据是今年的,一部分数据是明年的,可通过层次化索引进行切块以方便后...
合并数据集 离散化和面元划分为了方便分析,连续数据常常被离散化或拆分为“面元”,可以看下面的例子: 可以看到上面这组表示年龄的数据非常的杂乱无序,接下来需要用到cat函数来对...
读取Microsoft Excel文件 Excel作为最典型的表格型数据,我们需要用到ExcelFile对象,首先需要下载安装xlrd和openpyxl包 用request...
读写文本格式的数据 通过cat 输出文件内容: 由于文件是csv格式,可以使用read_csv读取文件并返回DataFrame: 如果想读取没有标题行的文件: 或者可以直接定...
层次化索引 层次化索引让你能在一个轴上拥有多个索引级别。层次化索引我个人理解是对索引进行了分组,比方说一部分数据是今年的,一部分数据是明年的,可通过层次化索引进行切块以方便后...
如何处理缺失数据 在练习中经常遇到pandas使用浮点值NaN来表示数组中的缺失数据。那我们该如何处理这些缺失数据? 通过isnull函数我们得知了Series对象中存在一个...