算成绩表名:subject_scores 输入Name subject score王建国 数学 95王建国 语文 89李雪琴...
对于常用的互联网数据指标,主要包含用户数据、行为数据、业务数据和推广付费数据等。 一、用户数据 1.活跃用户Q:为什么关注活用户数和活跃率?衡量...
一、DDLHive中的DDL和MySQL中基本一致。 1.数据库的操作 2.表的操作2.1创建表相较于MySQL,Hive没有索引、主键。但是会...
本文只是针对数据分析师常用到数据查询时的调优技巧。 技巧1:列裁剪和分区裁剪(只选择我们用到的数据)(1)列裁剪:一般我们常见的数据宽表,可能有...
Pandas是基于Numpy的一种工具,主要是为了解决数据分析任务创建的。提供了大量能使我们快速便捷地处理数据的函数和方法。pandas 基于两...
最初我们用excel就可以做常规的数据存储和分析,但是当excel的数据超过10万条性能就不行了,有的版本的excel只能打开约6万条数据。后来...
背景:数据库01-interview中有这样一张用户表(users),现在需要通过python直接连接数据库查询该数据。 1.在终端(windo...
官网链接:https://www.numpy.org.cn 1.numpy认知(优势) 2.ndarray对象 3.数组操作 4.异常值处理(n...
简单散点图的绘制, 使用plt.scatter(x,y)。 ⚠️:1,使用中,需要注意x y 轴的刻度的显示。此图的x无重复,所以刻度直接使用x...