目标是预测未来三期传统汽车的销量。数据背景:03年到19年第一季度分季度的数据,13年之前只有传统汽车的销量,13年之后是传统汽车+新能源汽车的销量,需要预测未来三期传统汽车...
一、时间序列 时间序列(time series)是同一现象在不同时间上的相继观察值排列而成的序列。根据观察时间的不同,时间序列中的时间可以是可以是年份、季度、月份或其他任何时...
题目数据背景:有A、B、C、D四个地区,不同地区的销售量不一样,现抽取了不同时间段内每个地区的销售量,试解决: 1、每个地区间的销售量是否相同? 2、不同月份的销售量是否相同...
方差分析用于研究一个或多个分类型自变量与一个数值型因变量的关系。方差分析通过检验多个总体的均值是否相等来判断一个或多个分类型自变量对数值型因变量是否由显著影响。一、基本概念1...
研究汽车销量与生产总值、汽油价格相关性及预测模型建立 加载数据集并拆分训练数据集和测试数据集 数据集进行处理并拟合 预测数据并评判
回归分析是一种预测性的建模技术,它研究的是因变量(目标)和自变量(预测器)之间的关系。这种技术通常用于预测分析,时间序列模型以及发现变量之间的因果关系。 相关分析主要研究变量...
数据选自Journal of the American Medical Association(http://jse.amstat.org/v4n2/datasets.sho...
本文主要描述概率分布的python实现方法,包括二项分布、伯努利分布、泊松分布、几何分布、正态分布等。 一、二项分布步骤:1.定义随机变量X2.计算概率3.绘制概率分布图 二...
合理使用图表描述统计结果是应用统计的基本技能之一。本文利用思维导图来介绍数据的预处理方法、品质数据和数值型数据的整理与展示方式。 正确使用统计表和统计图是做好统计分析的最基本...
①矩估计法。用样本矩估计总体矩,从而得到总体分布中参数的一种估计。它的思想实质是用样本的经验分布和样本矩去替换总体的分布和总体矩。矩估计法的优点是简单易行, 并不需要事先知道...
假设检验是一种规则,它根据数据样本所提供的证据,指定是肯定还是否定有关总体的声明。一、基本概念原假设、备择假设、两类错误、显著性水平、p值、单侧检验、双侧检验假设检验检查有关...
本次选取泰坦尼克号的数据,利用python进行抽样分布描述及实践。备注:数据集的原始数据是泰坦尼克号的数据,本次截取了其中的一部分数据进行学习。Age:年龄,指登船者的年龄。...
基本概念 样本是进行统计推断的依据。但在实际应用时,一般不是直接使用样本本身,而是对样本进行整理和加工,即针对具体问题构造适当的函数--统计量,利用这些函数来进行统计推断,揭...
利用python来对数据分布进行描述分析和假设检验 数据选自Journal of the American Medical Association(http://jse.am...
一、基本概念 1. 随机变量 随机变量是试验结果的实值函数。举例来说,掷一枚质地均匀的骰子,可能出现的结果有1,2,3,4,5,6。那么可以定义随机变量X=出现的点数。或者,...
pandas 是基于Numpy的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的模型,提供了高效地操作大型数据集所需的工具。本文主要介绍...
利用BeautifulSoup爬取静态html网站 例子:爬取quner网站信息 查看网页源码发现,景点名称西湖title位于第一个li的span class="cn_tit...
数据分析的对象主要是结构化数据,虽然数据的类型有很多,但是所有的结构化数据都可以从三个维度进行描述,这三个维度就是数据的集中趋势描述,数据的离散程度描述和数据的分布形态描述。...