背景介绍
“回归”一词在统计领域是弗朗西斯·高尔顿在研究父母身高和子女身高的关系时引入的。高尔顿发现:尽管存在父母高子女也高,父母矮子女也矮的趋势(个体角度),但是观察总样本的话,父母异常高(矮)子女虽然可能也高于(低于)人口平均水平,但比父辈矮(高),呈向平均水平靠拢的趋势,而不是向2个极端发散的趋势。希尔顿描述为儿辈的身高回归到中等身高。“回归”由此而来。
什么是回归
在今天,回归是研究因变量对自变量的依赖关系的一种统计分析方法,更侧重的是研究方法而不是回归的字面意义。我们一般通过回归分析,来研究变量之间的相关关系。
回归的特点
- 指示自变量和因变量之间的显著关系(是否相关)
- 指示多个自变量对一个因变量的影响强度(参数)
回归的作用
1.挑选与因变量相关的自变量(由特点1来)
2.描述因变量与自变量之间的关系强度(由特点2来)
3.生成模型,通过自变量来预测因变量(定义本身)
应用场景