概率论关注的无处不在的可能性
从事件发生的频率认识概率的方法被称作频率学派
古典概率模型 P(A) = K / N
条件概率 P(A|B) = P(AB) / P(B)
如果 P(AB) = P(A) * P(B) 证明 A B 互不影响 则存在 P(A|B) = P(A)
逆概率 : 解决的是在已知事件结果(P(A))的时候,推断各种假设的可能性(P(Bi|A))
贝叶斯公式
P(H|D) = P(D|H) * P(H) / P(D)
P(H|D) 后验概率 即是在观测到的结果的前提下假设成立的概率
P(D|H) 为似然概率 在假设成立的前提下观测到结果的概率
P(H) 为先验概率 即为预先设定的假设成立的概率
- 频率学派认为假设是客观的存在且不会改变 即是存在固定的先验分布,只是作为观察者的我们不知道
- 贝叶斯学派认为固定的先验分布是不存在的,参数本身也是随机数
两种方法: 最大似然估计和最大后验概率,两者分别体现了频率学派和贝叶斯学派
概率质量函数: 取值与概率之间一一对应的关系就是离散型随机变量的分布率, 而对应到连续型随机变量, 就是概率密度函数
离散分布
- 两点分布: 适用于随机结果为二进制的情况
- 二项分布: 将满足参数 p 的两点分布随机实验独立重复 n 次, 事件发生的次数
- 泊松分布: https://zh.wikipedia.org/wiki/%E6%B3%8A%E6%9D%BE%E5%88%86%E4%BD%88
连续分布
- 均匀分布: 在区间内概率密度函数为 1 / (b - a), 每个点的可能性相同
- 指数分布:https://zh.wikipedia.org/wiki/%E6%8C%87%E6%95%B0%E5%88%86%E5%B8%83
- 正态分布: https://zh.wikipedia.org/wiki/%E6%AD%A3%E6%80%81%E5%88%86%E5%B8%83
数字特征是用于刻画随机变量的某些特征常数,包括数学期望,方差,协方差
数学期望是均值,是随机变量可能取值的加权平均
方差表示随机变量的取值与其数学期望的偏离程度
协方差度量两个随机变量之间的线性关系,即是 Y 是否可以表示为另一个 X, Y = aX+b
相关系数由协方差得出, -1 ~ 1 之间, -1 代表两个变量完全负相关 1 则表示完全正相关 0 表示不相关