《数据科学的数学必修课》第2讲 概率论

目录

第1讲 数学基础
第2讲 概率论

这章用到的是SciPy这个库。

联合概率

P(A \ and \ B) = P(A) \times P(B)

P(A \ or \ B) = P(A) + P(B) - P(A \ and \ B)

条件概率和贝叶斯定理

P(A \mid B)=\frac{P(B \mid A)^{*} P(A)}{P(B)}

二项式分布

在一次试验中,成功概率是p,进行n次试验,计算总成功次数k的分布概率。

from scipy.stats import binom

n = 10
p = 0.9

for k in range(n + 1):
    probability = binom.pmf(k, n, p) # PMF代表“probability mass function”
    print("{0} - {1}".format(k, probability))

# OUTPUT:
# 0 - 9.99999999999996e-11
# 1 - 8.999999999999996e-09
# 2 - 3.644999999999996e-07
# 3 - 8.748000000000003e-06
# 4 - 0.0001377809999999999
# 5 - 0.0014880347999999988
# 6 - 0.011160260999999996
# 7 - 0.05739562800000001
# 8 - 0.19371024449999993
# 9 - 0.38742048900000037
# 10 - 0.34867844010000004

β分布

β分布是概率分布,使用desmos这个网站,可以调整参数即使看到变化。

使用SciPy计算累积密度函数(cumulative density function,CDF)。

from scipy.stats import beta

a = 8
b = 2

p = beta.cdf(.90, a, b)

# 0.7748409780000001
print(p)
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
禁止转载,如需转载请通过简信或评论联系作者。