资料来源:https://www.youtube.com/watch?v=HZGCoVF3YvM
公式:
(E: Evidence, H: Hypothesis)
理解等级:
1、贝叶斯定理是什么?
2、贝叶斯定理为什么是真的?
3、贝叶斯定理在什么时候是有用的?
Example-Part1:
P(H|E)的意义
后验概率,posterior
给定一个人的性格描述:meek and tidy soul,判断他是图书管理员(librarian)还是农民(farmer);
有200个农民和10个图书管理员,其中4个图书管理员和20个农民符合描述,
那么此人是图书管理员的可能性是16.7%(注:计算的不是总体样本,而是符合先验条件,也就是符合描述,的样本)
Example-Part2:
P(E|H)的意义
似然概率,likelihood
给一个例子:Steve是一个图书管理员,他的性格描述有:shy and withdrown, meek and tidy soul
判断此人是图书管理员的情况下,其性格描述有shy and withdrown的可能
P(H)的意义
先验概率,prior
也就是200农民+10图书管理员的情况下,一个人是图书管理员的概率是
P(H=图书管理员)=
P(E)的意义
What' s more
思考:
这210个样本的选取问题,这个Steve是提问者的朋友?还是想认识的人?
如果选取的样本有200图书管理员和10农民,或者选取的样本里大多数人的性格都有meek and tidy soul这样的形容(因为提问者本人认识的都是这样的人)等等原因...
造成了对样本统计的影响(无论是基于熟悉的人有共性,或者单纯刻板影响),都是先验的信息,所以在迭代过程中,先验概率也一直在改变。
总结:
举的例子很接地气,但是具体算法实现还是要自己推一推,做个仿真看看。
词汇学习:
spoiler alert 剧透警告
meek 温顺的