主要看了和工作相关的一些章节。
相关关系
如果一件事情发生的概率(+F)取决于另一个事件(+A)是否发生,才能说这两个变量是否相关
如果F事件不发生的概率记为-F,A事件不发生的概率记为-A。那么只有当+F+A/-F+A显著大于+F-A/-F-A时,F和A相关
例如下例
患头部肿瘤(+F) 不患头部肿瘤(-F)
头晕(+A) 160 40
无头晕(-A) 40 10
由于160:40=40:10,因此肿瘤不一定导致头晕
就像大多数人认为上帝满足祈祷者(+F+A),却没有去看祈祷有多少没有应验(+F-A),有多少是没有祈祷却应验了(-F+A),有多少是没有祈祷也没有应验(-F-A)
正确判断相关关系的步骤是什么?
00 需要了解哪些信息是相关的
01 抽取样本
02 对观测到的现象分类和解释
03 牢记分类标准,估计符合事件和不符合事件的发生频率
04 (如果概率涉及多个层次的变量),用统计公式进行整合
05 判断是否存在相关关系
为什么面对略复杂事件,我们对相关的判断很差?
1 日常生活中可以轻易判断相关,不加批判复用这些方法。而日常生活中的相关关系
1) 许多是完全相关或者接近完全相关。例如手碰火会烫。
2) 有些相关关系是基于强刺激。例如暴风雨与下雨
3) 刺激在空间或时间上的距离非常近。如抚摸小狗摇尾巴
2 日常生活中会基于某些接近原则来判断相关关系
例如朋友给你推荐电影,你判断他推荐的电影和电影质量之间的关系,可能会想起他推荐过的最好的一部。
相关与因果
两个变量存在相关关系不代表他们存在因果关系。因果关系不代表两个变量之间有很高的相关。(性交和怀孕只有中等程度的相关 0.34)
因果关系
这里主要讨论对行为的归因。
当对行为的原因进行解释时,人们总是归因于当时最突出的因素。
例如行为者-观察者偏差
个体倾向于将自己的行为归因为情境因素,将他人的行为归因为个性因素。
代表性直觉
人们通常会根据“A在多大程度上能代表B或A在多大程度上与B相似”来判断事件发生的可能性。
人们倾向于认为偶然事件具有自我修正的功能,因为总是希望随机抽取的样本能很好地代表总体。
例如赌徒谬论:在一系列坏运气之后会有好运气
易得性直觉
人们通常根据一些容易想起来的事例来判断发生的概率。
事情更容易想起来,不代表有更高的发生概率,只是因为它更容易提取。例如它最近发生,或者掺杂了很多情绪。
例如在美国,被飞机掉下来的零件砸死和被鲨鱼咬死哪个概率高?答案是前者。
情境依赖性
分为对比效应(例如一只手浸热水一只手冷水,然后同时放温水的感觉)、初始效应(例如那个实验要求两组被试评价同一个人,一组先读一串正向品质在前的词,一组读负向品质的在前的词,结果不同)、近因效应(我是歌手最后一个出场的占优势)、晕轮效应(觉得长得好的性格也好运气也好等)
近因效应和初始效应的区别就在于同等强度的刺激持续时间的长短。足够短则先触发的印象深,反之则近的印象深。
概率和风险
看一个贝叶斯定律的例子。
假定医生根据多年临床经验,认为一个患者的肿块为恶性的概率为1%.但X光照射的结果是恶性。X光检查恶性肿瘤的准确率为80%,检查良性肿瘤的准确率为90%。问患者得癌症的概率是?
不是80% 而是7%左右
P(癌症| 阳性)=P(阳性| 癌症)xP(癌症)/ [P(阳性| 癌症)xP(癌症)+ P(阳性| 良性)xP(良性)]
P(癌症)= 0.01(最先估计患者得恶性肿瘤的概率)
P(良性)= 0.99(患者没有患癌症的概率)
P(阳性| 癌症)=0.8(检查为阳性时,有80%的概率患癌症)
P(阳性| 良性)=0.1 (将良性误判为恶性的概率)
计算得7.5%