E.T.Jaynes所著的《概率论沉思录》自出版以来广受好评。然而这本厚达700余页的书所讲述的确并非概率论,而是统计。它的英文名字实际是”Probability Theory, The Logic of Science”,翻译过来就是“概率论——科学的逻辑”。严格来讲,统计的是不严谨的,很多东西我们无法根据公理推出,但是它符合我们的常识,就像物理基本定律一样。从某种角度讲,统计更类似于一种信仰。下面我们看看这种“信仰”是如何产生的。
假设我约你赌钱,规则是投均匀硬币,正面你赢100块钱,反面我赢100块钱。投了100次,100次全是反面,那么此时你已经倾家荡产了。比起接下来几年泡面度日,你更可能质疑我是否在“出老千”。这时要做的就是假设检验:再投100次,如果还是全是反面,那么就说明我在“出老千”。然而,均匀硬币出现这种情况可不可能呢?是可能的,只不过概率很小。你可能就是个喝水都塞牙的倒霉蛋。但是在现实中,我们所能想出的最好的方法也不过如此了。所以古典统计的逻辑简单来说就是“相信自己不是一个倒霉蛋”。
曾经哆嗒数学网上有这样一个问题,大意如下:
已知随机变量Xi, i=1,2,...,10服从形式为N(μ,10)的正态分布,要对是否有μ=0进行假设检验。
通常的步骤是,我们算出Xi均值X,它服从N(μ,1)。该均值只有5%的概率落在[-2,2]外。所以,如果这个均值落在了[-2,2],那么我们接受μ=0,如果它落在[-2,2]外面,我们坚信自己不会这么倒霉,所以我们认为μ≠0。
那个问题是,均值落在[-0.01,0.01]之内的概率也很小,为什么不选则落在[-0.01,0.01]时拒绝μ=0呢?其实他这么说在逻辑上没有错误,然而并没有什么卵用,因为我们不关心它是否在[-0.01,0.01]。假如我们还是在赌博,当然我们希望进行的是一场公平的赌博。我们扔一个同分布的Χ0出来,然后我付给你Χ0万元。如果均值是[-0.01,0.01]并没有什么问题,但是如果均值落在[-2,2]外,我们就得好好谈谈了。
这里注明一下,选什么区间也不是绝对的,要根据问题而定。有时候还就得选[-0.01,0.01]作为拒绝域。
总结:与概率论不同,统计强烈依赖于你相信什么 与 关心什么。从这一点上讲,统计与信仰没什么不同。