很早以前就听说过量子力学的埃弗利特诠释(多重世界诠释)不仅实现了不依赖于波函数塌缩的自洽解释,其理论甚至能直接推导出模平方振幅作为概率的波恩规则,而不需要采纳波恩规则作为公理,从而第一次在不产生循环定义的情况下,仅通过理性人假设和基本量子力学性质定义了客观概率。关于埃弗利特诠释的文献时断时续地读了两年多,本文是随读随写自己的总结,梳理了埃弗利特量子概率理论的基本框架和思想。本文主要参考文献如下
- Wallace, David. The emergent multiverse: Quantum theory according to the Everett interpretation. Oxford University Press, USA, 2012.
- Mandolesi, André LG. "Analysis of Wallace’s proof of the Born rule in Everettian quantum mechanics II: concepts and axioms." Foundations of Physics 49 (2019): 24-52.
主观概率与客观概率
讨论量子概率问题前,先区分两个概念:主观概率和客观概率
主观概率 (Subjective Probability / Credence / Belief)
主观概率的定义很简单。对于一个事件E,人们信念中认为其发生的概率。
严格化定义:将随机事件简化为奖品随机的博彩游戏,任何一个计算游戏价值的线性算法至少会包含两个部分:评价奖品价值的效用函数,以及在每个选项上添加的权重,该权重可称为主观概率。
举例说明:抛硬币,正面朝上则奖励10元,反面朝上则不奖励。对于正常人来说,10元就是10元的价值,0元就是0元的价值,他们最高出价5元购买游戏资格,可以反推出正常人认为正面朝上的主观概率是50%。有人出价超过5元,说明他们相信概率不止50%。也有知晓内幕的人给出的价格更低或者根本拒绝掏钱,等等。
客观概率 (Objective Probability)
客观概率:来自直觉中事件E发生的“客观”概率。很难让人相信,但这个概率论基础的概念确实没有完善的定义。众多概率理论都试图给出客观概率的定义,然而大多数都有各自的问题
睡美人悖论
接下来这个悖论将会展示目前我们对于概率的理解有多么糟糕
假设进行一个游戏:参与者会被施以催眠药物入睡,随后实验人员抛出一枚硬币。
- 若正面朝上,参与者会被唤醒一次,要求猜测硬币结果,实验结束。
- 若反面朝上,参与者会被先唤醒一次,要求猜测硬币结果,随后会被再次施以催眠药物同时加入失忆药物(使其忘记此次唤醒经历),然后再唤醒第二次,提问相同问题,实验结束。
问:已知参与者此刻刚被唤醒,请问正面朝上的概率是1/2还是1/3
直接放出结论,这个问题学界没有共识,因此成为悖论。支持1/2的人认为抛硬币是一个客观的概率事件,支持1/3的人则利用三种唤醒情况的等概率原理。这个问题在1980年被人提出,至今都没有标准答案。
而之所以这么简单的问题都会有如此根本性的困难,就在于大部分客观概率的解释都有严重缺陷,在大量情况下实际上退化成了特殊的主观概率。而睡美人悖论巧妙之处就是其无法(在不改变设定的情况下)被转化为可量化检验的场景(我们应该统计每次回答的正确次数还是统计总体流程的正确次数?),因此主观概率无法定义无法检验,各路漏洞百出的“客观概率”立刻开始自相矛盾。
历史上对于客观概率的解释
频率派解释
频率派对客观概率的定义如下:
对同一个随机过程进行足够多或无穷次独立同分布实验,某个事件出现频率会趋于一个极限,该极限为客观概率。
频率派的概率解释放到今天基本上是漏洞百出。问题主要是
- 现实中不可能有所谓的“同一个随机过程”独立同分布。如果真正精确到每一个原子的完美重复,牛顿力学下机械决定论就要发威了。
- 现实中不可能进行无穷次实验。因此无法实验验证极限的存在。
- 独立同分布实验测量概率的可行性是基于大数定律的,而大数定律本身是概率论的推论,这是循环论证。
- 过去频率的极限和未来事件的概率没有必然联系。(仍然是“不可能有同一个随机过程”的衍生)
信息缺失
概率也可以来源于我们对于微观状态或者部分信息的无知。这的确是很多概率的来源,但并不是量子概率的来源。如果认为量子概率来自于对于信息的无知则等同于承认隐变量解释。而贝尔不等式实验以及其他实验已经证明隐变量解释不可能具有定域性,而非定域性隐变量理论如领航波理论本身也并未对量子概率的来源做出解释。
主原理(Principal Principle)解释
主原理解释放弃了对于客观概率的先验承认。主原理的表述极为谨慎(因为此立场争议过大),以下为其表述:
对于任意一个理性人,若其已知事件的客观概率为,则不论已知多少相容的背景信息,则其对事件E的主观概率应该也是
听起来很谨慎,其实上不少人认为这是一句正确的废话。然而它其实展示了概率学在现实中的实际使用方式。“我”相信声称骰子六面的是公平的理论,“我”没有发现与之不相容的背景信息(灌铅),“我”的某种思考机制(“理性”)导致“我”随即给各面向上的主观概率赋值为1/6。
更进一步,从主原理出发,就会发现完全可以否认客观概率的独立性。因为主原理本身可以定义客观概率:“理性人”这个要求实际上很不同寻常,足够支撑起一个客观概率的定义。以下原文贴出Wallace对于主原理的解读:
某种意义上我们可以将此作为客观概率的定义。那就是,如果物理理论允许我们对所有事件都定义出一个幅度Q,那么当且仅当相信T的人出于理性不得不采纳Q作为自己的主观概率时,Q就是客观概率。或者更严格的,Q是客观概率,当且仅当对任意事件E,若结合物理理论和背景信息B计算出则有(是任意实验者的主观概率函数)
换句话来说:主原理可以提供一个可行的客观概率的定义:它将客观概率定义为符合主原理中“客观概率”性质的任何东西。用相同的方式,英国女王/国王可以被定义为在威斯敏斯特加冕、被政府承认为首脑、在议会签署法案的任何人。同样,电荷可以被定义为产生电场、在这种场中以特定方式加速的任何属性
背景信息的“相容”
(未完成)
基于主原理解释,我们接下来所需要的工作就是寻找理性人主观概率的计算方法。决策论将为此提供框架。
基于对称性的主观概率
除了决策论以外,概率的对称性解释也相对流行。尽管对称性解释有着相对严重的理论问题,但此处将对其进行简单阐述。对称性解释的核心就是中立原则 (Principle of Indifference):
如果若干选项对于理性人来说没有理由区分,那么该理性人对这些选项赋予的主观概率应当相等
问题自然很明显:“没有理由区分”或者说对称性到底是怎么定义的。一个骰子的六面当然是可以区分的,总不能掷出结果之后也不区分。或者干脆为什么假定结果只有六个面而不是无穷个亚稳态状态。对于此一般有以下解释,但都有缺陷:
- 动力学对称性。对于经典动力学问题如掷骰子,一般的解释是若骰子公平,则在初态进行旋转对称操作不影响其动力学特性,所以结果的六个面也应当具有对称性。然而在极端情况下,若我们在0高度下抛出骰子,那么初态的旋转对称操作则完全不合理。即使不在这种极端情况下,如果理性人对于初态的背景信息了解越多,那么根据动力学计算那他就越不可能认为结果具有对称性。总结来说,既然对称性理论认为动力学系统从初态的对称性演化出了唯一的结果,则必然意味着其过程中发生了对称性破缺,而其框架内对对称性破缺的过程没有解释。
- 随机过程对称性。在随机过程(包括量子测量)中,一般的解释是若某些权重系数相等(且状态间具有如正交性之类的其他限制),则对应状态间具有对称性。然而一般来说在对称性理论的框架下这些权重的定义本身就是依托概率的,仍然是循环定义。
注:之后的经典决策论也无法解释这些问题。但量子决策论却在一些量子问题中真正解决了这些问题。
基于决策论的主观概率
决策论提供了确定理性人主观概率的框架。而且还不止一种。
由效用到概率
决策论的“最大期望效用原理”(MEU)提供了一个由效用函数推导概率的方法。其基本思路是一个经典概率学论据“荷兰博彩问题” (Dutch Book argument)的延伸。此处不进行细致阐述,但放出主要结论:荷兰博彩问题可以推导出,给定一个理性人对每个可能结果的效用函数,其主观概率必然满足一系列基本概率原理(归一性,可加性,等等)。在推导中可以显示,如果某个参与者构造的主观概率不满足这些概率原理,则一定可以构造出一些必输赌局诱使该参与者加入,从而显示出此参与者并非理性。这也是“理性”在其中的作用。
这个推导过程其实相对简单直观,但并不是我们接下来使用的方法。他的问题在于,效用函数是一个过于主观且不可检验的存在,并不是只有金钱才可以被称为效用。人人都可以构造千奇百怪的效用函数,但又没有好的办法描述这些效用函数的“理性”共性,导致效用函数并没有多少可以在证明中利用的性质。因此接下来将使用决策论的另一个方向:
由偏好到概率
另一个方向则是直接抛弃“效用”与MEU,而仅从“偏好”出发。我们要求参与者对所有可能存在的赌局给出自己的偏好顺序。如果参与者对一个获胜奖励失败无奖励的赌局和另一个立刻支付的确定选项的偏好相等(中立),则我们称参与者对赌局获胜的主观概率为。决策论的成就在于,他们成功的在经典世界里证明了如果参与者排出的偏好顺序是理性的,则这里构造的主观概率同样满足基本概率原理,是合格的主观概率构造。
这条思路的巧妙之处在于,它仍然没有对“理性”本身作任何限制,但对于偏好的理性排序提供了极强的可操作性,以至于在舍弃了“效用”和MEU之后,这个思路不仅能反向推出MEU还能推出更多深层结论。以下引用Wallace原文
决策论并不关心参与者的理性或者某个决策到底是什么:如果有个参与者想跳进鳄鱼窝里,我们可能觉得他们不理性但决策论并不会。但如果有人说自己宁愿跳进鳄鱼窝也不愿去晒沙滩浴,宁愿晒沙滩浴也不愿跳进毒蛇窝,那么理性要求他在面临鳄鱼窝和毒蛇窝时必须选择鳄鱼窝。
文章接下来的部分将展示多重世界假设下如何使用决策论得出主观概率。并且揭示出这种主观概率反而远比比经典世界里的决策论主观概率更为深刻,直接推导出了波恩规则,以及做到了其他概率理论都没能做到的成就:一个满足主原理解释的真正的客观概率。
多重世界下的决策论
概念定义
宏观态 (Macrostate)
一组对于理性参与者而言并没区别的微观状态。如死猫和活猫体内的粒子的波函数分别都有几乎无穷种排列组合,但做薛定谔猫实验时并不会去区分这些排列组合,关心的只是是死是活。“死”和“活”其实都是宏观态而不是实际的状态。每个宏观态都是希尔伯特空间的一个子空间
在实际生活中,由于退相干的广泛存在,对于宏观物体人们一般都用退相干所偏好的几组状态来划分宏观态。但是在下面的推导中并不假设退相干偏好,理论上可以随便划分。但参与者必须能够清楚的区分各个宏观态,因为参与者需要有能力根据当前的宏观态选择自己接下来的行动。
回报 (Reward)
类似于宏观态,但更加粗粒度——仅按照理性参与者偏好进行划分的“宏观态”。例如“死白猫”和“死黑猫”均为宏观态,但是只有“死猫”“活猫”才是参与者关心的。此概念为决策论常见术语。
分支 (Branching)
(待完成)
使用布尔代数和集合论形式化(可跳过)
为了严格化写下所有的推导过程,外加涉及到概率论,想要绕开布尔代数的就不可能了。学过集合概率论的对以下操作都应该很熟悉,没什么新内容,就是繁文缛节。
希尔伯特空间的子空间的交并 (Conjunction & Disjunction)
定义新的集合“交”“并”操作:如果S是希尔伯特空间的若干个子空间,定义子空间的并为的闭包集(closure),子空间的交为的闭包集。
例:空集、x轴、xy平面....均为的子空间。x轴和y轴的并为xy平面(由两条线张开成一个平面),y=x平面和x=0平面的交为z轴。
事件空间 (Event Space)
希尔伯特空间一组子空间组成的布尔代数集,交并采用上述新定义。简单来说就是选择一组在交并操作下封闭的子空间。
事件空间的每个元素都是一个事件。
通过合适的构造事件空间,可以使得每个宏观态都是一个事件,每个事件可以被表示为一组正交宏观态的并(原书此处笔误)。回报也是一系列正交的事件,且所有回报的并为希尔伯特空间本身。
例:一个物体处于红/蓝+圆/方任意叠加中。选择宏观态集合={红,蓝圆,蓝方},回报空间{蓝,红}。事件空间为={空,红,蓝圆,蓝方,蓝,又红又蓝圆,又红又蓝方,又红又蓝}。
权重函数 (Weight function)
若初始状态为,事件E在操作U之后的权重函数定义为
注意这个只是一个减少书写量的函数定义。目前没有任何物理意义。
分支 (Branching)
若初始状态为,经过操作U后包含的最小事件记作
若此最小事件包含于同一个回报内,且由一系列正交宏观态的并得到,宏观态的权重函数值记作集合,称U为M的一个-分支
理性要求(多重世界无关部分)
全序关系 (Total Ordering)
含义:在给定量子态的前提下,理性人对于各种操作选项之间的评价必须是全序排列。顺序必须有传递性(如果A比B好,B比C好,那么A比C好),反身性(A和A一样好),连通性(要么A比B好,要么B比A好,要么A和B一样,不存在无法比较的情况)
解释:全序要求是一个非常基础的假设。如果出现A>B>C>A,或者和稀泥说A和B无法比较,那只能说明评价标准出现了重大漏洞,能推导出匪夷所思的结论。
严格化:是定义在全体量子算符集上的二元关系,满足
历时一致性 (Diachronic Consistency)
含义:在给定量子态的前提下,已知操作U后跟随两个选项V和V',如果未来的理性人偏好V胜过V‘,那么现在的理性人偏好U后再V胜过U后再V'
解释:历时一致性代表始终如一。绝对的理性应该需要能预见到未来的理性。朝令夕改说明肯定有某个时间点出了问题。
严格化:
理性要求(多重世界相关部分)
宏观态中立 (Macrostate Indifference)
含义:对于同一个宏观态内的微观态,理性决策者认为相同。
解释:复述了一遍宏观态的定义。
分支中立 (Branching Indifference)
含义:如果一个操作末态所有分支对应的回报等于初态对应的回报,理性决策者认为有无此操作均相同。
解释:显而易见。
状态随附性 (State Supervenience)
含义:对于两个初状态和,如果U和U‘分别作用在两个状态上得到一致的末状态,V和V’分别作用在两个状态上得到一致的末状态。如果理性人偏好U胜过V,那么也应该偏好U‘胜过V'
解释:理性人只关心末状态(甚至可以更进一步,末状态对应的回报)而不是操作本身。在初状态被给定的情况下,那么能让末状态好的操作就是好操作
严格化:
解的连续性 (Solution Continuity)
含义:在两个不相等的操作上叠加一个无穷小的微扰不会改变这两个操作之间的次序关系
解释:很常见的连续性假设,对于推导过程有重大帮助。如果无穷小的微扰就能打乱排序........这怕是专门用高级集合论知识构造反例来抬杠的。
严格化:
丰富性公理
与经典决策论不同的是,量子决策论由于基于量子力学,因此其具有不同于经典世界的独特数学结构。这些特殊结构被统称为丰富性公理。
回报可用性
对于任何宏观态,总存在一个幺正操作使得当前宏观态的所有状态转换进入一个任意指定的回报
含义:不管游戏进行到什么状态,总应该存在量子力学上的理论可能性(不管实际中多不可能,比如涉及到穿墙,时间反演倒流等等)使得承诺的任意一个奖品立刻确定性地颁发出来。无论参与者自认处于什么宏观态,都不应该影响到各奖项的现在立刻确定性的颁奖在量子力学上的理论可能性。立刻、确定性地颁奖这个行为本身不应当带来或者毁灭任何信息,使得它们在量子力学上具有可能性。
意义:只要回报子空间维数高于宏观态对应的子空间,那么我们就能找到幺正算符从宏观态子空间映射进回报子空间。相当于要求维数最小的回报子空间维数也需要高于维数最大的宏状态子空间
解释:尽管并不完全准确,但这个公理基本上要求回报的划分“粒度”必须要比一般宏观态更粗(尽管这条公理没有要求宏观态必须是回报的子空间)。一个比较极端的反例就是回报的划分比宏观态更细,那么会不可避免地导致参与者不得不关心隐藏在同一个宏观态下的不同回报,导致宏观态定义失效。基本上来说,参与者能“合理地”参与这个游戏的前提就是参与者对游戏中的情景需要具有一个最低限度的感知能力来区分宏观状态,至少需要细于游戏奖品选项的区分程度。
举一个反例,如果参与者完全失明失聪丧失一切感知能力无法感知任何宏观态信息,对于他来说唯一的宏观态就是全体希尔伯特空间,但他却参与了一个存在两种奖品可能性的游戏,那么这毫无疑问是不合理的。一个最简单的问题是,即使他完成了游戏,他该怎么感知到自己获得的是那个奖品呢?
分支可用性
任意给定一组正实数,若其之和为1,则对于任意宏观态,存在一个操作使得任意宏观态内的微观态演化为多个宏观态叠加,且处于每个宏观态的权重函数为,且终态与始态处于同一个回报子空间内。
含义:任意给定一组正实数,若其之和为1,则参与者则可以设计一个不影响游戏结果的量子力学实验并且制备一个该实验的初态,使得初态在各本征态上模平方振幅为。该量子力学实验的各本征态应当分别对应一个宏观态。
解释:简单来说为了利用量子力学的性质,我们分析这个决策游戏时得考虑一个更大的世界。这个世界里除了参与者本身,游戏的必要装置以外,还得存在一个和游戏本身完全不相关的量子力学实验场地。尽管参与者不一定会去用这个实验场地去制备各种奇怪模平方幅量子态,但参与者需要至少有制备的理论可能性。很明显任何一个现实世界里发生的决策问题都可以满足这个假设,因为我们的现实世界上不仅有制备的理论可能性,我们还有告诉你如何制备这些状态的理论,甚至真想制备的话,总能联系到一家实验室去制备。
擦除(Erasure)
在同一个回报子空间内,任意取两个宏观态,在两个宏观态内各任取一个微观态,则在两个宏观态内必各存在一个值域仍然在本回报子空间内的操作,使得两个操作作用在各自微观态上后得到同一个微观态
含义:这个公理听起来是最弯弯绕的。理解他的含义最好从否命题出发,如果这个公理不成立,那么在同一个回报子空间内,存在两个宏观态,两个宏观态内可以各找到一个微观态,使得不存在任何两个操作分别作用在这两个微观态上后可以得到同一个微观态,且这两个操作的结果仍留在原本回报子空间内。
解释:在游戏结束后已经得到回报的情况下,在不篡改游戏结果的情况下,任意两个微观态的区别理论上应当是可以消除的(通过各自的操作达到同一个微观态)。参与者完全可以只记住自己赢得了什么,忘掉并理论上毁掉除此之外的细节,然后立刻参与后续的其他游戏,而不用去思考第一局游戏留下的各种微观态会影响到后续游戏的胜负产生持久的效应。如果第一局游戏留下的微观态会干扰后续游戏,那么显然第一局游戏的设计者在游戏的回报上撒了谎:他没有阐述清楚各种选项的全部影响。而这第一局游戏根本不是独立的一个游戏,我们应当把它与后续所有受到影响的游戏联合考虑为一个游戏。
而具体到擦除公理的表述上,它表述的强度远远更弱,已经尽可能地做出了让步。他只是定义在任意两个微观态上而不是宏观态上,只要求全知全能通晓微观态细节的“上帝”能做到擦除两个微观态之间的区别。如果连通晓微观态细节的“上帝”都做不到擦除两个同回报下微观态的区别,那么我们只能别无选择地认为第一局游戏的回报里一定隐藏了没有明说的其他影响。反之,尽管参与者不一定能自己毁灭第一局实验的所有影响,我们至少可以说,如果他能通晓微观状态的话,他是有毁灭第一局实验除了结果以外的所有影响的理论可行性的。
我们是可以做出更强更直观的表述的,比如给定任意一组新的与之前回报子空间集合相容且满足一定性质的的宏观态(模拟第二局游戏一个观察世界方式不太相同但记得第一局游戏结果的参与者),对于任意一个老的宏观态,总能找到一个操作在回报不变的情况下能从老宏观态映射到新宏观态。但这个表述更加复杂,而且后续证明并没用到这么强的公理。
问题的连续性
对于任意事件,定义域为的所有操作组成一个开集
含义:任意一个操作叠加一个微扰后只要还是幺正的总还是一个合格的操作
论证过程
总体的论证思路非常巧妙。与其考察理性人对当前量子决策游戏各分支的偏好,我们考察其对构造出来的任意分支的偏好,得出结论其主观概率必然是关于模平方振幅的一个单调递增函数。而得知这一点后,我们便可以将问题转移到另一个构造出来的量子力学实验上,通过控制其模平方振幅使得其求解其主观概率等于求解我们当前考察问题的主观概率,而其构造的结构又易于进行分支计数。最后由于构造出来的量子力学实验的各分支在希尔伯特空间内的合成遵循勾股定理也就是模平方合成,我们得出结论主观概率必然等于模平方振幅本身。
(后续证明在Wallace书中第四章有简单证法,基本绕开了宏观态、回报等概念,只是使用了核心的分支可用性和擦除等公理。第五章证法思路基本相同但为了严格性大量出现此类概念。考虑能否放松部分要求以此简化第五章证明)
等价引理 (Equivalence Lemma)
含义:满足前述理性要求的前提下,如果两个操作产生的结果使得每个回报的权重函数相同,理性决策者认为两个操作相同。
(待完成)
空引理 (Null Lemma)
含义:满足前述理性要求的前提下,如果一个分支的权重是0,理性决策者认为这个分支存在与否均相同。
(待完成)
压倒引理 (Dominance Lemma)
含义:满足前述理性要求的前提下,如果两个操作均只会产生两个回报和,且,则理性决策者偏向产生权重大的操作
(待完成)
结论:波恩规则
满足前述理性要求的前提下,理性决策者对操作的任意的偏好全序,都存在着这样一个效用函数能够计算出来:效用函数为各回报态效用函数按照权重函数(模平方振幅)的加权平均。
(待完成)
解读
证明出波恩规则,等于证明出了任何一个满足前述理性条件的决策人,在进行涉及到波函数的决策时,都会采用模平方振幅作为自己的主观概率。