分支过程

Branching Process 分支过程

本文为研究生课程《计算机科学与技术理论基础》课程的作业内容。在网上没有检索到相关的中文资料,于是为了加深自己的理解(同时造福后人),写成此文。

为了不破坏连贯性,文中提到的定理仅描述内容,证明部分置于附录。

前言

一切故事起源于19世纪中期,众多贵族意识到他们的家族将会面临灭绝的风险,因此一位叫Galton的贵族兼学者提出这样的一个问题:

Galton

How many male children (on average) must each generation of a family have in order for the family name to continue in perpetuity?

1874年,Reverend Henry William Watson和Galton共同发表了一篇名为《One the probability of extinction of families》,自此这个问题得到了解决。

本文便是以这个问题为背景,探讨分支过程和分支过程的灭绝概率。

首先我们需要对分支过程进行定义。这很容易理解,类比兔子生小兔子的问题,每只兔子随机生若干个小兔子,并且死去,分支过程研究的是每一代兔子的总数符合什么样的特征。用数学模型来表达,我们可以将分支过程抽象为下面的描述:

  1. 一个种群在第零代n=0时开始,此时种群的总数Z_0=1

  2. 经过一段单位时间(即一代),在n=1时,这个唯一的个体产生了Z_1个子个体,并且死去。此处,Z_1是一个非负整数域的随机变量。

  3. 按照Z_1的取值,我们面临下面几种情形:

    • Z_1=0,则种群灭绝,在n\ge2时,任何事情都不会发生。

    • Z_1>0,我们用Z_{1, 1}代表第一个个体,Z_{1,2}代表第二个个体,以此类推,Z_{1,Z_1}代表最后一个个体。为了简化问题,我们假设这些个体产生下一代的数量的概率分布相同,且相互独立。同时,这些概率分布又与Z_1相互独立,即与他们的个数相互独立。在n=2时,我们可以得到总体数量为:

      Z_2=\sum_{k=1}^{Z_1} Z_{1,k}

  4. 后面的代类推下去,我们可以得到

    Z_{n+1}=\sum_{k=1}^{Z_n} Z_{n, k}

上面这个过程定义为简单的分支过程(Simple Branching Process)。我们接下来的研究都是基于这种分支过程,即一个重要假设:

每个节点产生下一代节点的个数的概率分布相同,相互独立,且与其他代也相互独立(即与本代节点总数相互独立)。此概率分布函数称为Offspring distribution。

为了模拟分支过程,我们可以利用许多工具。随机游走就是其中之一,但是随机游走并不是十分适用,因为本问题中每一代的增长量Z_{n+1}-Z_{n}是与Z_n相关的。

我们也可以用生成函数(Generating Function)来做这件事,而事实上,生成函数更加适合。下一个章节会对我们用到的生成函数这一数学工具作出解释。

概率生成函数

  1. 概率质量函数(Probability Mass Function, PMF):定义为一个离散函数,p_X(x_i)=P(X=x_i)

    PMF可以理解为离散型随机变量的概率密度函数。

  2. 生成函数

    对于一个非负整数值的随机变量X来说,它可以被一个序列\{p_n\}_{n\in N_0}完全确定。其中,p_n取值范围为[0, 1],定义为X=n的概率,即:

    p_n=\mathbb{P}[X=n], n\in \mathbb{N_0}

    因此,\{p_n\}_{n\in N_0}可以被用来构造一个幂级数,即:

    P_X(s)=\sum_{k=0}^\infty p_ks^k

    由于\Sigma_n |p_n| \le 1,因此\{p_n\}_{n\in N_0}的收敛半径至少为1。

    回顾:幂级数的收敛半径R\in [0, \infty]为使得\Sigma_{k=0}^\infty a_kx^k绝对收敛的最大正数。

    定义P_X(s)=\sum_{k=0}^\infty p_ks^k可以定义为PMF:\{p_n\}_{n\in N_0}的生成函数。简单表示,可以定义为非负整数值随机变量X的生成函数。

  3. 几个常见分布的生成函数

    • 伯努利分布b(p):此处p_0=q, p_1=pp_n=0对任意n\ge 2成立。因此:

    P_X(s)=ps+q

    • 二项分布b(n, p)p_k=(^n_k)p^kq^{n-k}, k=0,\cdots,n。因此:

    P_X(s)=\sum_{k=0}^n\binom{n}{k} p^kq^{n-k}s^k=(ps+q)^n

    • 几何分布g(p)p_k=q^kp,k \in \mathbb{N_0}。因此:

    P_X(s)=\sum_{k=0}^\infty q^ks^kp=p\sum_{k=0}^\infty (qs)^k = \frac{p}{1-qs}

    • 泊松分布p(\lambda)p_k=e^{-\lambda}\frac{\lambda^k}{k!}, k \in \mathbb{N_0}。因此:

    P_X(s)=\sum_{k=0}^\infty e^{-\lambda}\frac{\lambda^k}{k!}s^k=e^{-\lambda}\sum_{k=0}^\infty\frac{(s\lambda)^k}{k!}=e^{-\lambda}e^{s\lambda}=e^{\lambda(s-1)}

  4. 生成函数的基本分析性质

    定理1:对X一个非负整数值随机变量,其PMF为\{p_n\}_{n\in N_0},其生成函数为P_X,则如下成立:

    1. P_X(s)=\mathbb{E}[s^X], s\in [-1, 1]
    2. P_X(s)下凸,单调递增,且0 \le P_X(s) \le 1, s\in [0, 1]
    3. P_X(s)在区间(-1, 1)无穷阶可导,且:

    \frac{d^n}{ds^n}P_X(s)=\sum_{k=n}^\infty k(k-1)\cdots(k-n+1)s^{k-n}p_k, n\in \mathbb{N}
    推论p_n=\frac{1}{n!}\frac{d^n}{ds^n}P_X(s)|_{s=0},因此s\rightarrow P_X(s)唯一确定了一个序列\{p_n\}_{n\in N_0}
    证明见附录。

  5. 后面我们会用到的定理

    • 定义\{p_n\}_{n\in N_0}\{q_n\}_{n\in N_0}为两个PMF,则他们的卷积p*q定义为序列\{r_n\}_{n\in N_0},其中:

      r_n=\sum_{k=0}^n p_kq_{n-k}, n\in \mathbb{N_0}

      性质\{p_n\}_{n\in N_0}\{q_n\}_{n\in N_0}为两个PMF,则他们的卷积r=p*q也是PMF,即满足:

      1. r_n\ge0, n\in \mathbb{N_0}
      2. \sum_{k=0}^\infty r_k=1
    • 定理2X,Y为两个独立的非负整数值随机变量,他们的PMF分别为:\{p_n\}_{n\in N_0}\{q_n\}_{n\in N_0},则他们的和Z=X+Y也是非负整数值随机变量,其PMF为\{p_n\}_{n\in N_0}\{q_n\}_{n\in N_0}的卷积。

      证明见附录。

    • 定理3\{p_n\}_{n\in N_0}\{q_n\}_{n\in N_0}为两个PMF,P(s)Q(s)为他们的生成函数,则卷积r=p*q定义的生成函数R(s)满足下式:

      R(s)=P(s)Q(s)

      推论X,Y为两个独立的非负整数值随机变量,P_{X+Y}为其生成函数,则有:

      P_{X+Y}(s)=P_X(s)P_Y(s)

      证明见附录。

    • 定理4\{\xi_n\}_{n\in \mathbb{N}}是一列相互独立的非负整数值随机变量,他们的PMF均为\{p_n\}_{n\in N_0},生成函数为P_\xi(s)N为一个与\{\xi_n\}_{n\in \mathbb{N}}独立的随机变量,代表随机次数。则随机变量的随机和Y=\sum_{k=0}^N \xi_k的生成函数P_Y有:

      P_Y(s)=P_N(P_\xi(s))

      证明见附录。

    此处不表述上面定理的用途,在后文的建模和证明过程中会用到。

基于生成函数的分支过程数学模型

我们如何表示第n代的群体总数Z_nn \in \mathbb{N_0})的分布?这是分支过程模型的一个核心问题。

给定一个Offspring Distribution,我们可以定义一个分支过程\{Z_n\}_{n\in \mathbb{N_0}}。下面我们考虑他的概率模型。

首先,Z_n的含义是个体数,因此必然为非负整数值随机变量。所以此分布可以完全由其PMF决定。根据上面对概率生成函数的定义,也就是完全由其生成函数决定。虽然直接定义他的PMF很困难,但我们可以利用生成函数的工具进行计算。

  1. 定理5\{Z_n\}_{n\in \mathbb{N_0}}为一个分支过程,其Offspring Distribution由PMF:\{p_n\}_{n\in N_0}定义,此PMF的生成函数记做P(s)。则随机变量Z_n的生成函数可以表达为:

    P_{Z_n}(s)=\underbrace{P(P(\cdots P(s)\cdots))}_{\text{n's P}},n\ge 1

    证明见附录。

  2. 几个常见的Offspring Distribution定义的分支过程的特性分析

    \{Z_n\}_{n\in \mathbb{N_0}}为一个分支过程,其Offspring Distribution由PMF:\{p_n\}_{n\in N_0}定义,则:

    • p_0=1, p_n=0, n\in \mathbb{N}P(s)=\sum_{k=0}^\infty p_ks^k=1

      此时P_{Z_n}(s)=1=\sum_{k=0}^\infty \mathbb{P}[Z_n=k]s^k,故\mathbb{P}[Z_n=0]=1, n\ge 1。此时,Z_0=1,Z_n=0,n\in\mathbb{N}。这个分支过程在第一代即灭绝。

      Offspring Distribution of example 1

      感性认识:Offspring Distribution的PMF如上图,可以看出每一代的后代个数的分布情况是:个数为0的概率为1。因此在第零代的时候,节点就不会产生新的节点了,从而在第一代没有新节点,而第零代的节点死亡,分支过程结束,种群灭绝。

    • p_0=0, p_1=1, p_n=0, n\ge 2P(s)=\sum_{k=0}^\infty p_ks^k=s

      此时P_{Z_n}(s)=s=\sum_{k=0}^\infty \mathbb{P}[Z_n=k]s^k,故\mathbb{P}[Z_n=1]=1。此时,Z_n=1,n\in \mathbb{N_0}。这个分支过程表现为:从一个节点开始,每一代会生成一个新节点,同时在下一代时死亡。因此种群会在任何代都保持Z_n=1的总体数量。

      Offspring Distribution of example 2

      感性认识:Offspring Distribution的PMF如上图,每个节点的后代个数为1的概率均为1,也就是每个节点的后代必然有且仅有一个。所以从第零代开始,每个节点都会产生仅一个新节点,同时自身死亡。每代的种群总数均为1。

    • p_0=0, p_1=0, \cdots, p_{k-1}=0, p_k=1, p_n=0, n>k, k\ge 2P(s)=\sum_{j=0}^\infty p_js^j=s^k

      此时,P_{Z_n}(s)=((\cdots(s^k)^k \cdots)^k)^k=s^{k^n}=\sum_{j=0}^\infty \mathbb{P}[Z_n=j]s^j。因此\mathbb{P}[Z_n=k^n]=1,即第n代的种群总数Z_{n}=k^n, n\in \mathbb{N}

    • p_0=p, p_1=q=1-p, p_n=0, n\ge 2P(s)=\sum_{k=0}^\infty p_ks^k=p+qs

      此时,P_{Z_n}(s)=(p+q(p+q(\cdots (p+qs))))=A+Bs。这是因为s在这个重叠乘法中只有一个。有因为乘法都是q在做,所以B=q^n。又因为P_{Z_n}(s)是概率质量函数的生成函数,所以A+B=1,因此A=1-q^n。到这里,我们就可以知道P_{Z_n}(s)=(1-q^n)+q^ns=\sum_{j=0}^\infty \mathbb{P}[Z_n=j]s^j。因此,第n代种群总数Z_n=0的概率为1-q^nZ_n=1的概率为q^n

  3. 统计特性

    虽然我们通过上面的生成函数可以对分支过程\{Z_n\}_{n\in \mathbb{N_0}}的每一代个体数有了初步的认识,并且某些情况下可以计算总体数量分布的显式解。但是上面举的例子都是十分简单的,当我们遇到复杂的分支过程时,依然难以计算分布的显式解。例如:给定Offspring Distribution:p_0=p^2, p_1=2pq, p_2=q^2, p_n=0, n\ge 3,此时Z_n的显示解是难以计算的。(可以自己尝试一下)

    虽然这样,我们依然可以对分支过程每一代的总体数量分布的统计特性进行研究了。引出下面这个定理。

    定理6\{Z_n\}_{n\in \mathbb{N_0}}为一个分支过程,定义在PMF:\{p_n\}_{n\in N_0}上。如果此PMF存在均值,即:\mu=\sum_{k=0}^\infty kp_k < \infty,则有:

    \mathbb{E}[Z_n]=\mu^n

    类似地,如果PMF存在方差,即\sigma^2=\sum_{k=0}^\infty(k-\mu)^2 p_k < \infty,则:

    Var[Z_n]=\sigma^2\mu^n(1+\mu+\mu^2+\cdots+\mu^n)

    证明见附录。

灭绝概率

基于上面的模型,我们可以回答刚开始提出的问题了,即什么时候一个家族才会灭绝。

  1. 灭绝

    首先我们要先给“灭绝”下一个数学上的定义。

    定义:事件E=\{Z_n=0 \text{ for some } n\in \mathbb{N}\}称为灭绝。

    直观上理解,就是找到一个代数n,我可以断言,在第n代,种群总数为零。这也就意味着,从第n代开始,这个种群不会再有变化了(因为从第n代就已经没有个体了),所以称为“灭绝”。

    定义:用记号E_n表示一个上升集合列,即:E_n=\{Z_n=0\}

    这个定义中的上升是因为:当第n代总数Z_n=0时,任意给定一个正整数d,也一定有Z_{n+d}=0。因此,事件E_{n} \subseteq E_{n+1} \subseteq \cdots

  2. 灭绝概率

    因为上面的定义,我们可以断言,如果构造一个概率序列\{\mathbb{P}[E_n]\}_{n\in \mathbb{N}},则这个序列是单调非减的。再根据单调有界原理,\mathbb{P}[E_n]为概率值,因此一定属于区间[0,1],满足有界性,因此序列一定收敛。

    定义:灭绝概率定义为上述概率序列的极限,即:

    p_E=\mathbb{P}[E]=\lim_{n\in \mathbb{N}}\mathbb{P}[E_n]

    又由E_n定义,有\mathbb{P}[E_n]=\mathbb{P}[Z_n=0]

    再根据生成函数的定义:P_{Z_n}(s)=\sum_{k=0}^\infty p_ks^k,此处p_kZ_n=k的概率,也就是\{p_n\}在此处是非负整数值随机变量Z_n的PMF。因此,有\mathbb{P}[Z_n=0]=p_0=P_{Z_n}(0)

    因此,本定义可以改写为:

    p_E=\lim_{n\in\mathbb{N}}P_{Z_n}(0)=\lim_{n\in\mathbb{N}}\underbrace{P(P(\cdots P(0)\cdots))}_{\text{n's P}}

  1. 灭绝概率的计算

    定理7:灭绝概率p_E是方程x=P(x)的最小非负解。此方程称为灭绝方程。

    证明见附录。

    根据这个定理,大多数分支过程的灭绝概率我们都可以计算了(虽然\{Z_n\}的显式表达式不一定求得出来)。

    下面我们可以通过两个参数,即m=P'(1)p_1=\mathbb{P}[Z=1]观察灭绝概率的特征。其中P'(1)=\mathbb{E}[Z],这是因为P(x)=\sum_{k=0}^\infty p_kx^k,则P'(x)=\sum_{k=0}^\infty kp_kx^{k-1}=\sum_{k=1}^\infty kp_kx^{k-1}。所以P'(1)=\sum_{k=1}^\infty kp_k=\mathbb{E}[Z]

    灭绝函数的图像表示

    由于P(x)为下凸单调递增函数,P(0)=p_0 \ge 0,故P(x)的图像可以分为上面三类。

    1. m<1,则P(x)>x[0, 1)成立。
    2. m=1, p_1<1,则P(x)>x[0, 1)成立。
    3. m=1, p_1=1,则P(x)\equiv x,此时树的形状为一根无限单链。
    4. m>1,则P(x)=x(0, 1)内有唯一解。

    根据上述定理,我们知道,情况4中的P(x)=x(0, 1)中的根即为灭绝概率q

灭绝家族期望规模

对一个家族而言,其灭绝时的规模一定是有限的,但是这个规模的期望值却不一定有限。例如:

假设家族灭绝时的规模为一个随机变量,以\frac{1}{2}概率为3,\frac{1}{4}概率为9,\frac{1}{8}概率为27,以此类推。则这个分布为\mathbb{P}[Z=3^n]=(\frac{1}{2})^n\mathbb{P}[Z != 3^n]=0。则Z的期望\mathbb{E}[Z]=\sum_{n=0}^\infty (\frac{3}{2})^n=\infty

如果给定条件m\ne1,其中m=P'(1)=\mu_P,则家族灭绝时的规模一定是有限的,即上述情况是不会发生的。

定理8:给定m\ne 1,则灭绝家族的规模期望值是有限的。若m = 1 并且p_1 = 1,则家族树为一条单链,不会灭绝。若m=1并且p_1 < 1,则灭绝家族的规模期望值是无穷大。

证明见附录。

附录:证明

定理1 证明

由均值的性质,\mathbb{E}[g(X)] = \sum_{k=0}^\infty g(k)p_k,因此\mathbb{E}[s^X]=\sum_{k=0}^\infty s^kp_k=P_X(s)

因为P^{(2)}_X(s) = \sum_{k=2}^\infty k(k-1)s^{k-2}p_k\ge0对任意x\in [0, 1]成立,P'_X(s)=\sum_{k=1}^\infty ks^{k-1}p_k \ge 0对任意x\in [0, 1]成立,因此P_X(s)在区间[0, 1]上单调递增且下凸。

由单调性知,P_X(0) \le P_X(s) \le P_X(1) \Leftrightarrow 0 \le P_X(s) \le \sum_{k=0}^\infty p_k=1

定理2 证明

Z=X+Y,\mathbb{P}[X=k]=p_k,\mathbb{P}[Y=k]=q_k,\mathbb{P}[Z=k]=r_k,由于:
\begin{aligned} r_n=\mathbb{P}[Z=n] &= \sum_{k=0}^n\mathbb{P}[Z=n|X=k]\mathbb{P}[X=k] \\ \ &= \sum_{k=0}^n\mathbb{P}[X+Y=n|X=k]\mathbb{P}[X=k] \\ \ &= \sum_{k=0}^n\mathbb{P}[Y=n-k|X=k]\mathbb{P}[X=k] \\ \ &= \sum_{k=0}^n\mathbb{P}[Y=n-k]\mathbb{P}[X=k] \text{ (Independency of X and Y)} \\ \ &= \sum_{k=0}^n p_kq_{n-k} \end{aligned}
根据序列卷积的定义,我们明显得出r=p*q

定理3 证明

Z=X+Y,\mathbb{P}[X=k]=p_k,\mathbb{P}[Y=k]=q_k,\mathbb{P}[Z=k]=r_k,则:
P_X(s)=\sum_{k=0}^\infty p_ks^k,P_Y(s)=\sum_{k=0}^\infty q_ks^k,P_Z(s)=\sum_{k=0}^\infty r_ks^k。根据定理2,r=p*q,即r_n=\sum_{k=0}^\infty p_kq_{n-k}

X,Y,Z的生成函数为P(s), Q(s), R(s),则:

\begin{aligned} P(s)Q(s) &= \sum_{k=0}^\infty p_ks^k \sum_{j=0}^\infty q_ks^k \\ \ &= (p_0s^0+p_1s^1+p_2s^2+\cdots)(q_0s^0+q_1s^1+q_2s^2+\cdots) \\ \ &= (p_0q_0)s^0+(p_0q_1+p_1q_0)s^1+(p_0q_2+p_1q_1+p_2q_0)s^2+\cdots \\ \ &= r_0s^0+r_1s^1+r_2s^2+\cdots \\ \ &= \sum_{k=0}^\infty r_ks^k \\ \ &= R(s) \end{aligned}

定理4 证明

此处我们不加证明地利用了Fubini’s Theorem。关于此定理可以参考本文

Y=\sum_{k=0}^N \xi_k, P_\xi(s)=\sum_{k=0}^\infty p_ks^k,则:

\begin{aligned} P_Y(s) &= \sum_{k=0}^\infty \mathbb{P}[Y=k]s^k \\ \ &= \sum_{k=0}^\infty s^k(\sum_{i=0}^\infty \mathbb{P}[Y=k|N=i]\mathbb{P}[N=i]) \\ \ &= \sum_{k=0}^\infty s^k(\sum_{i=0}^\infty \mathbb{P}[\sum_{j=0}^i \xi_j=k|N=i]\mathbb{P}[N=i]) \\ \ &= \sum_{i=0}^\infty\sum_{k=0}^\infty s^k\mathbb{P}[\sum_{j=0}^i \xi_j=k|N=i]\mathbb{P}[N=i] \text{ (Fubini's Theorem)}\\ \ &= \sum_{i=0}^\infty \mathbb{P}[N=i]\sum_{k=0}^\infty s^k \mathbb{P}[\sum_{j=0}^i \xi_j=k|N=i] \text{ (Fubini's Theorem)} \\ \ &= \sum_{i=0}^\infty \mathbb{P}[N=i]\sum_{k=0}^\infty s^k \mathbb{P}[\sum_{j=0}^i \xi_j=k] \text{ (Independency of N and $\xi$)} \\ \ &= \sum_{i=0}^\infty \mathbb{P}[N=i] P_{\sum_{j=0}^i \xi_j}(s) \text{ (Def. of Generating Function of $\sum_{j=0}^i\xi_j$)} \\ \ &= \sum_{i=0}^\infty \mathbb{P}[N=i] (P_\xi(s))^i \text{ (Theorem 3)} \\ \ &= P_N(P_\xi(s)) \end{aligned}

定理5 证明

设第n代有Z_n个个体,每个个体的后代个数为一个独立同分布的随机变量,其生成函数为P(s)

首先,从第零代开始,由于第零代只有唯一一个个体,第一代的个体数Z_1的分布即为Offspring Distribution。从而P_{Z_1}(s)=P(s)

用记号Z_{n, i}表示第i个个体的后代个数,这是一个非负整数值随机变量。那么,第n+1代个体数Z_{n+1}=\sum_{k=0}^{Z_n}Z_{n, i}。假设Z_n的生成函数为P_{Z_n}(s)Z_{n+1}的生成函数为P_{Z_{n+1}}(s),则有:

P_{Z_{n+1}}(s) = P_{Z_n}(P(s))

从第1代开始,逐代进行此步骤,我们可得:

\begin{aligned} P_{Z_1}(s) &= P(s) \\ \ P_{Z_2}(s) &= P_{Z_1}(P(s))=P(P(s)) \\ \ P_{Z_3}(s) &= P_{Z_2}(P(s)) = P(P(P(s))) \\ \ &\cdots \\ \ P_{Z_{n}}(s) &= P_{Z_{n-1}}(P(s)) = \cdots = \underbrace{P(P(\cdots P(s)\cdots))}_{\text{n's P}} \end{aligned}

定理6 证明

  1. 先证明一个子命题

    命题Z为一个非负整数值随机变量,则P_{Z}'(1)=\mathbb{E}[Z]

    证明:很简单,P_Z(s) = \sum_{k=0}^\infty p_ks^k,所以P_Z'(s)=\sum_{k=1}^\infty kp_ks^{k-1},所以P_Z'(1)=\sum_{k=1}^\infty kp_k=\mathbb{E}[Z]

  2. 下面证明定理

    由定理5,P_{Z_{n+1}}(s)=P_{Z_n}(P(s)),因此P_{Z_{n+1}}'(s)=P_{Z_n}'(P(s))P'(s)。所以P_{Z_{n+1}}'(1)=P_{Z_n}'(P(1))P'(1)

    因为P_Z(s)=\sum_{k=0}^\infty p_ks^k,所以P_Z(1)=\sum_{k=0}^\infty p_k=1

    所以P_{Z_{n+1}}'(1)=P_{Z_n}'(P(1))P'(1)=P_{Z_n}'(1)P'(1)

    从第1代开始,逐代进行此步骤,我们可得:

    \begin{aligned} P_{Z_{1}}'(1) &= \mathbb{E}[Z_1] = \mathbb{E}[Z] = \mu \\ \ P_{Z_2}'(1) &= P_{Z_1}'(1)P'(1) = \mu^2 \\ \ P_{Z_3}'(1) &= P_{Z_2}'(1)P'(1) = \mu^3 \\ \ &\cdots \\ \ P_{Z_n}'(1) &= P_{Z_{n-1}}'(1)P'(1) = \mu^n \end{aligned}

    所以\mathbb{E}[Z_n]=\mu^n

定理7 证明

  1. 先证明:p_E是方程x=P(x)的解。

    定义一个数列\{x_n\},其中x_n=P_{Z_n}(0)=\underbrace{P(P(\cdots P(0)\cdots))}_{\text{n's P}}

    p_E的定义,有\lim_{n\rightarrow \infty} x_n = \lim_{n\in \mathbb{N}}P_{Z_n}(0)=p_E,可知序列\{x_n\}必收敛到p_E

    再根据\{x_n\}的定义,有x_{n+1}=\underbrace{P(P(\cdots P(0)\cdots))}_{\text{n+1's P}} = P(\underbrace{P(P(\cdots P(0)\cdots))}_{\text{n's P}})=P(x_n)

    因此,有:

    p_E = \lim_{n\rightarrow \infty}x_n=\lim_{n\rightarrow \infty}x_{n+1}=\lim_{n\rightarrow \infty}P(x_n)

    根据海涅定理,P连续,所以\lim_{n\rightarrow \infty}P(x_n)=P(\lim_{n\rightarrow \infty}x_n)

    因此:

    p_E =\lim_{n\rightarrow \infty}P(x_n) = P(\lim_{n\rightarrow \infty}x_n) = P(p_E)

    因此,p_E是方程x=P(x)的一个解。

  2. 再证明:p_E是方程x=P(x)在区间[0, 1]上的最小解。

    假设方程x=P(x)存在另一个解p',则p' \ge 0。由定理1知,P(x)单调递增,因此P(p') \ge P(0)。因为p'是一个解,所以p' = P(p') \ge P(0)

    再由定理1,有P(0)\in [0, 1]。因此我们可以对p' \ge P(0)再应用上述过程,得到p' \ge P(P(0))

    一直迭代下去到第n次,我们可得:

    p' \ge \underbrace{P(P(\cdots P(0)\cdots))}_{\text{n's P}}=\mathbb{P}[E_n]

    两边取极限,有:

    p' = \lim_{n\rightarrow \infty}p' \ge \lim_{n\rightarrow \infty}\mathbb{P}[E_n]=p_E

    因此,任取另一个解p',我们得到p' \ge p_E。即p_E为方程x=P(x)的最小非负解。

定理8 证明

从全概公式出发,

\mathbb{P}[Z_n=k|E]\mathbb{P}[E]=\mathbb{P}[E|Z_n=k]\mathbb{P}[Z_n=k]

等式两端对k求和,得,

\sum_{k=1}^\infty k\mathbb{P}[Z_n=k|E]\mathbb{P}[E]=\sum_{k=1}^\infty k\mathbb{P}[E|Z_n=k]\mathbb{P}[Z_n=k]

继续化简得,

\mathbb{P}[E]\sum_{k=1}^\infty k\mathbb{P}[Z_n=k|E]=\sum_{k=1}^\infty k\mathbb{P}[E|Z_n=k]\mathbb{P}[Z_n=k]

E的含义,可知:\mathbb{P}[E]=q,并且\mathbb{P}[E|Z_n=k]=\mathbb{P}[E]^k=q^k

因此,上式可化为,

q\sum_{k=1}^\infty k\mathbb{P}[Z_n=k|E]=\sum_{k=1}^\infty kq^k\mathbb{P}[Z_n=k]

整理得,

\mathbb{E}[Z_n|E]=\sum_{k=1}^\infty k\mathbb{P}[Z_n=k|E]=\sum_{k=1}^\infty kq^{k-1}\mathbb{P}[Z_n=k]

注意到,P_{Z_n}(s)=\sum_{k=0}^\infty \mathbb{P}[Z_n=k]s^k,因此P_{Z_n}'(s)=\sum_{k=1}^\infty ks^{k-1}\mathbb{P}[Z_n=k]
因此,我们可以得到,

\mathbb{E}[Z_n|E]=\sum_{k=1}^\infty kq^{k-1}\mathbb{P}[Z_n=k]=P_{Z_n}'(q)

由定理5,又有,

\begin{aligned} P_{Z_n}(s) &=\underbrace{P(P(\cdots P(s)\cdots))}_{\text{n's P}} \end{aligned}

因此,

\begin{aligned} P_{Z_n}'(s) =&P'(\underbrace{P(P(\cdots P(s)\cdots))}_{\text{n-1's P}})\cdot P'(\underbrace{P(P(\cdots P(s)\cdots))}_{\text{n-2's P}}) \\ \ &\cdots P'(P(s))\cdot P'(s) \end{aligned}

又因为灭绝概率q为方程x=P(x)的解,因此,

q=P(q)=P(P(q))=\cdots=P(P(\cdots P(q)\cdots))

带入上式可得,

P_{Z_n}'(q)=P'(q)\cdot P'(q) \cdots P'(q) \cdot P'(q)=(P'(q))^n

所以,灭绝家族的期望规模为:

\Sigma=\sum_{n=1}^\infty \mathbb{E}[Z_n|E]= \sum_{n=1}^\infty (P'(q))^n=\frac{1}{1-P'(q)}

因此,考虑参数m=P'(1)=\mu_P,

  1. m>1时,q<1,此时P'(q)<1,从而可得期望规模\Sigma=\frac{1}{1-P'(q)}
  2. m<1时,q=1,此时P'(q)=m<1,与上述情况类似;
  3. m=1时,若p_1=1,则家族树为一条单链,如常见Offspring Distribution中的一个案例所示,此时家族不会灭绝;若p_1<1,则\Sigma=\sum_{n=1}^\infty (P'(q))^n=\sum_{n=1}^\infty 1^n\rightarrow \infty,级数发散,即期望规模为无穷大。
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容