6

6.1 基本概念

6.1.1 定义

本章将介绍另一类特殊的随机过程——鞅. 近几十年来, 鞅理论不仅在随机过程及其他数学分支中占据了重要的地位, 而且在实际问题诸如金融、保险和医学上也得到了广泛的应用. 在此我们将阐述鞅的一些基本理论, 并以介绍离散时间鞅为主.

鞅的定义是从条件期望出发的, 所以对条件期望不熟悉的读者请先学习第1章中的相关内容, 这对于理解鞅理论是至关重要的.

每个赌博者自然都对能使他在一系列赌博后获得期望收益最大的策略感兴趣. 然而在数学上可以证明, 在“公平”的博弈中, 是没有这样的赌博策略的.

假设一个赌博者正在进行一系列赌博, 每次赌博输赢的概率都是\(\frac{1}{2}\). 令\(\{Y_n,n=1,2,\cdots\}\), 是一列独立同分布的随机变量,表示每次赌博的结果 \[ P\{Y_n=1\}=P\{Y_n=-1\}=\frac{1}{2} \] 这里\(\{Y_n=1\}\) (\(\{Y_n=-1\}\))表示赌博者在第\(n\)次赌博时的赢(输).

如果赌博者采用的赌博策略(即所下赌注)依赖于前面的赌博结果, 那么他的赌博可以用下面的随机变量序列 \[ b_n=b_n(Y_1,\cdots,Y_{n-1}), n=2,3,\cdots \] 描述, 其中\(b_n<\infty\)是第\(n\)次的赌注,若赌赢则获利\(b_n\),否则输掉\(b_n\).

\(X_0\)是该赌博者的初始赌资,则 \[\begin{equation} X_n=X_0+\sum^n_{i=1}b_iY_i \tag{6.1} \end{equation}\] 是他在第\(n\)次赌博后的赌资.可以断言 \[ E[X_{n+1}|Y_1,\cdots,Y_n]=X_n. \] 事实上,由式(6.1)我们可以得到 \[ X_{n+1} = X_n + b_{n+1} Y_{n+1}, \] 因此 \[\begin{aligned} E[X_{n+1}|Y_1,\cdots,Y_n] =& E[X_n|Y_1,\cdots,Y_n]+E[b_{n+1}Y_{n+1}|Y_1,\cdots,Y_n]\\ =& X_n+b_{n+1}E[Y_{n+1}|Y_1,\cdots,Y_n]\\ & \text{(因为}X_n\text{与}b_{n+1}\text{由}Y_1,\cdots, Y_n\text{确定)} \\ =& X_n+b_{n+1}E[Y_{n+1}]\\ & \text{(因为}\{Y_n\} \text{是独立随机变量序列)} \\ =& X_n \quad \text{(因为}E[Y_{n+1}]=0, \ \forall n\geq 0) \end{aligned}\] 这证明了,如果每次赌博的输赢机会是均等的, 并且赌博策略是依赖于前面的赌博结果, 则赌博是“公平的”. 因此任何赌博者都不可能将公平的赌博通过改变赌博策略使得赌博变成有利于自己的赌博.

定义6.1 \(\{X_n, n \geq 0\}\)\(\{Y_n, n \geq 0\}\)是随机过程, 对任意\(n \geq 0\)\(X_n\)\(Y_0, Y_1, \dots, Y_n\)的函数, \(E|X_n| < \infty\)\[\begin{equation} E[X_{n+1}|Y_0, \dots, Y_n] = X_n, \ \forall n \geq 0, \tag{6.2} \end{equation}\] 则称\(\{X_n\}\)为关于\(\{Y_n\}\)

定义6.2 \(\{X_n, n \geq 0\}\)\(\{Y_n, n \geq 0\}\)是随机过程, 对\(n \geq 0\), \(X_n\)\((Y_0, Y_1, \dots, Y_n)\)的函数。

如果 \[\begin{equation} E[X^{+}_n]<\infty \text{ 且 } E[X_{n+1}|Y_0, Y_1, \dots, Y_n] \geq X_n, \ \forall n \geq 0, \tag{6.3} \end{equation}\] 则称\(\{X_n\}\)是关于\(\{Y_n\}\)下鞅。 这里\(X^{+}_n=\max\{0,X_n\}\).

另一方面,如果 \[\begin{equation} E[X^{-}_n]<\infty \text{ 且 } E[X_{n+1}|Y_0, Y_1, \dots,Y_n]\leq X_n, \ \forall n \geq 0, \tag{6.4} \end{equation}\] 则称\(\{X_n\}\)是关于\(\{Y_n\}\)上鞅。 这里\(X^{-}_n=\max\{0,-X_n\}\).

注1: 鞅描述的是“公平”的赌博,下鞅和上鞅分别描述了“有利”赌博与“不利”赌博.

注2:关于鞅、下鞅、上鞅的期望存在条件要求, 因为鞅是条件期望不变, 所以只有期望存在有限才有利用价值。 下鞅是条件期望上升的, 如果允许期望等于\(+\infty\)就没有利用价值, 所以加\(E[X^{+}_n]<\infty\)条件。 类似地, 上鞅是条件期望下降的, 如果允许期望等于\(-\infty\)就没有利用价值, 所以加\(E[X^{-}_n]<\infty\)条件。

注3:对鞅\(\{X_n\}\),易见\(E(X_n) = E(X_0)\), \(\forall n\)。 对下鞅,\(\{E(X_n), n\geq 1 \}\)单调增; 对上鞅,\(\{E(X_n), n\geq 1 \}\)单调减。

下面我们定义关于\(\sigma\)代数的鞅. 为此,首先介绍有关概念.

定义6.3 \((\Omega, \mathscr F, P)\)是完备的概率空间, \(\{ \mathscr F_n, n=0,1,2,\dots\}\)\(\mathscr F\)内的一列子\(\sigma\)代数, 并且使得\({\mathscr F}_n \subset {\mathscr F}_{n+1}, n \geq 0\), 称之为\(\sigma\)代数流(filtration). 随机过程\(\{X_n, n=0,1,2,\dots \}\)称为\(\{\mathscr F_n\}\)适应的, 如果\(\forall n \geq 0\), \(X_n\)\({\mathscr F}_n\)可测的. 此时称\(\{X_n,{\mathscr F}_n, n\geq 0\}\)为适应列.

\(\sigma\)代数流反映了随时间变化, 逐步增加的对过去和现在的信息。

在定义6.1中定义鞅时, 我们假定了\(X_n\)\((Y_0,\dots,Y_n)\)的函数. 令\({\mathscr F}_n = \sigma\{Y_0,\dots,Y_n\}, n \geq 0\), 则\(\{\mathscr F_n, n\geq 0\}\)是一个\(\sigma\)代数流. \(X_n\)\(Y_0,\cdots,Y_n\)的函数的确切含义是\(\{X_n\}\)\(\{\mathscr F_n\}\)适应的.

例6.1 考虑一个无穷尽的掷硬币试验, 用\(1\)表示正面,\(-1\)表示反面, 令\(\Omega\)为所有结果序列(由\(1\)\(-1\)组成的序列)的集合, \(\mathscr F\)\(\Omega\)的所有子集构成的\(\sigma\)代数。 构造\(\sigma\)代数流。

: 记\(\Omega\)的元素为\(\omega = (\omega_1, \omega_2, \dots)\), 其中\(\omega_j\)取值于\(\{1, -1\}\), 令 \[ Y_n(\omega) = \omega_n , \]\(Y_n\)表示第\(n\)次投掷的结果。 令 \[ \mathscr F_n = \{A \in \mathscr F: \forall \omega \in A, (\omega_1, \dots, \omega_n) \in B, B \subset \{1, -1\}^n \} , \]\(\mathscr F_n\)中的集合为“柱集”, 易见\(\mathscr F_n\)构成\(\sigma\)代数流, 且 \[ \mathscr F_n = \sigma(Y_1, Y_2, \dots, Y_n), \ n=1,2,\dots \] \(\mathscr F_n\)代表了截止到时刻\(n\)为止可以观测到的试验结果信息。 对事件\(A \in \mathscr F_n\)\(A\)发生与否仅与前\(n\)个试验结果有关, 与后面的结果无关。

\((\{1, -1\}^n, \mathscr F_n)\)中定义概率 \[ P(\{(\omega_1, \dots, \omega_n)\}) = p^{\sum_{j=1}^n \omega_j^+} (1-p)^{\sum_{j=1}^n \omega_j^-}, \] 其中\(0 < p < 1\), 可以将其扩充到\((\Omega, \mathscr F)\)中构成概率空间。

○○○○○○

定义6.4 \(\{{\mathscr F}_n, n\geq 0\}\)是一个\({\mathscr F}\)\(\sigma\)代数流. 随机过程\(\{X_n,n\geq 0\}\)称为关于\(\{{\mathscr F}_n,n\geq 0\}\), 如果\(\{X_n\}\)\(\{{\mathscr F}_n\}\)适应的, \(\forall n \geq 0\),有 \[\begin{equation} E[|X_n|]<\infty \text{ 且 } E[X_{n+1}|{\mathscr F}_n] = X_n . \tag{6.5} \end{equation}\]

定义6.5 适应列\(\{X_n, {\mathscr F}_n, n \geq 0\}\)称为下鞅, 如果\(\forall n\geq 0\), \[\begin{aligned} E[X_n^{+}] < \infty \quad \text{且}\quad E[X_{n+1}|{\mathscr F}_n]\geq X_n . \end{aligned}\]

适应列\(\{X_n, {\mathscr F}_n, n \geq 0\}\)称为上鞅, 如果\(\forall n\geq 0\), \[\begin{aligned} E[X_n^{-}] < \infty \quad \text{且}\quad E[X_{n+1}|{\mathscr F}_n] \leq X_n . \end{aligned}\]

若以\(X_n\)表示一个赌博者在第\(n\)次赌博后所有的赌资. 式(6.2)表示: 平均而言他在下一次赌博结束时的赌资将等于现时的赌资, 与他过去赌博的输赢无关. 这也就是说鞅具有一种“无后效性”, 同时这体现的正是博弈的公平.

在给出例子之前,先给出由定义直接推出的命题.

命题6.1 (1) 适应列\(\{X_n,{\mathscr F}_n, n\geq 0\}\)是下鞅当且仅当\(\{-X_n, {\mathscr F}_n, n\geq 0\}\)是上鞅.

(2) 如果\(\{X_n,{\mathscr F}_n\}\), \(\{Y_n,{\mathscr F}_n\}\)是两个下鞅, \(a,b\)是两个正常数, 则\(\{a X_n + b Y_n, {\mathscr F}_n\}\)是下鞅.

(3) 如果\(\{X_n, {\mathscr F}_n\}\), \(\{Y_n,{\mathscr F}_n\}\)是两个下鞅, 则\(\{\max( X_n, Y_n), {\mathscr F}_n\}\)是下鞅; 如果\(\{X_n, {\mathscr F}_n\}\), \(\{Y_n,{\mathscr F}_n\}\)是两个上鞅, 则\(\{\min (X_n, Y_n),{\mathscr F}_n\}\)是上鞅.

在本命题以及其他类似命题中, \(\sigma\)代数流\(\{{\mathscr F}_n\}\)可以由\(\{Y_k, k=1,2,\cdots, n\}\)替代, 即\(\{X_n\}\)是关于\(\{Y_n\}\)的下鞅.

命题6.1(3)证明: 由题意,\(E X_n^+ < \infty\), \(E Y_n^+ < \infty\), 所以 \[\begin{aligned} {}[\max(X_n, Y_n)]^+ \leq& \max(X_n^+, Y_n^+) \leq X_n^+ + Y_n^+, \\ E[\max(X_n, Y_n)]^+ \leq& E(X_n^+ + Y_n^+) < \infty . \end{aligned}\]\[\begin{aligned} E( \max(X_{n+1}, Y_{n+1}) | \mathscr F_n ) & \geq E(X_{n+1} | \mathscr F_n ) \geq X_n, \\ E( \max(X_{n+1}, Y_{n+1}) | \mathscr F_n ) & \geq E(Y_{n+1} | \mathscr F_n ) \geq Y_n, \end{aligned}\] 从而 \[ E( \max(X_{n+1}, Y_{n+1}) | \mathscr F_n ) \geq \max(X_n, Y_n), \]\(\{ \max(X_n, Y_n), \mathscr F_n \}\)是下鞅。

类似地, 如果\(\{X_n, \mathscr F_n \}\), \(\{Y_n, \mathscr F_n \}\)是两个上鞅, 则\(\{ \min(X_n, Y_n), \mathscr F_n \}\)是上鞅。

○○○○○○

6.1.2 例子

例6.2 \(X_1,X_2,\cdots\)是一族零均值独立随机变量序列, 令\(S_0 = 0\), \(S_n = \sum^n_{k=1} X_k\), 则\(\{S_n\}\)是(关于\({\mathscr F}_n = \sigma(X_1,X_2,\cdots,X_n)\)的)鞅. 另外,若\(X_k(k=1,2,\cdots)\)均值为\(\mu \neq 0\), 则\(\{M_n = S_n - n \mu\}\)是(关于\(\{{\mathscr F}_n\}\)的)鞅.

证明: 当\(E[X_k] = 0\), (\(k=1,2,\cdots\))时, 易见\(S_n\)\({\mathscr F}_n\)可测的, 而且\(E[|S_n|] \leq \sum^n_{i=1} E[|X_i|] < \infty\), 于是 \[\begin{aligned} E[S_{n+1}|{\cal F}_n] =& E[X_1+X_2+\cdots +X_{n+1}|{\cal F}_n] \\ =& E[X_1+\cdots +X_n|{\cal F}_n]+E[X_{n+1}|{\cal F}_n] \\ =& S_n, \end{aligned}\] 从而\(\{S_n\}\)是一个关于\(\{{\mathscr F}_n\}\)的鞅.

同理可以证明, 当\(E[X_k] = \mu \neq 0\), \((k=1,2,\cdots)\)时, \(\{M_n\}\)也是一个关于\(\{{\mathscr F}_n\}\)的鞅.

○○○○○○

注意:设随机变量\(X\)有均值\(\mu \in (-\infty, \infty)\),则\(E|X|<\infty\)

例6.3 在例6.2中设\(E[X_k] = \mu \neq 0\), \((k=1,2,\cdots)\), 则有\(E[|S_n|]<\infty\)\[ E[S_{n+1}|{\mathscr F}_n] = E\big[\sum^n_{i=1}X_i + X_{n+1}|{\mathscr F}_n\big] = S_n + \mu, \] 显然, 若\(\mu >0\)(\(\mu <0\)), 则\(\{S_n\}\)是一关于\(\{{\mathscr F}_n\}\)的下鞅(上鞅).

例6.4 考虑一个公平博弈问题. 设\(X_1,X_2,\cdots\)独立同分布, 分布函数为 \[ P\{X_i=1\}=P\{X_i=-1\}=\frac{1}{2} \] 于是可以将\(X_i(i=1,2\cdots)\)看做一个投硬币游戏的结果: 如果出现正面就赢1元,出现反面则输1元. 假设我们按以下的规则来赌博, 每次投掷硬币之前的赌注都比上一次翻一倍, 直到赢了赌博即停. 令\(W_n\)表示第\(n\)次赌博后所输(或赢)的总钱数, 则\(W_0=0\)。 假设前\(n\)次投掷的硬币都出现了反面, 按照规则, 我们已经输了\(1+2+4+\cdots+2^{n-1}=2^n - 1\)元, 即\(W_n = -(2^n-1)\). 假如下一次硬币出现的是正面, 按规则\(W_{n+1} = 2^n - (2^n-1)=1\)。 由于无论何时只要赢了就停止赌博, 所以\(W_n\)从赢了之后起就不再变化, 于是有\(P\{W_{n+1}=1|W_n=1\}=1\).

由公平的前提知道 \[\begin{aligned} & P\{W_{n+1} =1 | W_n=-(2^n-1)\} = \frac{1}{2} \\ & P\{W_{n+1} = -2^n-2^n+1 | W_n= -(2^n-1) \} = \frac{1}{2}, \end{aligned}\] 易证\(E[W_{n+1} | {\mathscr F}_n] = W_n\), 这里\({\mathscr F}_n = \sigma(X_1,\cdots,X_n)\), 从而\(\{W_n\}\)是一个关于\(\{{\mathscr F}_n\}\)的鞅.

○○○○○○

例6.5 我们可以把例6.4再一般化. 设\(X_1,X_2,\cdots\)仍如例6.4假定, 而每次赌博所下赌注将与前面硬币的投掷结果有关, 以\(B_n\)记第\(n\)次所下的赌注, 则\(B_n\)\(X_1,\cdots,X_{n-1}\)的函数, 换言之\(B_n\)\({\mathscr F}_{n-1}\)可测的(设\(B_1\)为常数). 仍然令\(W_n\)表示\(n\)次之后的总输赢, \(W_0=0\),则有 \[ W_n = \sum^n_{j=1} B_j X_j . \] 假设\(E[|B_n|]<\infty\)(这保证了每次的赌本都有一定节制), 那么\(\{W_n\}\)是一个\(\{{\mathscr F}_n\}\) 鞅.

事实上,注意到\(E[|W_n|]<\infty\)(这可由\(E[|B_n|]<\infty\)得到), 而且\(W_n\)\({\mathscr F}_n\)可测的, 并且 \[\begin{aligned} E[W_{n+1} | {\mathscr F}_n] =& E[\sum^{n+1}_{j=1} B_j X_j | {\mathscr F}_n] \\ =& E[\sum^n_{j=1} B_j X_j | {\mathscr F}_n] + E[B_{n+1} X_{n+1} | {\mathscr F}_n] \\ =& \sum^n_{j=1} B_j X_j + B_{n+1} E[X_{n+1} | {\mathscr F}_n] \\ =& W_n + B_{n+1} E[X_{n+1}] \\ =& W_n . \end{aligned}\]

例6.6 (Polya坛子抽样模型)

考虑一个装有红、黄两色球的坛子. 假设最初坛子中装有红、黄两色球各一个, 每次都按如下规则有放回地随机抽取: 如果拿出的是红色的球, 则放回的同时再加入一个同色的球; 如果拿出是黄色的球也采取同样的做法. 以\(X_n\)表示第\(n\)次抽取后坛子中的红球数, 则\(X_0=1\), 且\(\{X_n\}\)是一个非时齐的Markov链,转移概率为 \[\begin{aligned} & P\{ X_{n+1} = k+1 | X_n=k \} = \frac{k}{n+2} \\ & P\{ X_{n+1} = k | X_n=k \} = \frac{n+2-k}{n+2} . \end{aligned}\]\(M_n\)表示第\(n\)次抽取后红球所占的比例, 则\(M_n=\frac{X_n}{n+2}\), 并且\(\{M_n\}\)是一个鞅.

证明: 这是因为 \[\begin{aligned} E(X_{n+1} | X_n = k) =& (k+1) \frac{k}{n+2} + k \left( 1 - \frac{k}{n+2} \right) \\ =& k + \frac{k}{n+2}, \\ E(X_{n+1} | X_n) =& X_n + \frac{X_n}{n+2} = \frac{n+3}{n+2} X_n, \end{aligned}\] 由于\(\{X_n\}\)是一个Markov链,则\({\mathcal F}_n=\sigma(X_1,\cdots,X_n)\)中对\(X_{n+1}\)有影响的信息都包含在\(X_n\)中, 所以 \[\begin{aligned} E[ M_{n+1} | {\mathscr F}_n ] =& E[M_{n+1} | X_n] \\ =& E\left[ \frac{X_{n+1}}{n+1+2} | X_n \right] \\ =& \frac{1}{n+3} E[X_{n+1} | X_n] \\ =& \frac{1}{n+3} \frac{n+3}{n+2} X_n \\ =& \frac{X_n}{n+2} = M_n . \end{aligned}\]

本例研究的模型是Polya首次引入的,它适用于描述群体增殖和传染病的传播等现象.

○○○○○○

例6.7 (随机利率折现) 考虑按随机利率增长的资产构成的鞅。

设存款本金为\(X_0\), 按日固定利率\(r\)增值, 则 \[ X_{n+1} = (1+r) X_n = X_0 (1+r)^{n+1}, \ n=0,1,2,\dots. \]

如果利率为连续复利\(\sigma\), 则不管时间连续还是离散, 有 \[ X_t = e^{\sigma t} X_0, \quad X_t = e^{\sigma(t-s)} X_s , \ 0 \leq s < t . \]

\(\{\mathscr F_n, n=0,1,2,\dots \}\)为子\(\sigma\)代数流, 随机连续复利(对数收益率)序列\(\{ \sigma_n \}\)关于\(\{ \mathscr F_n \}\)适应, 若资金\(X_n\)满足条件增值关系: \[ E[X_{n+1} | \mathscr F_n] = e^{\sigma_n} X_n, \] 其中\(X_0\)关于\(\mathscr F_0\)可测。 将\(X_n\)折现到0时刻得 \[ Y_n = \exp(-[\sigma_0 + \sigma_1 + \dots + \sigma_{n-1}]) X_n, \]\(\{Y_n, \mathscr F_n, n \geq 0\}\)为鞅。 事实上, 易见\(Y_n\)关于\(\mathscr F_n\)可测, 且 \[\begin{aligned} & E(Y_{n+1} | \mathscr F_n) \\ =& E \left\{ \exp(-[\sigma_0 + \sigma_1 + \dots + \sigma_{n}]) X_{n+1} \,|\, \mathscr F_n \right\} \\ =& \exp(-[\sigma_0 + \sigma_1 + \dots + \sigma_{n}]) \cdot E \left\{ e^{\sigma_n} X_n \,|\, \mathscr F_n \right\} \\ =& \exp(-[\sigma_0 + \sigma_1 + \dots + \sigma_{n}]) \cdot e^{\sigma_n} X_n \\ =& \exp(-[\sigma_0 + \sigma_1 + \dots + \sigma_{n-1}]) X_n = Y_n . \end{aligned}\]

○○○○○○

例6.8 (二叉树模型) 设时间为离散时间\(n=0,1,2,\dots\), 无风险利率为\(R > 0\)。 某风险资产\(\{ S_n, n \geq 0\}\)的增长可表示为 \[ S_{n+1} = (1 + \eta_{n+1}) S_n, \ n=0,1,2,\dots, \] 设其中的简单收益率\(\eta_{n+1}\)独立同分布, 与\(S_0\)独立, 有\(0 < a < b\)\(0<p<1\), 使得 \[ P(1 + \eta_n = a) = p, \quad P(1 + \eta_n = b) = 1-p . \]\(\mathscr F_n = \sigma(S_0, \eta_1, \dots, \eta_n)\)。 令\(M_n\)表示\(S_n\)折现到0时刻的值: \[ M_n = (1+R)^{-n} S_n, n \geq 1. \] 分析\(\{M_n, \mathscr F_n, n \geq 1 \}\)成为鞅的条件。

解答: 令\(\mu = E(\eta_n)\), \(\sigma^2 = \text{Var}(\eta_n)\)

\(E\left[ \frac{S_{n+1} - S_n}{S_n} | \mathscr F_n \right]\)表示风险资产平均的收益率, 则 \[\begin{aligned} & E\left[ \frac{S_{n+1} - S_n}{S_n} | \mathscr F_n \right] \\ =& E(\eta_{n+1} | \mathscr F_n ) = E(\eta_{n+1}) = \mu . \end{aligned}\]

\(\frac{1}{S_n} \left[ \text{Var}(S_{n+1}-S_n | \mathscr F_n) \right]^{1/2}\)表示资产波动率, 这是衡量资产在单位时间每单位价格波动程度的一个指标。 则 \[\begin{aligned} & \frac{1}{S_n} \left[ \text{Var}(S_{n+1}-S_n | \mathscr F_n) \right]^{1/2} \\ =& \frac{1}{S_n} \left[ E(S_n^2 (\eta_{n+1}-\mu)^2 | \mathscr F_n) \right]^{1/2} \\ =& [\text{Var}(\eta_{n+1})]^{1/2} = \sigma . \end{aligned}\] 为了使得\(\{ M_n, \mathscr F_n \}\)成为鞅, 需要 \[\begin{aligned} & E(M_{n+1} | \mathscr F_n) \\ =& (1+R)^{-n-1} E(S_{n+1} | \mathscr F_n) \\ =& (1+R)^{-n-1} \left[ S_n + S_n E(\eta_{n+1} | \mathscr F_n) \right] \\ =& (1+R)^{-n-1} (1+\mu) S_n \\ =& M_n = (1+R)^{-n} S_n , \end{aligned}\] 这需要\(\mu = R\)。 可解得 \[ p = \frac{b - (1+R)}{b-a}, \] 且需要\(0 < a < 1 + R < b\)。 这个概率称为“风险中性概率”, 在此条件下风险资产投资才成为“公平赌博”, 也叫做“无套利条件”。 在此模型下如果\(p\)不等于风险中性概率, 则可以构造投资策略实现无风险地盈利。

鞅是研究金融市场的重要理论工具。

○○○○○○

6.1.3 凸函数变换

下面的引理可以让我们由已知的鞅或下鞅构造出许多新的下鞅.

考虑定义在有穷或无穷开区间\(I\)上的函数\(\varphi(x)\), 称它为凸的, 若\(\forall x,y \in I, 0 < \alpha < 1\),有 \[\begin{aligned} \alpha \varphi(x) + (1-\alpha) \varphi(y) \geq \varphi[\alpha x + (1-\alpha) y] \end{aligned}\] 成立.

典型的凸函数: \(\varphi(x) = x^2\); \(\varphi(x) = |x|\)。 凸函数的曲线是向下弯曲的, 如果函数二次可导且二阶导数大于等于零则为凸函数。

引理6.1 (条件Jensen不等式) \(\varphi(x)\)为实数集\({\mathbb R}\)上的凸函数, \(\mathscr G\)\(\mathscr F\)的子\(\sigma\)代数, 随机变量\(X\)满足 \[\begin{aligned} (1)& E[|X|] < \infty; \\ (2)& E[|\varphi(X)|] < \infty, \end{aligned}\] 则有 \[\begin{equation} E[\varphi(X) | {\mathscr G}] \geq \varphi(E[X | {\mathscr G}]) . \tag{6.6} \end{equation}\]

: 条件Jensen不等式的方向有时会记不准。 这时, 注意\(\varphi(x) = x^2\)是凸函数, 而\(E[X^2 | \mathscr G] \geq ( E[X | \mathscr G])^2\) 所以\(E[\varphi(X) | {\mathscr G}] \geq \varphi(E[X | {\mathscr G}])\)

(6.6)是著名的条件Jensen不等式, 由它即可得到以下定理.

定理6.1 (1) 设\(\{M_n,n\geq 0\}\)是关于\(\{{\mathscr F}_n, n \geq 0\}\)的鞅, \(\varphi(x)\)\({\mathbb R}\)上的凸函数, 且满足\(E[\varphi(M_n)^{+}] < \infty\), \(\forall n\geq 0\), 则\(\{\varphi(M_n), n \geq 0\}\)是关于\(\{{\mathscr F}_n\), \(n \geq 0\}\)的下鞅. 特别地, \(\{|M_n|, n \geq 0\}\)是下鞅; 当\(E[M^2_n] < \infty\), \(\forall n\geq 0\)时, \(\{M^2_n, n \geq 0\}\)也是下鞅.

(2) 设\(\{M_n,n\geq 0\}\)是关于\(\{{\mathscr F}_n, n \geq 0\}\)的下鞅, \(\varphi(x)\)\({\mathbb R}\)上的非降凸函数, 且满足\(E[\varphi(M_n)^{+}] < \infty\), \(\forall n\geq 0\), 则\(\{\varphi(M_n), n \geq 0\}\)是关于\(\{{\mathscr F}_n\), \(n \geq 0\}\)的下鞅.

定理6.1证明:

(1)\(\{M_n\}\)是鞅且\(\varphi\)是凸函数时, 由条件Jensen不等式, \[\begin{aligned} E(\phi(M_{n+1}) | \mathscr F_n) \geq \phi[E(M_{n+1} | \mathscr F_n)] = \phi(M_n), \end{aligned}\]\(\{ \phi(M_n), \mathscr F_n, n \geq 0 \}\)是下鞅。

\(\varphi(M_n) = |M_n|\), 因为\(M_n\)是鞅所以\(E|M_n| < \infty\)\(E(|M_n|^+) = E|M_n| < \infty\)\(|\cdot|\)是函数, 所以\(\{ |M_n| \}\)是下鞅。

\(\varphi(M_n) = M_n^2\), 在\(E(M_n^2) < \infty\)\(E[\varphi(M_n)^2] = E(M_n^2) < \infty\), \(x^2\)是凸函数,所以\(\{ M_n^2 \}\)是下鞅。

(2)\(\{M_n, n \geq 0 \}\)是关于\(\{ \mathscr F_n, n \geq 0 \}\)的下鞅, \(\phi(x)\)\(\mathbb R\)上的非降凸函数, 由条件Jensen不等式和\(\phi\)的单调性得 \[\begin{aligned} E(\phi(M_{n+1}) | \mathscr F_n) \geq \phi[E(M_{n+1} | \mathscr F_n)] \geq \phi(M_n), \end{aligned}\]\(\{ \phi(M_n), \mathscr F_n, n \geq 0 \}\)是下鞅。

○○○○○○

6.1.4 下鞅分解定理

定理6.2 (Doob下鞅分解定理) \(\{X_n, n=0,1,2,\dots \}\)是关于\(\{\mathscr F_n, n \geq 0\}\)的下鞅且\(E|X_n| < \infty\)\(\forall n\)), 则存在关于\(\{\mathscr F_n, n \geq 0\}\)的鞅\(\{M_n \}\)和随机变量序列\(\{A_n \}\), 满足\(A_0 = 0\), \(A_n \leq A_{n+1}\)\(A_n\)关于\(\mathscr F_{n-1}\)可测且\(E A_n < \infty\)\(\forall n\)), 使得 \[ X_n = M_n + A_n, \ n=0,1,2,\dots \]

证明: 取\(A_0=0\)\[\begin{aligned} A_{n+1} =& A_n + [E(X_{n+1} | \mathscr F_n) - X_n] \\ =& \sum_{k=0}^n [E(X_{k+1} | \mathscr F_k) - X_k] , \end{aligned}\] 则易见\(A_n\)非负、单调增,关于\(\mathscr F_{n-1}\)可测, 且\(E|A_n| < \infty\)。 因为 \[ M_{n+1} = X_{n+1} - A_{n+1} = X_{n+1} - E(X_{n+1} | \mathscr F_n) + X_n - A_n, \]\[\begin{aligned} E(M_{n+1} | \mathscr F_n) =& E(X_{n+1} | \mathscr F_n) - E(X_{n+1} | \mathscr F_n) + X_n - A_n \\ =& X_n - A_n = M_n . \end{aligned}\]

○○○○○○

在分解中, \(A_n\)关于\(\mathscr F_{n-1}\)可测, 称\(\{A_n, \mathscr F_n \}\)可料(predictable)随机序列。

6.2 鞅的停时定理及其应用

6.2.1 停时

本节中我们所讨论的鞅, 都是指关于某个随机变量序列的鞅. 所得到的结论对关于子\(\sigma\)代数流的鞅也是成立的, 为了便于理解和应用,我们没有追求结论的一般性.

对于一个关于\(\{X_n, n\geq 0\}\)的鞅\(\{M_n, n\geq 0 \}\), 易知\(\forall n \geq 0\), 有 \[\begin{equation} E[M_n] = E[M_0], \tag{6.7} \end{equation}\] 我们想知道如果把此处固定的时间\(n\)换作一个随机变量\(T\), 是否仍然有 \[\begin{equation} E[M_T] = E[M_0] . \tag{6.8} \end{equation}\]

一般地,此结论未必成立. 但在一定的条件下可以保证它成立, 这就是鞅的停时定理. 鞅的停时定理的意义是: “在公平的赌博中,你不可能赢.” 设想\(\{M_n, n\geq 0\}\)是一种公平的博奕, \(M_n\)表示局中人第\(n\)次赌局结束后的赌本. 式(6.7)说明他在每次赌局结束时的赌本的期望值与他开始时的赌本一样, 但是他未必一直赌下去, 他可以选择任一时刻停止赌博, 这一时刻是随机的. 式(6.8)说明他停止时的赌本和他开始时的赌本相同, 然而很容易看出在一般的情况下, 这是不正确的. 比如例6.4中的赌博者采取的策略, 就可以保证他在赢1元之后结束, 所以我们要为式(6.8)的成立附加一些条件.

定义6.6 (停时) \(\{X_n, n \geq 0\}\)是一个随机变量序列, 称随机函数\(T\)是关于\(\{X_n, n \geq 0\}\)的停时, 如果 \(T\)\(\{0,1,2,\cdots,\infty\}\)中取值, 且对每个\(n\geq 0\)\(\{T=n\} \in \sigma(X_0,X_1,\cdots, X_n)\).

停时可以看作选择一个停止观测的时间, 在时刻\(n\)是否停止, 只能依赖于截止到\(n\)为止的信息, 而不能依赖于\(n+1, n+2, \dots\)时刻的信息。

如果\(P(T < \infty) = 1\), 令\(X_T = X_{T(\omega)}(\omega)\)\(X_T\)是一个随机变量(设概率空间\((\Omega, \mathscr F, P)\)为完备概率空间)。 不加\(P(T < \infty) = 1\)条件时, \[ Y(\omega) = \begin{cases} X_{T(\omega)}(\omega), & \text{ 当} T(\omega) < \infty, \\ 0, & \text{ 当} T(\omega) = +\infty \end{cases} \] 是一个随机变量, 可以表示为\(Y=X_T I_{\{T < \infty\}}\)

\(\{ \mathscr F_n, n=0,1,2,\dots \}\)\(\sigma\)代数流, 随机函数\(T\)\(\{0,1,2,\cdots,\infty\}\)中取值, 且\(\{T = n \} \in \mathscr F_n\), \(\forall n \geq 0\), 称\(T\)\(\{\mathscr F_n\}\)的停时。

由定义我们知道事件\(\{T=n\}\)\(\{T \neq n\}\)都应该由\(n\)时刻及其之前的信息完全确定, 而不需要也无法借助将来的情况. 仍然回到公平博奕的例子, 赌博者决定何时停止赌博只能以他已经赌过的结果为依据, 而不能说, 如果我下一次要输我现在就停止赌博, 这是对公平赌博的停止时刻\(T\)的第一个要求: 它必须是一个停时.

以下看几个停时的例子.

例6.9 确定时刻\(T=n\)是一个停时, 即在赌博开始已确定\(n\)局之后一定结束, 易见这是一个停时.

例6.10 (首达时) \(\{X_n,n\geq 0\}\)是一个随机变量序列, \(A\)是一个实数集合(严格来说是Borel集),令 \[ T(A) = \inf \{n : X_n \in A\}, \ \text{并约定} \ \ T(\emptyset) = +\infty . \] 可见\(T(A)\)\(\{X_n ,n\geq 0\}\)首次进入集合\(A\)的时刻, 称\(T(A)\)\(\{X_n,n\geq 0\}\)到集合\(A\)首达时, 可以证明\(T(A)\)是关于\(\{X_n,n\geq 0\}\)的停时.

证明\[ \{T(A) = n \} = \{X_0 \notin A, X_1 \notin A, \cdots, X_{n-1} \notin A, X_n\in A \}, \] 显然\(\{T(A)=n\}\)完全由\(X_0,X_1,\cdots, X_n\)决定, 从而\(T(A)\)是关于\(\{X_n,n\geq 0\}\)的停时.

○○○○○○

命题6.2 \(T\)是取值于\(\{0,1,2,\cdots, \infty\}\)的随机变量,则下述三者等价 \[\begin{aligned} (1) & \{T=n\}\in \sigma(X_0,X_1,\cdots, X_n); \\ (2) & \{T\leq n\} \in \sigma(X_0,X_1,\cdots,X_n); \\ (3) & \{T>n\} \in \sigma(X_0,X_1,\cdots, X_n) . \end{aligned}\]

证明: 只要注意到如下等式, 即可证明(1),(2),(3)的等价性. \[\begin{aligned} & \{ T \leq n \} = \bigcup^n_{k=0} \{T=k\} \\ & \{T > n \} = \Omega - \{T \leq n \} \\ & \{ T = n \} = \{T \leq n\} - \{ T \leq n-1 \}. \end{aligned}\]

○○○○○○

例6.11 如果\(T\)\(S\)是两个停时, 则\(T+S, \min(T, S)\)\(\max(T, S)\)也是停时.

证明: 这可由命题6.2来证明. \[\begin{aligned} \{ T+S = n \} =& \bigcup_{k=0}^n (\{ T=k \} \cap \{ S=n-k \}) \in \mathcal F_n; \\ \{ \max(T, S) \leq n \} =& \{ T \leq n \} \cap \{ S \leq n \} \in \mathcal F_n; \\ \{ \min(T, S) > n \} =& \{ T > n \} \cap \{ S > n \} \in \mathcal F_n . \end{aligned}\]

○○○○○○

例6.12 由例6.9可知常数\(n\)是停时. 设\(T\)是停时,令\(T_n = \min\{ T, n \}\), 则由例6.11可知每个\(T_n\)都是停时, 并且有 \[ T_0 \leq T_1 \leq T_2 \leq \cdots \leq T_n \leq n, \ \forall n. \]

命题6.3 \(\{M_n, \mathscr F_n, n \geq 0 \}\)是鞅, \(T\)\(\{ \mathscr F_n \}\)的停时且\(P(T<\infty)=1\), 令\(T_n = \min(n, T)\), 以及 \[ Y_n = M_{T_n}, n=0,1,\dots \]\(\{Y_n, \mathscr F_n, n \geq 0 \}\)也是鞅。

证明

\[\begin{aligned} Y_n =& \sum_{i=1}^n M_i I_{\{ T = i \}} + M_n I_{\{ T > n \}} \in \mathscr F_n, \\ E(|Y_n|) \leq& \sum_{i=1}^n E |M_i| + E|M_n| < \infty . \end{aligned}\]\[\begin{aligned} E(Y_{n+1} | \mathscr F_n) =& E \left( \sum_{i=1}^{n+1} M_i I_{\{ T = i \}} + M_{n+1} I_{\{ T > n+1 \}} | \mathscr F_n \right) \\ =& \sum_{i=1}^{n} M_i I_{\{ T = i \}} + E ( M_{n+1} I_{\{ T \geq n+1 \}} | \mathscr F_n ) , \end{aligned}\] 注意到\(\{ T \geq n+1 \} = \{ T > n \} \in \mathscr F_n\),所以 \[\begin{aligned} E(Y_{n+1} | \mathscr F_n) =& \sum_{i=1}^{n} M_i I_{\{ T = i \}} + I_{\{ T \geq n+1 \}} E ( M_{n+1} | \mathscr F_n ) \\ =& \sum_{i=1}^{n} M_i I_{\{ T = i \}} + M_n I_{\{ T > n \}} = Y_n , \end{aligned}\] 证毕。

○○○○○○

定理6.3 (Wald等式) \(\{X_n, n=1,2,\dots \}\)独立同分布, \(E |X_1| < \infty\), \(T\)\(\{X_n, n=1,2,\dots \}\)的停时, 满足\(E T < \infty\),则 \[ E\left[\sum_{n=1}^T X_n \right] = E(X_1) E(T) . \]

证明\[ \sum_{n=1}^T X_n = \sum_{n=1}^{\infty} X_n I_{\{ n \leq T\}} . \] 注意到 \[ \{ n \leq T \} = \{ T \leq n-1 \}^c \]\(X_1, \dots, X_{n-1}\)决定,与\(X_n\)独立。

\[ Y = \sum_{n=1}^{\infty} |X_n| I_{\{ n \leq T\}}, \] 由单调收敛定理和独立性有 \[\begin{aligned} E(Y) =& \sum_{n=1}^{\infty} E[|X_n| I_{\{ n \leq T\}}] \\ =& \sum_{n=1}^{\infty} E[|X_n|] E I_{\{ n \leq T\}} \\ =& E|X_1| \sum_{n=1}^{\infty} P(T \geq n) \\ =& E|X_1| E(T) < \infty . \end{aligned}\]

由控制收敛定理可知

\[\begin{aligned} & E \sum_{n=1}^T X_n = E \sum_{n=1}^{\infty} X_n I_{\{ n \leq T\}} \\ =& \sum_{n=1}^{\infty} E[X_n I_{\{ n \leq T\}}] = \sum_{n=1}^{\infty} E[X_n] E I_{\{ n \leq T\}} \\ =& E(X_1) \sum_{n=1}^{\infty} P(T \geq n) \\ =& E(X_1) E(T) . \end{aligned}\]

○○○○○○

推论6.1 \(\{X_n \}\)是更新过程\(\{N(t), t \geq 0 \}\)的更新间隔时间, \(0< E(X_1) < \infty\)。 有 \[ E[S_{N(t)+1}] = E(X_1)[M(t) + 1] . \]

这是因为,\(N(t)+1\)关于\(\{X_n \}\)是停时,因为 \[ \{ N(t) + 1 = n \} = \{ N(t) = n-1 \} = \{ S_{n-1} \leq t < S_{n}\} \] 只依赖于\(X_1, \dots, X_n\)。 所以由Wald等式可得结论。

要注意的是,\(N(t)\)关于\(\{X_n \}\)不是停时, 因为 \[ \{ N(t)=n \} = \{ S_n \leq t < S_{n+1} \}, \] 依赖于\(X_{n+1}\)的值。

○○○○○○

6.2.2 有界停时定理

在给出停时定理之前先给出有界停时的相关结论.

命题6.4 (有界停时定理) \(\{M_n,n\geq 0\}\)是一个关于\(\{X_n, n\geq 0\}\)的鞅, \(T\)是一个关于\(\{X_n,n\geq 0\}\)的停时并且\(T\leq K\)\({\mathscr F}_n = \sigma(X_0,X_1,\cdots, X_n)\),则 \[ E[M_T|{\mathscr F}_0] = M_0 . \] 特别地, \[ E[M_T] = E[M_0] . \]

证明: 由于\(T \leq K\), 即\(T\)只取有限值, 且当\(T=j\)\(M_T = M_j\), 我们可以把\(M_T\)写作 \[\begin{equation} M_T = \sum^K_{j=0} M_j I_{\{ T= j \}} . \tag{6.9} \end{equation}\]\[ E |M_T| \leq \sum^K_{j=0} E|M_j| < \infty. \] 对式(6.9)关于\({\mathscr F}_{K-1}\)取条件期望, 有 \[\begin{aligned} E[ M_T | {\mathscr F}_{K-1}] =& E[\sum^K_{j=0} M_j I_{\{ T = j \}} | {\mathscr F}_{K-1}] \\ =& E[\sum^{K-1}_{j=0} M_j I_{\{ T = j \}} | {\mathscr F}_{K-1}] + E[ M_K I_{\{ T=K \}} | {\mathscr F}_{K-1}] \end{aligned}\]\(j \leq K-1\)时, \(M_j\)\(I_{\{ T = j \}}\)都是\({\mathscr F}_{K-1}\)可测的, 从而 \[ E[ \sum^{K-1}_{j=0} M_j I_{\{ T = j \}} | {\mathscr F}_{K-1}] = \sum^{K-1}_{j=0} M_j I_{\{T = j\}} . \] 又因为\(T \leq K\)已知, 则\(\{ T = K \}\)\(\{ T > K-1 \}\)是等价的, 由命题6.2\(\{ T > K-1 \} \in \sigma(X_0,\cdots, X_{K-1})\), 因此 \[\begin{aligned} E[ M_K I_{\{ T = K \}} | {\mathscr F}_{K-1}] =& I_{\{ T > K-1 \}} E[ M_K | {\mathscr F}_{K-1}] \\ =& I_{\{T > K-1\}} M_{K-1}, \end{aligned}\] 从而 \[\begin{aligned} E[ M_T | {\mathscr F}_{K-1}] =& I_{\{T > K-1 \}} M_{K-1} + \sum^{K-1}_{j=0} M_j I_{\{ T = j \}} \\ =& I_{\{T > K-2\}} M_{K-1} + \sum^{K-2}_{j=0} M_j I_{\{ T = j \}}, \end{aligned}\] 重复以上运算, 关于\({\mathscr F}_{K-2}\)取条件期望, 我们可以得到 \[\begin{aligned} E[ M_T | {\mathscr F}_{K-2} ] =& E[ E[ M_T | {\mathscr F}_{K-1}] | {\mathscr F}_{K-2} ] \\ =& I_{\{T > K-2\}} M_{K-2} + \sum^{K-2}_{j=0} M_j I_{\{ T = j \}} \\ =& I_{\{T > K-3\}} M_{K-2} + \sum^{K-3}_{j=0}M_jI_{\{T=j\}} . \end{aligned}\] 继续这样的过程, 有 \[ E(M_T | \mathscr F_1) = I_{\{ T > 0 \}} M_1 + M_0 I_{\{ T=0 \}}, \] 于是 \[\begin{aligned} E[ M_T | {\mathscr F}_{0} ] =& E [ E(M_T | \mathscr F_1) \,|\, \mathscr F_0 ] \\ =& E[ I_{\{ T > 0 \}} M_1 | \mathscr F_0 ] + M_0 I_{\{ T=0 \}} \\ =& I_{\{ T > 0 \}} E[M_1 | \mathscr F_0 ] + M_0 I_{\{ T=0 \}} \\ =& I_{\{ T > 0 \}} M_0 + M_0 I_{\{ T=0 \}} \\ =& M_0 . \end{aligned}\]

○○○○○○

有界停时定理是鞅停时定理的一种特殊情况, 可以看出,它的条件太强了, 实际上我们感兴趣的问题中许多都不满足\(T\)有界这一严格的条件. 假设\(T\)是一停时并且\(P\{ T < \infty \} = 1\), 也就是说以概率1可以保证会停止(相对于\(P\{ T = \infty \} > 0\)). 但与\(T\)有界不同的是, 并没有确定的\(K\)使\(P\{T\leq K\} = 1\). 例如,上面博奕的例子, 赌博者并不能确定在某一时刻之前肯定停止赌博, 但可以保证这场赌博不会无限期地延续下去,那么在这种情况下, 何种条件下可以得到\(E[M_T]=E[M_0]\)的结论呢?

6.2.3 停时定理

考虑停时\(T_n = \min\{ T, n \}\),注意到 \[\begin{equation} M_T = M_{T_n} + M_T I_{\{ T>n \}} - M_n I_{\{ T > n \}}, \tag{6.10} \end{equation}\] 从而 \[ E[M_T] = E[M_{T_n}] + E[M_T I_{\{ T > n \}}] - E[M_n I_{\{T>n\}}], \] 可以看出,\(T_n\)是一个有界停时(\(T_n\leq n\)), 由上面命题可知\(E[M_{T_n}]=E[M_0]\). 我们希望当\(n \to \infty\)时, (6.10)后面两项趋于0。

对于\(E[M_T I_{\{ T > n \}}] \to 0\)来说, 这是不困难的, 因为\(P\{ T < \infty\} = 1\), 所以当\(n \to \infty\)时,\(P\{ T > n \}\to 0\)\(E[M_T I_{\{T>n\}}]\)相当于对\(M_T\)限制在一个趋于空集的集合上取期望. 若要求\(E[|M_T|]<\infty\), 由控制收敛定理就可保证\(E[M_T I_{\{ T > n \}}]\to 0\).

\(E[M_n I_{\{T>n\}}] \to 0\)要麻烦一些, 考虑前面的例6.4, 在这个例子中, 事件\(\{T > n\}\)相当于事件:前\(n\)次投掷硬币, 均出现反面. 这个概率是\((\frac{1}{2})^n\), 如果这个事件发生了, 则至少赌博者已经输掉了\(2^n-1\)元, 即\(M_n=1-2^n\),从而 \[ E[ M_n I_{\{ T >n \}}] = 2^{-n}(1-2^n) = -1 + 2^{-n} \to -1, \ n \to \infty, \] 不趋于0, 这也是为什么停时定理的结论在此处不成立的原因. 然而如果 \(M_n\)\(T\)满足\(E|M_T|<\infty\)\[ \lim_{n\to \infty} E[ |M_n| I_{\{ T > n \}}] = 0, \] 我们就可以得出结论\(E[M_T] = E[M_0]\). 我们把这个过程写成如下的停时定理.

定理6.4 (鞅停时定理) \(\{M_n, n \geq 0 \}\)是一个关于\(\{{\mathscr F}_n = \sigma(X_0, X_1, \cdots, X_n)\}\)的鞅, \(T\)是停时,且满足 \[\begin{align} (1) & P\{ T < \infty \} = 1 , \tag{6.11} \\ (2) & E[ |M_T| ] < \infty , \tag{6.12} \\ (3) & \lim_{n \to \infty} E[ |M_n| I_{\{ T > n \}} ] = 0 , \tag{6.13} \end{align}\] 则有 \[ E[M_T] = E[M_0] . \]

推论6.2 \(\{M_n, n \geq 0 \}\)是一个关于\(\{{\mathscr F}_n = \sigma(X_0, X_1, \cdots, X_n)\}\)的鞅, \(T\)是停时,且\(P(T < \infty) = 1\), 设存在随机变量\(Y \geq 0\)\(E(Y)<\infty\), 使得\(|M_n| \leq Y\), \(\forall n \geq 0\), 则停时定理成立:\(E[M_T] = E[M_0]\)。 上界\(Y\)的一个特例是\(Y\)恒等于一个正数。

证明: 这时 \[\begin{aligned} E |M_T| \leq& E(Y) < \infty, \\ \lim_{n\to\infty} E\left[ |M_n| \,I_{\{ T > n \}} \right] \leq& \lim_{n\to\infty} E \left[ Y \, I_{\{ T > n \}} \right] = 0 . \end{aligned}\] 最后一个极限利用了控制收敛定理。 于是,停时定理的三个条件成立。

○○○○○○

推论6.3 \(\{M_n, n \geq 0 \}\)是一个关于\(\{{\mathscr F}_n = \sigma(X_0, X_1, \cdots, X_n)\}\)的鞅, 设\(T\)是停时,且\(P(T < \infty) = 1\), 令\(T_n = \min(T, n)\)\(n\geq 0\), 存在随机变量\(Y \geq 0\)\(E(Y)<\infty\), 使得\(|M_{T_n}| \leq Y\), \(\forall n \geq 0\), 则停时定理成立:\(E[M_T] = E[M_0]\)。 上界\(Y\)的一个特例是\(Y\)恒等于一个正数。

证明: 因\(P(T<\infty)=1\),可表示 \[\begin{aligned} M_T =& \sum_{n=0}^\infty M_n I_{\{T=n\}} = \sum_{n=0}^\infty M_{T_n} I_{\{T=n\}} . \end{aligned}\] 于是 \[\begin{aligned} |M_T| \leq& \sum_{n=0}^\infty |M_{T_n}| I_{\{T=n\}} \leq Y \sum_{n=0}^\infty I_{\{T=n\}} \\ =& Y , \\ E|M_T| \leq& E(Y) < \infty . \end{aligned}\]\[\begin{aligned} & E|M_n I_{\{T>n\}}| = E\left[|M_{T_n}|\, I_{\{T>n\}} \right] \\ \leq& E(Y I_{\{T>n\}}) \to 0, \ (n\to\infty) \end{aligned}\] 所以停时定理条件成立。

○○○○○○

推论6.4 \(\{M_n, n \geq 0 \}\)是一个关于\(\{{\mathscr F}_n = \sigma(X_0, X_1, \cdots, X_n)\}\)的鞅, 设\(T\)是停时,且\(P(T < \infty) = 1\), 令\(T_n = \min(T, n)\)\(n\geq 0\), 存在常数\(b > 0\)使得 使得\(E(M_{T_n}^2) \leq b\), \(\forall n \geq 0\), 则停时定理成立:\(E[M_T] = E[M_0]\)

证明\[\begin{aligned} & E\left[ M_{T_n}^2 I_{\{ T \leq n \}} \right] \leq E(M_{T_n}^2) \leq b, \\ & E\left[ M_{T_n}^2 I_{\{ T \leq n \}} \right] = E\left[ M_{T_n}^2 \sum_{k=0}^n I_{\{ T = k \}} \right] \\ =& \sum_{k=0}^n E\left[ M_{T_n}^2 I_{\{ T = k \}} \right] = \sum_{k=0}^n E\left[ M_{k}^2 I_{\{ T = k \}} \right] \\ \to& \sum_{k=0}^\infty E\left[ M_{k}^2 I_{\{ T = k \}} \right] = E \left[\sum_{k=0}^\infty M_{k}^2 I_{\{ T = k \}} \right] = E(M_T^2), \ n \to \infty, \end{aligned}\] 所以\(E(M_T^2) \leq b < \infty\), \(E|M_T| \leq \sqrt{E(M_T^2)} < \infty\)

另外, \[\begin{aligned} & E \left[ |M_n|\, I_{\{T > n\}} \right] = E \left[ |M_{T_n}|\, I_{\{T > n\}} \right] \\ \leq& \sqrt{E(M_{T_n}^2)} \sqrt{E(I_{\{T > n\}}^2)} \\ \leq& \sqrt{b} \sqrt{P(T > n)} \to 0, \ n \to \infty, \end{aligned}\] 所以停时定理条件成立。

○○○○○○

例6.13 \(\{X_n\}\)是在\(\{0,1,\cdots, N\}\)上的简单随机游动(\(p=\frac{1}{2}\)), 并且0和\(N\)为两个吸收壁. 设\(X_0 = a\), 则\(\{X_n\}\)是一个马氏链且是鞅, 令\(T = \min\{j : X_j = 0 \text{或} N \}\), 则\(T\)是一个停时,求\(P(X_T = N)\)

解答: \(\{ X_n \}\)是有限状态时齐马氏链, 分为三组: \(\{0\}\), \(\{N\}\)是常返态, \(\{ 1, \dots, N-1 \}\)是瞬态。 于是 \[ P(\exists n \text{使得} m \geq n \text{时} X_m \notin \{1, \dots, N-1 \}) = 1 , \] 因此\(P(T < \infty) = 1\)

来证明\(\{ X_n \}\)是鞅。 \(X_n\)有界所以\(E|X_n| < \infty\)。 由马氏性, \(X_{n+1} | \mathcal F_n\)的条件分布等于\(X_{n+1} | X_n\)的条件分布, 对\(i \in \{ 1, \dots, N-1 \}\)\[\begin{aligned} E(X_{n+1} | X_n = i) =& \frac{1}{2} (i-1) + \frac{1}{2} (i+1) = i, \end{aligned}\]\(i=0\)\(i=N\)\(P(X_{n+1} = i | X_n = i) = 1\)\(E(X_{n+1} = i | X_n = i) = i\), 总之有 \[ E(X_{n+1} | X_n = i) = i, \ i=0,1,\dots, N, \ n \geq 0, \] 从而 \[ E(X_{n+1} | \mathscr F_n) = E(X_{n+1} | X_n) = X_n, \ n \geq 0, \]\(\{ X_n \}\)是鞅。

由于\(X_n\)的取值有界, 由推论6.2可知 \[ E[X_T] = E[X_0] = a . \]

由于此时\(X_T\)只取两个值\(N, 0\)\[ E[ X_T ] = N \cdot P\{ X_T = N \} + 0 \cdot P\{ X_T = 0 \} = N \cdot P\{ X_T = N \}, \] 从而得到 \[ P\{ X_T = N\} = \frac{E[X_T]}{N} = \frac{a}{N} . \] 即在被吸收时刻它处于\(N\)点的概率为\(\frac{a}{N}\).

○○○○○○

教材例6.2.5有错误。 \(M_n = X_n^2 - n\)不可能是鞅, 否则 \[ E(M_0) = E(M_n) = E(X_n^2) - n, \]\(0 \leq E(X_n^2) \leq N^2\)有界而\(n \to \infty\)无界。 改正的做法见后面的例6.14

命题6.5 (马氏链首达时概率(不可约情形)) 对有限状态不可约时齐马氏链\(\{ X_n, n \geq 0 \}\), 设状态空间为\(S = \{ 1, 2, \dots, K \}\), 存在\(C > 0\)\(0 < \rho < 1\), 使得对任意\(n \geq 0\)\(i, j \in S\)都有 \[ P(X_t \neq j, 1 \leq t \leq n | X_0 = i) \leq C \rho^n . \]

证明参见§6.6.3.1

推论6.5 在命题6.5条件下, 设\(A\)\(S\)的非空子集, 则存在\(C'>0\)\(0 < \rho' < 1\)使得 \[ P(X_t \notin A, 1 \leq t \leq n | X_0 = i) \leq C' \rho'^n . \]

这是节6.2和6.3(停时定理)某些题目需要的引理。 证明方法类似于更新过程中证明\(F_n(t) = O(\alpha^n)\)的证明, 见§6.6.3.2

命题6.6 (马氏链首达时概率(可约情形)) \(\{ X_n \}\)为有限状态马氏链, 状态空间为\(S = \{ 1,2,\dots, N \}\)。 设常返态的集合为\(A\),瞬态的集合为\(B = S-A\)。 证明对任意\(i \in S\), 存在\(C > 0\)\(0 < \rho < 1\)使得 \[ P(X_t \in B, 1 \leq t \leq n | X_0 = i) \leq C \rho^n . \]

这是节6.2和6.3的某些题目需要的引理。 证明见§6.6.3.3

例6.14 这是教材例6.2.5的改正版本。 在例6.13中, \(\{X_n\}\)是双侧吸收壁的对称随机游动。 令\(T_n = \min(T, n)\), 则\(T_n\)是停时, 令\(M_n = X_{T_n}^2 - T_n\), 则\(\{ M_n, \mathscr F_n, n \geq 0 \}\)是鞅, 可以证明\(E T = a (N-a)\)

证明\[\begin{aligned} M_n =& X_{T_n}^2 - T_n \\ =& \sum_{k=1}^n (X_k^2 - k) I_{\{ T = k \}} + (X_n^2 - n) I_{\{ T>n \}} \in \mathscr F_n , \end{aligned}\]\(E|M_n| < \infty\)。 于是 \[\begin{aligned} E[M_{n+1} | \mathscr F_n] =& \sum_{k=1}^n (X_k^2 - k) I_{\{ T = k \}} \\ & + E[(X_{n+1}^2 - n-1) I_{\{ T = n+1 \}} | \mathscr F_n] + E[(X_{n+1}^2 - n - 1) I_{\{ T > n+1 \}} | \mathscr F_n] \\ =& \sum_{k=1}^n (X_k^2 - k) I_{\{ T = k \}} \\ & + E[(X_{n+1}^2 - n - 1) I_{\{ T> n \}} | \mathscr F_n] \\ =& \sum_{k=1}^n (X_k^2 - k) I_{\{ T = k \}} \\ & + I_{\{ T> n \}} E[(X_{n+1}^2 - n - 1) | \mathscr F_n] , \end{aligned}\]\(\{X_n \}\)马氏性, \[\begin{aligned} E[X_{n+1}^2 - n - 1 | \mathscr F_n] = E[X_{n+1}^2 - n - 1 | X_n], \end{aligned}\]\(Y_{n+1}\)表示第\(n+1\)步的变化, \(P(Y_{n+1} = -1) = P(Y_{n+1} = 1) = \frac{1}{2}\)\(Y_{n+1}\)\(X_n\)独立, 于是对\(i \notin \{0, N\}\), \[\begin{aligned} E[X_{n+1}^2 - n - 1 | X_n=i] =& E[(i + Y_{n+1})^2 - n - 1 ] \\ =& i^2 + EY_{n+1}^2 + 2 i EY_{n+1} - n - 1 \\ =& i^2 + 1 + 0 - n - 1 = i^2 - n, \end{aligned}\] 注意在\(T>n\)条件下必有\(X_n \not\in \{0, N \}\), 所以 \[ I_{\{ T> n \}} E[X_{n+1}^2 - n - 1 | \mathscr F_n] = I_{\{ T> n \}} (X_n^2 - n), \] \[\begin{aligned} E[M_{n+1} | \mathscr F_n] =& \sum_{k=1}^n (X_k^2 - k) I_{\{ T = k \}} + I_{\{ T > n \}} (X_{n}^2 - n) \\ =& M_n, \end{aligned}\]\(\{ M_n, \mathscr F_n, n \geq 0 \}\)是鞅。

来验证停时定理的条件。 例6.13已证明\(P(T<\infty) = 1\), 来证明\(E |M_T| < \infty\)。 注意 \[\begin{aligned} M_T =& X_T^2 - T, \\ |M_T| \leq& N^2 + T, \end{aligned}\] 由命题6.6\[\begin{aligned} E(T) =& \sum_{n=1}^\infty n P(T=n) \\ \leq& \sum_{n=1}^\infty n P(X_t \in \{1, \dots, N-1 \}, 1 \leq t \leq n-1 | X_0 = a) \\ \leq& \sum_{n=1}^\infty n C \rho^{n-1} < \infty, \end{aligned}\] 所以停时定理的第二个条件\(E|M_T|<\infty\)成立。

再来证明停时定理第三个条件成立。 \[\begin{aligned} E[ |M_n| I_{\{ T > n \}}] \leq& E \left[ \sum_{k=1}^n |X_k^2 - k| I_{\{ T = k \}} I_{\{ T > n \}} \right] \\ & + E \left[ |X_n^2 - n| I_{\{ T > n \}}^2 \right] \\ \leq& 0 + (N^2 + n) P(T > n) \\ \leq& (N^2 + n) P(X_t \in \{1, \dots, N-1 \}, 1 \leq t \leq n | X_0 = a) \\ \leq& (N^2 + n) \cdot C \rho^n \to 0, \ (n \to \infty) . \end{aligned}\]

所以,停时定理三个条件都满足,有 \[ E(M_T) = E(M_0) = E(X_{T_0}^2 - T_0) = E(X_0^2 - 0) = a^2, \]\[\begin{aligned} E(M_T) =& E(X_T^2) - E(T) = 0 \cdot P(X_T=0) + N^2 P(X_T = N) - E(T) \\ =& N^2 \frac{a}{N} - E(T) = a N - E(T), \end{aligned}\] 其中用到了例6.13得到的\(P(X_T=N) = \frac{a}{N}\)结果。 于是 \[ E(T) = a(N-a) . \]

○○○○○○

例6.15 \(X_n\)是一个在\(\{0,\pm 1, \pm 2,\cdots\}\)上的简单随机游动\((p=\frac{1}{2})\), \(X_0=0\), 我们已经知道\(\{X_n\}\)是一个不可约时齐马氏链且是鞅。 令\(T=\min\{j : X_j = 1\}\),这是一个首达时,是停时。 由例5.18知这个简单随机游动是常返的(零常返), 从而\(P\{T < \infty \} = 1\). 又由\(X_T = 1\)\(E[X_T]=1 \neq 0 = E[X_0]\), 所以停时定理不成立.

实际上,此时停时定理的条件是不满足的, 我们不再给出具体证明,只给出如下事实: 在这种情况下, \[ P\{ T > n \} \sim C n^{-\frac{1}{2}}, \] 其中\(C\)为常数,从而 \[ E[|X_n| I_{\{ T > n \}}] \not\to 0 . \]

6.2.4 上鞅停时定理

在介绍了鞅的停时定理之后,我们简单地讨论一下有关上鞅停时定理的两个结果. 这在下面的期权值界的例子中是必需的.

定理6.5 \(\{M_n, n \geq 0\}\)是关于\(\{X_n, n \geq 0\}\)的上鞅, \(T\)是关于\(\{X_n, n \geq 0\}\)的停时, \(T_n=\min(T,n)\). 设存在一非负随机变量\(W\),满足\(E[W] < \infty\),且使得 \[ M_{T_n} \geq -W, \ \forall n \geq 0, \] 则有 \[ E[M_0] \geq E[M_T I_{\{ T < \infty \}}]. \] 特别地,若\(P\{ T < \infty\} = 1\),则有 \[ E[M_0] \geq E[M_T]. \]

证明略.

推论6.6 \(\{M_n, n \geq 0 \}\)是关于\(\{ X_n, n \geq 0\}\)的上鞅, \(T\)是关于\(\{X_n,n\geq 0\}\)的停时, 且\(M_n\geq 0\), 则有 \[ E[M_0] \geq E[M_T I_{\{ T < \infty \}}]. \]

我们已经知道对于上鞅,有\(E[M_n] \leq E[M_0]\), \(\forall n \geq 0\), 此处上鞅停时定理说明当把\(n\)换为停时\(T\)时, 在附加某些条件的前提下,结论也成立.

6.2.5 停时定理的应用——关于期权值的界

暂略。

6.3 一致可积性

在鞅的停时定理的条件中, 式(6.13)\(\lim_{n \to \infty} E[ |M_n| I_{\{ T > n \}} ] = 0\)一般是很难验证的, 为此我们将给出一些容易验证的条件, 这些条件蕴含了式(6.13).

首先考虑一个随机变量\(X\), 满足\(E[|X|] < \infty\)\(|X|\)的分布函数为\(F\), 则 \[ \lim_{n \to \infty}E[|X| I_{\{|X| > n \}}] =\lim_{n \to \infty} \int^{\infty}_n |X| dF(x) = 0, \] 这也可以用控制收敛定理证明。

\(P\{|X| > n \} = \delta\)\(A\)是另外一个发生概率为\(\delta\)的事件, 即\(P(A)=\delta\). 容易看出 \[ E[|X|I_A] \leq E[|X|I_{\{|X|>n\}}], \] 事实上 \[\begin{aligned} & E[|X| I_A] - E[|X| I_{\{ |X|>n \}}] \\ =& E[|X| I_A I_{\{ |X|>n \}}] + E[|X| I_A I_{\{ |X| \leq n \}}] - E[|X| I_A I_{\{ |X|>n \}}] - E[|X| I_{A^c} I_{\{ |X|>n \}}] \\ =& E[|X| I_A I_{\{ |X| \leq n \}}] - E[|X| I_{A^c} I_{\{ |X|>n \}}] \\ \leq& n E[ I_A I_{\{ |X| \leq n \}}] - n E[ I_{A^c} I_{\{ |X|>n \}}] \\ =& n E[ I_A I_{\{ |X| \leq n \}}] + n E[ I_A I_{\{ |X| > n \}}] - n E[ I_A I_{\{ |X| > n \}}] - n E[ I_{A^c} I_{\{ |X|>n \}}] \\ =& n E(I_A) - n E(I_{\{ |X|>n \}}]) = 0 . \end{aligned}\] 于是,我们可以有以下结论:

命题6.7 如果随机变量\(X\)满足\(E[|X|] < \infty\), 则\(\forall \varepsilon > 0\), \(\exists \delta >0\), 只要\(P(A) < \delta\)就有 \[ E[|X| \, I_A] < \varepsilon . \]

如果将单个随机变量\(X\)替换成一列随机变量, 就需要推广到一致可积性:

定义6.7 (一致可积) 一列随机变量\(X_1,X_2,\cdots\)称为一致可积的, 如果\(\forall \varepsilon >0\), \(\exists \delta > 0\), 使得\(\forall A \in \mathscr F\), 只要\(P(A) < \delta\)就有 \[\begin{equation} E[|X_n| I_A] < \varepsilon, \ \forall n \geq 0 . \tag{6.14} \end{equation}\]

这个定义的关键在于\(\delta\)不能依赖于\(n\), 并且式(6.14)对任意\(n\)成立.

先给一个不一致可积的例子.

例6.16 考虑例6.4. 令\(A_n\)是事件\(\{ X_1 = X_2 = \cdots = X_n = -1 \}\), 则\(P(A_n) = \frac{1}{2^n}\)\(E[ |W_n| I_{A_n}] = 2^{-n} (2^n - 1) \to 1\). 容易看出\(\{W_n \}\)不满足一致可积的条件.

假设\(\{M_n, n \geq 0\}\)是一个关于\(\{X_n, n \geq 0\}\)的一致可积鞅, \(T\)是停时且\(P\{T < \infty\} = 1\)或等价地\(\lim_{n \to \infty} P\{T > n \} = 0\). 则由一致可积性可得 \[ \lim_{n \to \infty} E[|M_n| I_{\{ T > n \}}] = 0, \] 即式(6.13)成立。 事实上, \(\forall \varepsilon > 0\)\(\exists \delta > 0\), 使得只要\(P(A) < \delta\)就有 \[ E[ |M_n| I_A ] < \varepsilon . \] 因为\(P(T > n) \to 0\), 所以\(\exists N>0\)使得\(n \geq N\)\(P(T > n) < \delta\), 所以 \[ E[ |M_n| I_{\{ T > n \}} ] < \varepsilon , \] 这就是\(\lim_{n\to\infty} E[ |M_n| I_{\{ T > n \}} ] = 0\)的定义。

据此我们给出停时定理的另一种叙述.

定理6.6 (一致可积条件的停时定理) \(\{M_n, n \geq 0\}\)是一个关于\(\{X_n, n \geq 0 \}\)的一致可积鞅, \(T\)是停时, 满足\(P\{ T < \infty \}=1\)\(E[|M_T|] < \infty\), 则有\(E[M_T]=E[M_0]\).

一致可积的条件一般比较难验证,下面给出两个一致可积的充分条件.

命题6.8 (二阶矩有界则一致可积) 假设\(X_1, X_2, \dots\)是一列随机变量, 并且存在常数\(0 < C < \infty\), 使得\(E[X^2_n] \leq C\)对所有的\(n\)成立, 则此序列是一致可积的.

证明\(\forall \varepsilon > 0\), 令\(\delta = \frac{\varepsilon^2}{4C}\), 设\(P(A) < \delta\),则 \[\begin{aligned} E[|X_n| I_A] =& E[|X_n| I_{\{A \cap \{|X_n| \geq \frac{2C}{\varepsilon} \}\}}] + E[|X_n| I_{\{A \cap \{|X_n| < \frac{2C}{\varepsilon}\}\}}] \\ \leq& \frac{\varepsilon}{2C} \cdot E[|X_n|^2 I_{\{A \cap \{|X_n|\geq \frac{2C}{\varepsilon} \}}] + \frac{2C}{\varepsilon}\cdot P\{A\cap \{|X_n|<\frac{2C}{\varepsilon}\}\} \\ \leq& \frac{\varepsilon}{2C} E[X^2_n] + \frac{2C}{\varepsilon} P(A) < \varepsilon . \end{aligned}\]

○○○○○○

命题6.9 (有可积上界则一致可积) \(\{ X_n, n=0, 1,2,\dots \}\)是随机变量序列, 如果存在一个非负随机变量\(Y\), 满足\(E(Y) < \infty\)\(|X_n| \leq Y\)\(\forall n \geq 0\)成立, 则\(\{X_n\}\)一致可积.

这只要利用命题6.7

一致可积的充分条件还有一些,我们不再多列举了.

例6.17 (分支过程) \(X_n\)表示分支过程第\(n\)代的个体数. 设每个个体产生后代的分布有均值\(\mu\)和方差\(\sigma^2\), 则\(\{ M_n =\mu^{-n} X_n \}\)是关于\(\{ X_n, n \geq 0\}\)的鞅(习题6.3). 假设\(\mu > 1\), 则存在一个常数\(C\), 使得\(\forall n\), \(E[M^2_n] \leq C\), 从而\(\{ M_n \}\)是一致可积鞅(习题6.6(2)).

6.4 鞅收敛定理

鞅论中有两个深刻的结论, 一个是上节的停时定理, 另一个就是鞅收敛定理. 本节我们将介绍鞅的收敛定理.

鞅收敛定理说明在很一般的条件下, 鞅\(\{ M_n \}\)会收敛到一个随机变量, 在此记为\(M_{\infty}\).

我们首先来考虑一个特殊的例子——Polyas坛子抽样模型(例6.6). 令\(M_n\)表示第\(n\)次摸球后红球所占的比例, 当\(n \to \infty\)时, 这个比例会如何变化呢? 下面来说明其变化趋势.

\(0 < a < b < 1\), \(M_n < a\), 且令 \[ T = \min\{ j : j \geq n, M_j \geq b\} \]\(T\)表示\(n\)次摸球之后比例从小于\(a\)到超越\(b\)的第一个时刻. 令\(T_m = \min\{T, m\}\), 则对于\(m > n\), 由停时定理可知 \[ E[M_{T_m}] = M_n < a , \] 但是 \[\begin{aligned} E[M_{T_m}] \geq& E[M_{T_m} \cdot I_{\{ T \leq m \}}] \\ =& E[M_T I_{\{ T \leq m \}}] \\ \geq& b \cdot P\{ T \leq m \}, \end{aligned}\] 从而 \[ P\{ T \leq m \} < \frac{a}{b} . \] 因为上式对一切\(m>n\)成立,于是有 \[ P\{ T < \infty \} \leq \frac{a}{b} . \] 这说明至少以概率\(1 - \frac{a}{b}\)红球的比例永远不会超过\(b\).

现在我们假定这一比例已经超过了\(b\), 那么它能够再一次降回到\(a\)以下的概率是多少呢? 同样的讨论可知, 这一概率最大为\(\frac{1-b}{1-a}\).

继续同样的讨论,我们可以知道,从\(a\)出发超过\(b\), 再小于\(a\), 再大于\(b\), ……,有\(n\)个循环的概率应为 \[ p_n \leq (\frac{a}{b})(\frac{1-b}{1-a})(\frac{a}{b})\cdots(\frac{a}{b})(\frac{1-b}{1-a}) = (\frac{a}{b})^n (\frac{1-b}{1-a})^n \to 0, \ (n\to \infty) . \] 由此可见, 这个比例不会在\(a,b\)之间无限次地跳跃. 由\(a,b\)的任意性, 也表明这一比例不会在任意的两个数之间无限地跳跃. 直观地看,极限\(\lim_{n\to \infty} M_n\)存在, 记为\(M_{\infty}\). 这一极限是一个随机变量, 可以证明\(M_{\infty}\)服从\([0,1]\)上的均匀分布(见习题6.7).

○○○○○○

下面我们给出一般的结论.

定理6.7 (鞅收敛定理) \(\{M_n, n \geq 0 \}\)是关于\(\{ X_n, n \geq 0 \}\)的鞅, 并且存在常数\(0 < C < \infty\)使得\(E[|M_n|] \leq C\)对任意\(n\)成立, 则当\(n \to \infty\)时, \(\{ M_n \}\) a.s. 收敛到一个随机变量\(M_{\infty}\).

证明略去。 上面的定理没有要求一致可积性, 只要求一阶矩有界。 在一致可积性条件下可以给出更强结论:

定理6.8 如果\(\{M_n, n \geq 0\}\)是关于\(\{X_n, n \geq 0\}\)的一致可积鞅, 则\(\lim_{n \to \infty} M_n\)存在, 记为\(M_{\infty}\),并且 \[ E[M_{\infty}] = E[M_0] . \]

证明略.

例6.18 \(X_n\)表示分支过程中第\(n\)代的个体数, 每个个体生育后代的分布有均值\(\mu\)和方差\(\sigma^2\), 假定\(X_0=1\), 令\(M_n = \mu^{-n} X_n\). 由例6.17已经知道\(\{M_n\}\)是鞅. 如果\(\mu \leq 1\), 由第5章的结论已经知道灭绝一定会发生, 由此\(M_n \to M_{\infty}=0\), 从而\(E[M_{\infty}] \neq E[M_0]\). 在上节我们说明了若\(\mu > 1\), 则\(M_n\)是一致可积的, 所以在\(\mu > 1\)时, 有\(E[M_{\infty}] = E[M_0] = 1\).

例6.19 \(X_1, X_2, \cdots\)为一独立同分布随机变量序列, \(P\{ X_i = 1 \} = P\{ X_i = -1 \} = \frac{1}{2}\),令 \[ M_n = \sum^n_{j=1} \frac{1}{j} X_j . \] 证明收敛定理结论成立。

证明: 易见\(\{M_n\}\)是鞅.

我们来证明\(\{ M_n \}\)是一致可积的, 显然\(E[M_n] = 0\)\(\text{Var}(X_j)=E(X_j^2) = 1\), 则 \[\begin{aligned} E[M^2_n] =& \text{Var}[M_n] \\ =& \sum^n_{j=1} \text{Var}[\frac{1}{j}X_j] = \sum^n_{j=1} \frac{1}{j^2} \\ \leq& \sum^{\infty}_{j=1} \frac{1}{j^2} < \infty . \end{aligned}\] 从而\(\{ M_n \}\)是一致可积鞅, 当\(n\to \infty\)时, \(M_n \to M_{\infty}\)并且\(E[M_{\infty}] = 0\).

○○○○○○

例6.20 再考虑Polya模型(例6.6). 这里假定最初坛子中有\(m\)个黄球, \(k\)个红球, 所以在第\(n\)次摸球后坛子中应有\(n+m+k\)个球. 假定\(M_n\)为红球的比例. 因为\(0 < M_n < 1\), 有上界\(Y=1\), 所以\(\{ M_n \}\)是一致可积鞅, 所以当\(n \to \infty\)时, \(M_n \to M_{\infty}\)并且\(E[M_{\infty}] = E[M_0] = \frac{k}{k+m}\). 可以证明,\(M_{\infty}\)服从Beta分布\(B(m,k)\), 其分布密度为 \[ \frac{\Gamma(k+m)}{\Gamma(k)\Gamma(m)} x^{k-1} (1-x)^{m-1}, \ \ 0<x<1 . \]

证明略.

在Bayes统计中,这一结果是很自然的. 假设我们对某一事件发生的概率\(p\)感兴趣, 而对\(p\)又一无所知, 我们就只能假定\(p\)\([0,1]\)上的均匀分布(这就是先验分布). 现在假设我们一共做了\(k+m-2\)次试验, 事件发生了\(k-1\)次, 则根据Bayes定理, \(p\)的后验分布就应该是参数为\(k\)\(m\)的Beta分布.

○○○○○○

例6.21 \(\{ M_n \}\)是一关于\(X_0, X_1, \dots\)的鞅, \(T\)是停时, 且\(P \{T < \infty \} = 1\), 令\(T_n = \min(T,n)\), \(Y_n=M_{T_n}\), 则\(Y_n \to Y_{\infty}\)\(Y_{\infty} = M_T\); 若\(\{ M_n \}\)是一致可积的, 有\(E[Y_{\infty}] = E[Y_0]\).

证明: 令\(A = \{ \omega: T < \infty \}\), 则\(P(A)=1\),对\(\omega \in A\)\(T(\omega) < \infty\)\(\exists N > T(\omega)\), 于是\(n \geq N\)\(T_n(\omega)=T(\omega)\), \(Y_n(\omega) = M_{T(\omega)}(\omega)\), 于是 \[\begin{aligned} \lim_{n\to\infty} Y_n(\omega) = M_{T(\omega)}(\omega), \ \forall \omega \in A, \end{aligned}\]\(Y_n \to Y_{\infty} = M_T\), a.s. 这个结论并不需要鞅收敛定理条件成立。

如果\(\{M_n \}\)一致可积, 则停时定理条件成立, 有\(E(M_T) = E(M_0)\), 但\(Y_{\infty} = M_T\), \(Y_0 = M_0\),所以也有\(E(Y_{\infty}) = E(Y_0)\)

○○○○○○

例6.22 \(X_1, X_2, \dots\)是独立同分布的随机变量序列, \(P\{ X_i = \frac{3}{2} \} = P\{X_i = \frac{1}{2} \} = \frac{1}{2}\). 令\(M_0=1\), 对\(n>0\), 令\(M_n = X_1 X_2 \cdots X_n\). 则\(M_n\)有极限但非一致可积。

证明: 注意 \[\begin{aligned} E(X_n) =& \frac{3}{2}\frac{1}{2} + \frac{1}{2}\frac{1}{2} = 1, \\ E[M_n] =& E[X_1] \cdots E[X_n] = 1, \\ E[M_{n+1} | {\mathscr F}_n] =& E[X_1 \cdots X_{n+1} | {\mathscr F}_n] \\ =& X_1 \cdots X_n \cdot E[X_{n+1} | {\mathscr F}_n] \\ =& X_1 \cdots X_n \cdot E[X_{n+1}] \\ =& X_1 \cdots X_n \cdot 1 = M_n , \end{aligned}\] 所以\(\{M_n\}\)是关于\(X_1,X_2,\cdots\)的鞅. 由于\(E[|M_n|] = E[M_n]=1\), 鞅收敛定理的条件成立, 从而 \[ M_n \to M_{\infty} . \]

那么\(\{ M_n \}\)一致可积吗? 答案是否定的. 事实上,\(M_{\infty} = 0\)(这样\(E[M_{\infty}] \neq E[M_0]\)). 为此考虑 \[ \frac{1}{n} \ln M_n = \frac{1}{n} \sum^n_{j=1} \ln X_j, \] 右边是独立同分布随机变量的均值,并且 \[ E[\ln X_i] = \frac{1}{2} \ln\frac{1}{2} + \frac{1}{2} \ln\frac{3}{2} = \frac{1}{2} \ln\frac{3}{4} < 0, \] 根据大数定律\(\frac{1}{n} \ln M_n \to \frac{1}{2} \ln\frac{3}{4} < 0\),a.s., 因此\(\ln M_n \to -\infty\), a.s., 从而\(M_n = e^{\ln M_n} \to 0\), a.s., 故\(\{M_n\}\)不是一致可积的.

○○○○○○

6.5 连续鞅

6.5.1 定义

前面我们讨论了鞅的停时定理, 也称为可选抽样定理(optional sampling theorem)和鞅收敛定理. 请注意这里的鞅都是以离散时间\(n\)为参数的. 事实上, 对于连续参数鞅(仍称为鞅)也有类似定理, 出于应用的考虑, 我们不加证明地给出这些定理. 首先给出连续鞅的定义.

定义6.8 \((\Omega, {\mathscr F},P)\)是一个完备的概率空间, \(\{ \mathscr F(t), t \geq 0 \}\)为一个\(\sigma\)代数流. 随机过程\(\{X(t), t \geq 0\}\)(简记为\(\{ X(t) \}\))称为\(\{\mathscr F(t)\}\)适应的, 如果对每个\(t \geq 0\), \(X(t)\)\({\mathscr F}(t)\)可测. 一个适应过程\(\{ X(t) \}\)称为关于\(\{\mathscr F(t)\}\)的鞅, 如果每个\(X(t)\)一阶矩有限(或称可积), 且对一切\(0 \leq s < t\), 有 \[\begin{equation} E[X(t) | {\mathscr F}(s)] = X(s),\ \text{a.s.} \tag{6.15} \end{equation}\]

特别地,当\({\mathscr F}(t) = \sigma(X(u), 0 \leq u \leq t)\)时, 式(6.15)变为 \[ E[X(t) | X(u), 0 \leq u \leq s] = X(s),\ \text{a.s.} \] 此时,简称\(\{X(t)\}\)为鞅.

可类似定义下鞅和上鞅。

注: \(X(t)\)关于\(\mathscr F(t)\)可测, 定义为\(\forall B\in {\mathscr B}\), 有\(X^{-1}(t)(B) \in {\mathscr F}(t)\). \(\sigma(X(u), 0 \leq u \leq t)\)表示由\(\{X(u), 0 \leq u \leq t\}\)生成的\(\sigma\)代数, 即包含一切形如 \(\{X(u) \leq x \}\)(\(0 \leq u \leq t\), \(x \in \mathbb{R})\)的事件的最小\(\sigma\)代数。 这个定义可以推广到\(X(t)\)取值于\(\mathbb R^d\)的情形。

若随机过程\(\{X(t), t \geq 0 \}\)是鞅, 则对任意\(t>0\), 有 \[\begin{equation} E[X(t)] = E[E[X(t) | X(0)]] = E[X(0)] . \tag{6.16} \end{equation}\]

与离散鞅类似,有下述简单例子.

例6.23 \(\{Y_t, t \geq 0\}\)是零初值具有平稳独立增量的随机过程. 令 \[ X_t =X_0 e^{Y_t}, \] 其中\(X_0\)为一常数. 若\(E[e^{Y_t}]=1\), 则\(\{X_t, t\geq 0\}\)是一个鞅.

证明: 事实上 \[ E[|X_t|] = |X_0| E[e^{Y_t}] =|X_0| < \infty, \] 再对\(0 \leq s < t\),有 \[\begin{aligned} E[X_t | X_r, 0 \leq r \leq s] =& E[X_s e^{Y_t - Y_s} | X_r, 0 \leq r \leq s] \\ =& X_s E[e^{Y_t-Y_s}] \\ =& X_s E[e^{Y_{t-s}}] = X_s,\ \text{a.s.} \end{aligned}\]

注:\(Y(t)\)的一个取法是取为带漂移的布朗运动 \[ Y(t) = -\frac{1}{2} t + B(t) . \]

○○○○○○

例6.24 \(\{N(t), t \geq 0\}\)是参数为\(\lambda\)的泊松过程, \(\mathscr F^{N}(t) = \sigma(\{N(s): 0 \leq s \leq t\})\)\(M(t) = N(t) - \lambda t\), 则\(\{ M(t), \mathscr F^{N}(t), t \geq 0 \}\)是鞅, 称\(\{M(t)\}\)为抵偿泊松过程(compensated Poisson process)。

证明: 由泊松过程的独立增量性, 对\(t \geq 0\), \(u > 0\)\[\begin{aligned} E(M(t+u) | \mathscr F(t)) =& E(N(t+u) - \lambda(t+u) | N(s), 0 \leq s \leq t) \\ =& E[N(t) + (N(t+u) - N(t)) | N(s), 0 \leq s \leq t] - \lambda(t+u) \\ =& N(t) + E(N(t+u) - N(t)) - \lambda(t+u) \\ =& N(t) + \lambda u - \lambda(t+u) \\ =& N(t) - \lambda t = M(t) . \end{aligned}\]

注:将\(N(t)\)分解为 \[ N(t) = M(t) + A(t), \] 其中\(M(t)\)是鞅, \(A(t) = \lambda t\)为增函数, 易见\(N(t)\)是下鞅, 对下鞅有更一般的Doob-Meyer下鞅分解定理。

○○○○○○

6.5.2 停时定理和极限定理

定义6.9 非负广义随机函数\(\tau\)称为\(\{\mathscr F(t) \}\)停时, 如果\(P(\tau < \infty ) = 1\), 并且对一切\(t \geq 0\)\(\{\tau \leq t \}\)\({\mathscr F}(t)\)可测的, 即 \[ \{\tau \leq t\} \in {\mathscr F}(t) . \] 特别地, 当\({\mathscr F}(t) = \sigma(X(u), 0 \leq u \leq t)\)时, \(\tau\)称为关于随机过程\(\{X(t), t \geq 0\}\)的停时. 若存在常数\(k > 0\)使得\(P\{ \tau \leq k\}=1\), 则称\(\tau\)为有界停时.

非负广义随机函数是指\(\tau: \Omega \longrightarrow [0,\infty]\)映射。

定义\(\sigma\)代数\(\mathscr F(\tau)\)\[ \mathscr F(\tau) = \{ A \in \mathscr F: A \cap \{\tau \leq t \} \in \mathscr F(t), \forall t \geq 0 \} . \]

如果过程\(\{X(t, \omega), \mathscr F(t), t \geq 0, \omega \in \Omega \}\)为适应过程且\(X\)(二元)可测, \(\tau\)\(\{\mathscr F(t)\}\)停时, 则\(X(\tau) = X(\tau(\omega), \omega)\)是随机变量, 关于\(\mathscr F(\tau)\)可测。 如果随机过程\(X\)每条轨道右连续, 可测条件满足。 泊松过程、布朗运动是轨道右连续的。

下面是鞅论的一个重要结论——停时定理, 即在适当条件下, 将式(6.16)中的\(t\)置换成停时\(\tau\)时, 等式仍然成立.

定理6.9 \(\tau\)是有界停时,则有 \[ E[X_{\tau}] = E[X_0] . \]

鞅论的另一个重要的结果是收敛定理.

定理6.10 \(\{X_t, t \geq 0 \}\)是一个鞅并且\(X_t \geq 0\), \(\forall t\geq 0\) (简称为非负鞅), 则存在几乎处处收敛的有限极限,即有 \[ \lim_{t \to \infty} X_t =X_{\infty} < \infty, \ \text{a.s.} \]

6.6 补充材料

6.6.1 可测性

因为随机过程\(\{ X(t,\omega): t \in [0, \infty), \omega \in \Omega \}\)是关于时间\(t\)和样本点\(\omega\)的二元函数, 给定\(\omega\)后, 作为\(t\)的函数,\(X(\cdot, \omega)\)代表一条样本路径(轨道、实现), 所以两个随机过程在某种意义上相同,有如下三种不同的定义:

  1. 如果\(\forall t\), \(P(X(t) = Y(t))=1\), 称\(\{ Y(t) \}\)\(\{X(t)\}\)的修改;
  2. \(\{ X(t) \}\)\(\{Y(t)\}\)具有相同的有限维分布;
  3. \(P(X(t)=Y(t), t \in [0, \infty))=1\), 称\(\{ Y(t) \}\)\(\{X(t)\}\)不可区分。

第3条是最强的。 第1条成立时, 仅保证了在每个时刻相等, 但是样本路径可以可能没有任何一对路径完全重合。

注意第1条和第3条仅在\(\{ X(t) \}\)\(\{Y(t)\}\)属于同一概率空间时有意义, 而第2条不要求\(\{ X(t) \}\)\(\{Y(t)\}\)属于同一概率空间, 仅要求其样本空间相同。

如果\(\{ Y(t) \}\)\(\{X(t)\}\)的修改且两个过程都是a.s.轨道右连续的, 则两个过程也不可区分。

随机过程\(\{X(t), t \in [0, \infty)\}\)的定义是对每个\(t \in [0, \infty)\), \(X(t)\)\((\Omega, \mathscr F)\)的随机变量, 所以不要求\(X(t,\omega)\)作为\(t\)\(\omega\)的二元函数二元可测; 但某些问题中会要求二元可测, 如随机积分的被积函数。

定义6.10 (可测过程) \(d\)维的随机过程\(X\)可测, 如果\(\forall B \in \mathscr B(\mathbb R^d)\), \(\{(t, \omega): X(t,\omega) \in B \}\)属于\(\sigma\)\(\mathscr B([0, \infty)) \times \mathscr F\), 即函数\(X(t,\omega)\)是从\(([0,\infty) \times \Omega, \mathscr B([0, \infty)) \times \mathscr F)\)\((\mathbb R^d, \mathscr B(\mathbb R^d))\)的可测变换。

当过程可测时, 给定\(\omega\)后的路径\(X(t,\omega)\)作为\(t\)的函数是Borel可测函数, 对给定\(t\)\(X(t,\omega)\)是随机变量。 如果对某个区间\(I\)\(\int_I E|X(t)| \,dt < \infty\), 由Fubini定理则有 \[\begin{aligned} \int_I |X(t,\omega)| \,dt <& \infty, \text{ a.s.}, \\ E \int_I X(t,\omega) \,dt =& \int_I E[X(t)] \,dt . \end{aligned}\]

6.6.2 \(\sigma\)代数流

随机过程中的\(t\)一般代表时间, 指标集\(T\)最常见的情形为\(T=\{0,1,2,\dots\}\)\(T = [0, \infty)\)。 随着时间的推进, 积累的信息也在增加, 可以将时间区分为过去、现在和将来。 用“\(\sigma\)代数流”表示积累的信息。

定义6.11 \(T=\{0,1,2,\dots\}\)\(T = [0, \infty)\), 设有一组\(\sigma\)代数\(\mathscr F(t)\), 使得\(\mathscr F(s) \subset \mathscr F(t) \subset \mathscr F\)对任意\(0 \leq s \leq t\)成立, 称\(\{\mathscr F(t), t \geq 0 \}\)为一个\(\sigma\)代数流(filtration)。 如果随机过程\(\{X(t), t \in T \}\)满足\(X(t)\)关于\(\mathscr F(t)\)可测对任意\(t \in T\)成立, 则称\(\{X(t), t \in T \}\)是关于\(\{\mathscr F(t), t \geq 0 \}\)适应的。

为了使得\(\{X(t), \mathscr F(t), t \geq 0 \}\)是适应过程, 最小的\(\mathscr F(t)\)的取法为 \[ \mathscr F^{X}(t) = \sigma(\{X(s): 0 \leq s \leq t \}) . \]\(\mathscr F^{X}(t)\)视作截止到\(t\)时刻为止, 随机过程\(X\)所包含的信息。 对\(A \in \mathscr F^{X}(t)\), 掌握\(X\)\([0,t]\)的路径信息可以明确判断\(A\)是否发生。

\(T = [0, \infty)\), 定义 \[\begin{aligned} \mathscr F(t-) = \sigma(\bigcup_{0 \leq s < t} \mathscr F(s)) , \\ \mathscr F(t+) = \bigcap_{\epsilon>0} \mathscr F(t+\epsilon) . \end{aligned}\] \(\mathscr F(t-)\)是时间落在\(t\)前面的事件的\(\sigma\)代数。 \(\mathscr F(t+)\)\(t\)截止到刚过\(t\)时刻的事件的\(\sigma\)代数。 如果\(\mathscr F(t+) = \mathscr F(t)\)\(\forall t \geq 0\), 称\(\{ \mathscr F(t), t \geq 0 \}\)是右连续的; 如果\(\mathscr F(t-) = \mathscr F(t)\)\(\forall t \geq 0\), 称\(\{ \mathscr F(t), t \geq 0 \}\)是左连续的。

\(\{ (X(t), \mathscr F^X(t), t \geq 0\}\)

  • \(\{\mathscr F^X(t)\}\)左连续,意味着观测到\(X(s), 0 \leq s < t\)可以获得\(X(t)\)的信息;
  • \(\{\mathscr F^X(t)\}\)右连续,意味着观测到\(X(s), 0 \leq s \leq t\)后, 再向前继续观测无穷小时间的信息并没有额外的信息增加。
  • 如果\(\{X(t), t \geq 0 \}\)轨道左连续,则\(\{\mathscr F^X(t)\}\)左连续。
  • \(\{\mathscr F^X(t+)\}\)是右连续的。
  • 即使\(\{X(t), t \geq 0 \}\)轨道连续, \(\{\mathscr F^X(t)\}\)也不一定右连续, \(\{\mathscr F^X(t+)\}\)也不一定左连续。

比可测和适应更强的条件是循序可测(progressively measurable)。

定义6.12 \(\{X(t), t \geq 0 \}\)\(d\)维随机过程, \(\{ \mathscr F(t), t \geq 0 \}\)\(\sigma\)代数流, 如果对任意\(t \geq 0\), \(X(t, \omega)\)\(([0, t] \times \Omega, \mathscr B([0,t]) \times \mathscr F(t))\)\((\mathbb R^d, \mathscr B(\mathbb R^d))\)的可测映射, 称\(X\)关于\(\mathscr F(t)\)循序可测

循序可测必为可测, 且为适应的。

反过来,如果\(\{ X(t), \mathscr F(t), t \geq 0 \}\)是可测、适应的, 则必存在\(X\)的修改\(Y\),使得\(\{ Y(t), \mathscr F(t), t \geq 0 \}\)是循序可测的。

命题6.10 \(\{ X(t), \mathscr F(t), t \geq 0 \}\)是适应过程, \(X\)的每条路径都是右连续(或者每条路径都是左连续), 则\(\{ X(t), \mathscr F(t), t \geq 0 \}\)是循序可测过程。

证明: 参见(Karatzas and Shreve 1998) P.5 命题1.12。

以右连续情形为例证明。 将路径用右连续阶梯函数逼近, 对给定\(t\),任意正整数\(n\), 任意\(s \in (0, t]\), 设有整数\(k\)使得 \[ s \in \left( \frac{k}{2^n}t, \frac{k+1}{2^n}t \right], \]\[ X_n(s) = X(\frac{k+1}{2^n}t) . \] 这是分段阶梯函数,右连续, 是\(([0,t] \times \Omega, \mathscr B([0,t]) \times \mathscr F(t)\)\(\mathbb R^d\)的可测映射。 根据右连续性, \[ \lim_{n \to \infty} X_n(s) = X(s), \forall (s, \omega) \in [0,t] \times \Omega, \] 因为可测函数的序列极限是可测函数, 所以\(X(s, \omega)\)\(([0,t] \times \Omega, \mathscr B([0,t]) \times \mathscr F(t)\)\(\mathbb R^d\)的可测映射。 即\(\{ X(t), \mathscr F(t), t \geq 0 \}\)是循序适应过程。

○○○○○○

这样, 后面讲的布朗运动是循序适应过程。

如果\(\{ X(t), t \geq 0 \}\)的每条轨道右连续(或者每条轨道左连续), 则\(X\)必为可测过程。 注意这里没有要求适应。

定义6.13 \(\sigma\)代数流\(\{\mathscr F(t), t \geq 0\}\)满足“通常条件”(usual conditions), 如果其右连续, 且\(\mathscr F(0)\)包含\(\mathscr F\)中所有零概率事件的子集。

如果概率空间\((\Omega, \mathscr F, P)\)完备, 则\(\mathscr F(0)\)包含\(\mathscr F\)中所有零概率事件的子集这个条件是满足的。

6.6.3 补充证明

6.6.3.1 命题6.5证明

由于任意状态之间互通, 所以对任意\(i, j\), 存在\(N_{ij} \geq 1\)使得\(p_{ij}^{(N_{ij})} > 0\), 令 \[\begin{aligned} N =& \max \{ N_{ij}: i, j \in S \}, \\ \delta =& \min \{ p_{ij}^{(N_{ij})}: i, j \in S \}, \end{aligned}\]\(N < \infty\), \(\delta > 0\), 于是对任意\(i, j \in S\)\[ P(X_t \neq j , 1 \leq t \leq N | X_0 = i) \leq 1 - \delta . \]

来证明对于任意正整数\(m\), 都有 \[ P(X_t \neq j, 1 \leq t \leq mN | X_0 = i) \leq (1 - \delta)^m, \ \forall i, j \in S . \tag{*} \]

用归纳法,设上式对\(1, 2, \dots, m-1\)成立。 则 \[\begin{aligned} & P(X_t \neq j, 1 \leq t \leq mN | X_0 = i) \\ =& \sum_{s \neq j} P(X_t \neq j, 1 \leq t < N, X_N = s; X_t \neq j, N < t \leq mN | X_0 = i) \\ =& \sum_{s \neq j} P(X_t \neq j, 1 \leq t < N, X_N = s | X_0 = i) P(X_t \neq j, N < t \leq mN | X_N = s) \\ \leq& (1 - \delta)^{m-1} \sum_{s \neq j} P(X_t \neq j, 1 \leq t < N, X_N = s | X_0 = i) \\ =& (1 - \delta)^{m-1} P(X_t \neq j, 1 \leq t \leq N | X_0 = i) \\ \leq& (1 - \delta)^m . \end{aligned}\] (*)式得证。

\(\rho = (1 - \delta)^{\frac{1}{N}}\), 则\(0 < \rho < 1\)\[\begin{aligned} P(X_t \neq j, 1 \leq t \leq n | X_0 = i) \leq \rho^n, \ n = mN, \ \forall i, j \in S . \end{aligned}\]

\(C = \rho^{-N}\), 对\(1 \leq n < N\), 有 \[\begin{aligned} & P(X_t \neq j, 1 \leq t \leq n | X_0 = i) \\ \leq& 1 \leq \rho^{n - N} = C \rho^n . \end{aligned}\]

\(n = mN + k\), 其中\(m \geq 1\), \(0 \leq k < N\), 有 \[\begin{aligned} & P(X_t \neq j, 1 \leq t \leq n | X_0 = i) \\ \leq& P(X_t \neq j, 1 \leq t \leq mN | X_0 = i) \\ \leq& \rho^{mN} = \rho^{n - k} = \rho^{-k} \rho^n \\ \leq& \rho^{-N} \rho^n = C \rho^n, \ \forall n \geq N, \ \forall i, j \in S . \end{aligned}\]

这就证明了结论对\(n \geq 1\)成立。

6.6.3.2 推论6.5证明

\(j \in A\), 存在\(C_j\)\(\rho_j\)使得 \[ P(X_t \neq j, 1 \leq t \leq n | X_0 = i) \leq C_j \rho_j^n . \]

\(C' = \max\{C_j, j \in A\}\), \(\rho' = \max\{\rho_j, j \in A \} = \rho_m\)(\(m \in A\)), 则 \[\begin{aligned} & P(X_t \notin A, 1 \leq t \leq n | X_0 = i) \\ =& P(X_t \neq j, 1 \leq t \leq n, j \in A | X_0 = i) \\ \leq& P(X_t \neq m, 1 \leq t \leq n | X_0 = i) \\ \leq& C_m \rho_m^n \leq C' \rho'^n , \ n \geq 0 . \end{aligned}\]

○○○○○○

6.6.3.3 命题6.6证明

因为从常返态不可能到达瞬态, 所以当\(i\)为常返态时不等式左边为0, 仅需要考虑\(i \in B\)的情形。

因为\(i\)是瞬态, 所以必存在\(m_i>0\)\(j_i \in A\)使得\(p_{ij_i}^{(m_i)} > 0\)。 用反证法证明这一命题, 如果不然,则对任意\(n>0\)\(j \in A\)都有\(p_{ij}^{(n)} = 0\), 则由\(\sum_{j \in S} p_{ij}^{(n)} = 1\)\(\sum_{j \in B} p_{ij}^{(n)} = 1\), 但对\(j \in B\)\(p_{ij}^{(n)} \to 0\), \(n \to \infty\)\(B \subset S\)是有限集所以\(\sum_{j \in B} p_{ij}^{(n)} \to 0\), 矛盾。

于是 \[\begin{aligned} & P(X_t \in B, 1 \leq t \leq m_i | X_0=i) \\ \leq& P(X_{m_i} \neq j_i | X_0 = i) \\ =& 1 - P(X_{m_i} = j_i | X_0 = i) \\ =& 1 - p_{ij_i}^{(m_i)} < 1 . \end{aligned}\]

\(m = \max \{ m_i: i \in B \}\)\(\delta = \min\{ p_{ij_i}^{(m_i)}: i \in B \} > 0\), 则对所有\(i \in B\)同时成立 \[\begin{aligned} & P(X_t \in B, 1 \leq t \leq m | X_0=i) \\ \leq& P(X_t \in B, 1 \leq t \leq m_i | X_0=i) \\ =& 1 - p_{ij_i}^{(m_i)} \leq 1 - \delta < 1 . \end{aligned}\]

来证明对\(s=1,2,\dots\)\[ P(X_t \in B, 1 \leq t \leq s m | X_0=i) \leq (1 - \delta)^s . \tag{*} \]

用数学归纳法。当\(s=1\)(*)式成立。 设(*)式对\(s\)成立, 来证明对\(s+1\)成立。 用C-K方程 \[\begin{aligned} & P(X_t \in B, 1 \leq t \leq (s+1) m | X_0=i) \\ \leq& \sum_{j \in B} P(X_t \in B, s m + 1 \leq t \leq (s+1) m; X_m = j, X_t \in B, 1 \leq t < m | X_0=i) \\ =& \sum_{j \in B} P(X_t \in B, s m + 1 \leq t \leq (s+1) m | X_m = j) P(X_m = j, X_t \in B, 1 \leq t < m | X_0=i) \\ \leq& (1-\delta)^s \sum_{j \in B} P(X_m = j, X_t \in B, 1 \leq t < m | X_0=i) \\ =& (1-\delta)^s P(X_t \in B, 1 \leq t \leq m | X_0=i) \leq (1 - \delta)^{s+1} . \end{aligned}\]

\(\rho = (1-\delta)^{1/m}\),则\(0 < \rho < 1\)。 令\(C = \rho^{-m}\), 对\(n = s m\)\[ P(X_t \in B, 1 \leq t \leq n | X_0=i) \leq C \rho^s , \]

\(1 \leq n < m\)\[ P(X_t \in B, 1 \leq t \leq n | X_0=i) \leq 1 \leq \rho^{n - m} = C \rho^n . \]

\(n = s m + j\), \(s \geq 1\)\(0 \leq j < m\),有 \[\begin{aligned} & P(X_t \in B, 1 \leq t \leq n | X_0=i) \\ \leq& P(X_t \in B, 1 \leq t \leq s m | X_0=i) \\ \leq& \rho^{s m} \leq \rho^{sm + j} \rho^{-m} = C \rho^n, \end{aligned}\] 证毕。

○○○○○○

参考文献

Karatzas, I., and S. E. Shreve. 1998. Brownian Motion and Stochastic Calculus. 2nd ed. Springer, New York.