3 泊松过程
3.1 泊松过程定义
随机过程\(\{N(t), t \geq 0 \}\)称为计数过程或点过程, 如果\(N(t)\)表示从时刻0到t某一特定事件\(A\)发生的次数.
定义3.1 (计数过程) 随机过程\(\{N(t), t \geq 0 \}\)称为计数过程,若其满足:
(1)非负性:\(N(0)=0\),\(N(t)\)取非负整数值\((\forall t \geq 0)\);
(2)单调性:\(0 \leq s < t\)时,\(N(s) \leq N(t)\);
(3)右连左极性:\(N(t)\)的轨道右连续,且左极限存在。
定义3.2 计数过程\(\{N(t), t \geq 0\}\)称为参数为\(\lambda\)(\(\lambda > 0\))的泊松过程, 如果
(1)\(N(0)=0\);
(2)过程有独立增量;
(3)对任意的\(s, t \geq 0\), \[ P(N(t+s) - N(s) = n) =e^{-\lambda t} \frac{(\lambda t)^n}{n!}, \ n=0,1,2,\dots \]
注1: 泊松过程是独立平稳增量的计数过程.
注2:由于\(E[N(t)]=\lambda t\), 于是可认为\(\lambda\)是单位时间内发生的事件的平均次数, 故一般称\(\lambda\)是泊松过程的强度或速率.
注3:泊松过程也是连续时间马氏链。见5.5。
例3.1 (泊松过程在排队论中的应用) 在随机服务系统中排队现象的研究中, 经常用到泊松过程模型. 例如, 到达电话总机的呼叫数目,到达某服务设施的顾客数, 都可以用泊松过程来描述。 以某火车站售票处为例, 设从早上8:00开始, 此售票处连续售票, 乘客依10人/小时的平均速率到达, 则从9:00到10:00这1小时内最多有5名乘客来此购票的概率是多少? 从10:00-11:00没有人来买票的概率是多少?
解: 我们用一个泊松过程来描述. 设8:00为0时刻, 则9:00为1时刻, 参数\(\lambda=10\). 由泊松过程的平稳增量性知 \[\begin{aligned} P(N(2)-N(1) \leq 5) =& \sum_{n=0}^5 e^{-10 \cdot 1}\frac{(10\cdot 1)^n}{n!}, \\ P(N(3)-N(2)=0) =& e^{-10} \cdot \frac{(10)^0}{0!} =e^{-10}. \end{aligned}\]
例3.2 (事故发生次数与保险公司接到的索赔数) 若以\(N(t)\)表示某场所在\((0,t]\)时间内发生不幸事故的数目, 则泊松过程就是\(\{N(t), t \geq 0\}\)的一种很好近似. 例如,保险公司接到赔偿请求的次数(设一次事故就导致一次索赔)都是可以应用泊松过程的模型。 我们考虑一种最简单情况,设保险公司每次的赔付都是1, 每月平均接到索赔要求4次, 则一年中它要付出的金额平均为多少?
解: 设一年开始为0时刻,1月末为时刻1,2月末为时刻2,……, 则年末为时刻12。 \[ P(N(12)-N(0)=n) = \frac{(4\times 12)^n}{n!} e^{-4\times 12}. \] 均值 \[ E[N(12)-N(0)] = 4 \times 12 = 48. \]
为什么实际中有这么多的现象可以用泊松过程来反映呢? 其根据是小概率事件原理. 我们在概率论的学习中已经知道, Bernoulli试验中, 每次试验成功的概率很小而试验的次数很多时, 二项分布会逼近Poisson分布. 这一想法很自然地推广到随机过程情况. 比如上面提到的事故发生的例子, 在很短的时间内发生事故的概率是很小的, 但假如考虑很多个这样很短的时间的连接, 事故的发生将会有一个大致稳定的速率, 这很类似于Bernoulli试验以及二项分布逼近Poisson分布时的假定.
泊松过程的另一等价定义:
定义3.3 设\(\{N(t), t \geq 0\}\)是一个计数过程,若满足 \[\begin{aligned} (1)'\ & N(0)=0; \\ (2)'\ & \text{过程有平稳独立增量}; \\ (3)'\ & \text{存在} \lambda > 0, \text{当} h\downarrow 0 \text{时} \\ & P(N(t+h)-N(t)=1)=\lambda h+{\small o}(h); \\ (4)'\ & \text{当} h\downarrow 0 \text{时} \\ & P(N(t+h)-N(t)\geq 2)={\small o}(h) . \end{aligned}\] 则称\(\{N(t), t \geq 0\}\)为泊松过程.
用二项分布与泊松分布的关系来解释这个等价定义。 把\([0,t]\)划分为\(n\)个等间隔的时间区间, 则由条件\((4)'\)可知,当\(n \to \infty\)时, 在每个小区间内事件发生两次或两次以上的概率可以近似为0(概率是\({\small o}(\frac{1}{n})\)的), 因此, 事件发生一次的概率\(p \approx \lambda \frac{t}{n}\)(显然\(p\)会很小), 事件不发生的概率为 \(1 - p \approx 1 - \lambda \frac{t}{n}\), 这恰好是一次Bernoulli试验. 其中事件发生一次即为试验成功, 不发生即为失败, 再由条件\((2)'\)给出的平稳独立增量性, \(N(t)\)就相当于\(n\)次独立Bernoulli试验中试验成功的总次数, 由Poisson分布的二项分布逼近可知\(N(t)\)将服从参数为\(\lambda t\)的Poisson分布.
泊松过程两定义等价的严格的数学证明:
定理3.1 满足上述条件\((1)'-(4)'\)的计数过程\(\{N(t), t \geq 0\}\)是泊松过程, 反过来泊松过程一定满足这4个条件.
证明: 先证明泊松过程满足条件\((1)'\sim(4)'\), 只需验证条件\((3)',(4)'\)成立. 由定义中第三个条件可得 \[\begin{aligned} P(N(t+h)-N(t)=1) = e^{-\lambda h} \frac{\lambda h}{1!} , \end{aligned}\] 而 \[ \lim_{h \to 0} \frac{e^{-\lambda h} \lambda h - \lambda h}{h} = \lim_{h \to 0} \lambda (e^{-\lambda h} - 1) = 0, \] 按\(o(\cdot)\)定义即有\(e^{-\lambda h} \lambda h = \lambda h + o(h)\), 从而\((3)'\)成立。 对于\((4)'\), \[\begin{aligned} & \lim_{h \to 0} \frac{P(N(t+h)-N(t) \geq 2)}{h} \\ =& \lim_{h \to 0} \frac{1 - P[N(t+h)-N(t) = 0] - P[N(t+h)-N(t) = 1]}{h} \\ =& \lim_{h \to 0} \frac{1 - e^{-\lambda h} - e^{-\lambda h} \lambda h }{h} \\ =& \lim_{h \to 0} \frac{1 - e^{-\lambda h}}{h} - \lim_{h \to 0} e^{-\lambda h} \lambda \\ =& \lim_{h \to 0} \frac{e^{-\lambda h} \lambda}{1} - \lambda = 0, \end{aligned}\] 即\((4)'\)成立。
反过来,设计数过程\(\{N(t), t \geq 0\}\)满足条件\((1)'\sim(4)'\), 要证明它是泊松过程. 可以看到, 其实只需验证\(N(t)\)服从参数为\(\lambda t\)的泊松分布即可. 记 \[ P_n(t) = P(N(t)=n), \ n=0,1,2\dots, \] 则对\(h \to 0\),由\((3)', (4)'\)可知 \[ P_0(h) = 1 - \lambda h + o(h) . \] 于是对\(t+h\)有 \[\begin{aligned} P_0(t+h) =& P(N(t)=0, \, N(t+h) - N(t) = 0) \\ =& P(N(t)=0) \, P(N(t+h) - N(t) = 0) \\ =& P_0(t) P_0(h) = P_0(t)[1 - \lambda h + o(h)] , \\ P_0'(t) =& \lim_{h \to 0} \frac{P_0(t+h) - P_0(t)}{h} = -\lambda P_0(t), \\ \frac{d}{dt} \log P_0(t) =& -\lambda , \end{aligned}\] 配合\(P_0(0) = 1\)解得\(P_0(t) = e^{-\lambda t}\),\(t \geq 0\)。 注意\(P_0'(t)\)是按(右)导数定义计算的, 所以\(P_0(t)\)可微。
归纳地, 设 \[ P_k(t) = e^{-\lambda t} \frac{(\lambda t)^k}{k!} \] 对\(k=0,1,\dots, n-1\)成立, 则 \[\begin{aligned} P_n(t+h) =& P(N(t)=n, \, N(t+h) - N(t) = 0) \\ & + P(N(t)=n-1, \, N(t+h) - N(t) = 1) \\ & + P(N(t) \leq n-2, \, N(t+h) - N(t) \geq 2) \\ =& P_n(t) P_0(h) + P_{n-1}(t) P_{1}(h) \\ & + P(N(t) \leq n-2) P(N(t+h) - N(t) \geq 2) \\ =& P_n(t) [1 - \lambda h + o(h)] + P_{n-1}(t) [ \lambda h + o(h) ] + o(h), \\ P_n'(t) =& \frac{P_n(t+h) - P_n(t)}{h} \\ =& P_n(t) (-\lambda) + P_{n-1}(t) \lambda, \end{aligned}\] 以归纳法假定的\(P_{n-1}(t)\)代入,变换得 \[\begin{aligned} P_n'(t) e^{\lambda t} + P_n(t) \lambda e^{\lambda t} =& \lambda \frac{(\lambda t)^{n-1}}{(n-1)!}, \\ \frac{d}{dt}[P_n(t) e^{\lambda t}] =& \lambda \frac{(\lambda t)^{n-1}}{(n-1)!}, \\ P_n(t) e^{\lambda t} =& c_1 + \frac{(\lambda t)^{n}}{n!}, \\ P_n(t) =& c_1 e^{-\lambda t} + e^{-\lambda t} \frac{(\lambda t)^{n}}{n!}, \end{aligned}\] 利用\(P_n(0) = P(N(0)=n) = 0\)得\(c_1=0\),从而 \[\begin{aligned} P_n(t) = e^{-\lambda t} \frac{(\lambda t)^{n}}{(n)!} . \end{aligned}\] 得证。
定理3.2 事件\(A\)的发生形成强度为\(\lambda\)的泊松过程\(\{N(t), t \geq 0\}\). 如果每次事件发生时以概率\(p\)能够被记录下来, 并以\(M(t)\)表示到\(t\)时刻被记录下来的事件总数, 则\(\{ M(t), t \geq 0\}\)是一个强度为\(\lambda p\)的泊松过程.
事实上,
由于每次事件发生时,
对它的记录和不记录都与其他的事件能否被记录独立,
而且事件到来服从泊松过程.
所以\(M(t)\)也是具有平稳独立增量的
(这样证明平稳独立增量不严格,
严格证明可借助条件期望,
参见(何书元 2008) P.49 定理4.3或3.4.3),
故只需验证\(M(t)\)服从均值为\(\lambda p t\)的泊松分布.
即证明对\(t > 0\), 有
\[
P(M(t) = m)
= \frac{(\lambda p t)^m}{m!} e^{-\lambda pt} .
\]
由于
\[\begin{aligned}
& P(M(t) = m) \\
=& \sum_{n=0}^{\infty} P(M(t)=m | N(t)=m+n) \cdot P(N(t)=m+n) \\
=& \sum_{n=0}^{\infty} C_{m+n}^m p^m (1-p)^n \cdot
\frac{(\lambda t)^{m+n}}{(m+n)!} e^{-\lambda t} \\
=& e^{-\lambda t} \sum_{n=0}^{\infty} \frac{(\lambda p t)^m (\lambda (1-p) t)^n}{m!n!} \\
=& e^{-\lambda t} \frac{(\lambda pt)^m}{m!}
\sum_{n=0}^{\infty} \frac{(\lambda (1-p)t)^n}{n!} \\
=&e^{-\lambda t}\frac{(\lambda pt)^m}{m!}e^{\lambda
(1-p)t}=e^{-\lambda pt}\frac{(\lambda pt)^m}{m!}.
\end{aligned}\]
例3.3 若每条蚕的产卵数服从泊松分布, 强度为\(\lambda\), 而每个卵变为成虫的概率为\(p\), 且各个卵是否变为成虫彼此间没有关系, 求每条蚕养活\(k\)只小蚕的概率.
解: 由定理3.2的证明方法可知小蚕数服从强度为\(\lambda p t\)的泊松分布, 故所求概率为 \[ \frac{(\lambda pt)^k}{k!}e^{-\lambda pt} . \]
例3.4 观察资料表明, 天空中星体数服从泊松分布, 其参数为\(\lambda V\), 这里\(V\)是被观察区域的体积. 若每个星球有生命存在的概率为\(p\), 则在体积为\(V\)的宇宙空间中有生命存在的星球数服从参数为\(\lambda pV\)的泊松分布.
3.2 与泊松过程相联系的若干分布
首先给出泊松过程的有关记号, 泊松过程\(\{N(t),t \geq 0\}\)的一条样本路径一般是跳跃高度为1的阶梯函数. \(T_n, n=1,2,3\dots\)表示第\(n\)次事件发生的时刻, 规定\(T_0=0\). \(X_n\), \(n=1,2,\dots\)表示第\(n\)次与第\(n-1\)次事件发生的时间间隔.
\(\{N(t), t \geq 0 \}\)是连续时间、状态空间可数的随机过程; \(\{T_n, n=0,1,2,\dots \}\)是离散时间、状态空间连续的随机过程。 这两者是互相唯一决定的: \[\begin{aligned} N(t) \geq n &\iff T_n \leq t; \\ T_n &= \inf \{t: N(t) \geq n \}; \\ N(t) &= \sup \{n\geq 1: T_n \leq t \} . \end{aligned}\]
两者分布之间的关系可用: \[\begin{aligned} P(N(t) \geq n) =& P(T_n \leq t); \\ P(N(t) = n) =& P(T_n \leq t < T_{n+1}) . \end{aligned}\]
3.2.1 \(X_n\)和\(T_n\)的分布
定理3.3 \(X_n,n=1,2,\dots\)服从参数为\(\lambda\)的指数分布, 且相互独立.
证明: 首先考虑\(X_1\)的分布, 注意到事件\(\{ X_1 > t \}\)等价于事件\(\{N(t)=0\}\), 即\((0,t]\)内没有事件发生. 因此 \[ P(X_1 > t) = P(N(t) = 0) = e^{-\lambda t}, \ t > 0, \] 说明\(X_1\)服从指数分布Exp(\(\lambda\))。
再来看\(X_2\)。 \[\begin{aligned} P(X_2>t|X_1=s) =& P(N(s+t)-N(s)=0 | X_1=s) \\ =& P(N(s+t)-N(s)=0) \quad \text{(独立增量性)} \\ =& e^{-\lambda t}. \end{aligned}\] 所以\(X_2\)与\(X_1\)独立, 且都服从参数为\(\lambda\)的指数分布. 重复同样的推导,可得定理结论.
注1:定理3.3的结果应该是预料之中的, 由于泊松过程有平稳独立增量, 过程在任何时刻都“重新开始”, 换言之,这恰好就是“无记忆”的体现, 与指数分布的“无记忆性”是对应的. 关于指数分布和泊松过程的无记忆性, 参见3.4.1和3.4.4。
注2:这里的证明不够严格。 从泊松过程的独立增量性推出\(X_1\)与\(N(s+t)-N(s)\)独立需要证明。 更严格的证明见(林元烈 2002) P.39定理2.2.1, 或(钱敏平 et al. 2011)。 可以先用计算超矩形上概率的方法求\((T_1, T_2, \dots, T_n)\)的联合密度, 由此求\((X_1, \dots, X_n)\)的联合密度。
定理3.4 \(T_n\), \(n=1,2,3,\dots\)服从参数为\(n\)和\(\lambda\)的\(\Gamma\)分布.
证明: 由于\(T_n = \sum_{i=1}^n X_i\), 而由定理3.3知道, \(X_i\)是相互独立的且有同指数分布, 同时指数分布是\(\Gamma\)分布的一种特殊情形(\(n=1\))。 由\(\Gamma\)分布可加性, 易得\(T_n\)服从参数为\(n\)和\(\lambda\)的\(\Gamma\)分布, 这里给出另外的一种推导方法. 注意到 \[ N(t) \geq n \iff \ \ T_n\leq t , \] 即第\(n\)次事件发生在时刻\(t\)或之前相当于到时刻\(t\)已经发生的事件数目至少是\(n\). 因此 \[ P(T_n \leq t) = P(N(t) \geq n) = \sum_{j=n}^{\infty} e^{-\lambda t} \frac{(\lambda t)^j}{j!}. \] 对第上式两端求导可得\(T_n\)的密度函数 \[\begin{aligned} f(t) =& -\sum_{j=n}^{\infty} \lambda e^{-\lambda t} \frac{(\lambda t)^j}{j!} + \sum_{j=n}^{\infty} \lambda e^{-\lambda t} \frac{(\lambda t)^{j-1}}{(j-1)!} \\ =& \lambda e^{-\lambda t} \frac{(\lambda t)^{n-1}}{(n-1)!} = \frac{\lambda^n}{\Gamma (n)}t^{n-1}e^{-\lambda t}, \ t > 0 . \end{aligned}\]
利用\(X_i\)的性质,可以给出泊松过程又一定义方法:
定义3.4 计数过程\(\{N(t), t \geq 0\}\)是参数为\(\lambda\)的泊松过程, 如果每次事件发生的时间间隔\(X_1, X_2, \dots\)相互独立, 且服从同一参数为\(\lambda\)的指数分布.
定义的等价性证明见(林元烈 2002) P.39定理2.2.1。
定义3.4提供了对泊松过程进行计算机模拟的方便途径: 只需产生\(n\)个同指数分布的随机数, 将其作为\(X_i\), \(i=1,2,\dots\)即可得到泊松过程的一条样本路径.
例3.5 设从早上8:00开始有无穷多的人排队等候服务, 只有一名服务员, 且每个人接受服务的时间是独立的并服从均值为20分钟的指数分布, 则到中午12:00为止平均有多少人已经离去, 已有9个人接受服务的概率是多少?
解: 由所设条件可知, 离去的人数\(\{N(t)\}\)是强度为3的泊松过程(这里以小时为单位). 设8:00为零时刻,则 \[ P(N(4)-N(0) = n) = e^{-12} \frac{(12)^n}{n!} . \] 其均值为12,即到12:00为止,离去的人平均是12名. 而有9个人接受过服务的概率是 \[ P(N(4)=9) = e^{-12} \frac{(12)^9}{9!}. \]
例3.6 假定某天文台观测到的流星流是一个泊松过程, 根据以往资料统计为每小时平均观察到3颗流星. 试求:在上午8点到12点期间,该天文台没有观察到流星的概率.
解: 设早晨8时为0时刻, 以\(N(t)\)表示0时到\(t\)时观测到的流星数, 则\(\{N(t)\}\)是强度为3的泊松过程,则有 \[ N(4)-N(0) \sim \text{Pois}(3 \times 4) . \] 故在上午8点到12点期间,该天文台没有观察到流星的概率为 \[ P\{ N(4) - N(0) = 0 \} = e^{-12} . \]
3.2.2 事件发生时刻的条件分布
定理3.5 在已知\([0,t]\)内事件只发生一次的前提下, 事件发生的时刻在\([0,t]\)上是均匀分布.
证明: 对于\(s \leq t\), \[\begin{aligned} & P(T_1 \leq s| N(t)=1) = \frac{P(T_1\leq s,N(t)=1)}{P(N(t)=1)}\\ =& \frac{P(\text{A发生在} s \text{时刻之前},(s,t]\text{内A没有发生})}{P(N(t)=1)}\\ =& \frac{P(N(s)=1) \cdot P(N(t)-N(s)=0)}{P(N(t)=1)}\\ =& \frac{\lambda s e^{-\lambda s}\cdot e^{-\lambda (t-s)}}{\lambda te^{-\lambda t}} = \frac{s}{t} . \end{aligned}\]
这个定理的逆命题也成立。 设事件发生时间间隔\(X_n\)独立同分布, \(\{ N(t) \}\)是由\(\{X_n\}\)定义的计数过程, 设\(P(X_n=0)=0\), 则若上述定理的条件分布成立, \(\{ X(t) \}\)必为泊松过程。 见(林元烈 2002) P.49定理2.4.3。
定理3.6 在已知\(N(t)=n\)的条件下, 事件发生的\(n\)个时刻\(T_1\),\(T_2\), \(\ldots\), \(T_n\)的联合分布密度是 \[ f(t_1, t_2, \dots, t_n) = \frac{n!}{t^n}, \ 0 < t_1 < t_2 < \cdots < t_n. \] 即\(n\)个独立同均匀分布U(0, \(t\))的随机变量的次序统计量的联合分布。
证明: 设\(0<t_1<t_2<\cdots <t_n<t_{n+1}=t\). 取\(h_i\)充分小使得\(t_i + h_i < t_{i+1}\), \(i=1,2,\dots,n\), \[\begin{aligned} & P(t_i < T_i \leq t_i+h_i, i=1,2,\dots, n | N(t)=n) \\ =& \frac{P( N(t_i+h_i)-N(t_i)=1, N(t_{i+1})-N(t_i+h_i)=0, 1 \leq i \leq n, N(t_1)=0)}{P(N(t)=n)} \\ =& \frac{\lambda h_1 e^{-\lambda h_1} \cdots \lambda h_n e^{-\lambda h_n} e^{-\lambda (t-h_1-h_2-\cdots-h_n)}}{e^{-\lambda t} (\lambda t)^n/n!} \\ =& \frac{n!}{t^n} h_1 \cdots h_n. \end{aligned}\]
故由联合密度定义, 给定\(N(t)=n\)时,\((T_1,\dots,T_n)\)的\(n\)维条件分布密度函数 \[\begin{aligned} & f(t_1,\cdots,t_n) \\ =& \lim_{\stackrel{h_i \downarrow 0}{1 \leq i \leq n}} \frac{P(t_i < T_i \leq t_i+h_i, 1 \leq i \leq n | N(t)=n)}{h_1 h_2 \cdots h_n} \\ =& \frac{n!}{t^n},\quad 0 < t_1 < t_2 < \cdots < t_n. \end{aligned}\]
注:在已知\([0,t]\)内发生了\(n\)次事件的前提下, 各次事件发生的时刻\(T_1,T_2,\dots,T_n\)(不排序)可看做相互独立的随机变量, 且都服从\([0,t]\)上的均匀分布. 这也可以作为模拟泊松过程轨道的一种方法。
例3.7 乘客按照强度为\(\lambda\)的泊松过程来到某火车站, 火车在时刻\(t\)启程, 计算在\((0,t]\)内到达的乘客等待时间的总和的期望值, 即求 \[ E\left(\sum_{i=1}^{N(t)} (t-T_i)\right) , \] 其中\(T_i\)是第\(i\)个乘客来到的时刻.
解: 在\(N(t)\)给定条件下,取条件期望 \[\begin{aligned} & E\left[\sum^{N(t)}_{i=1}(t-T_i) | N(t)=n \right] \\ =& E\left[\sum_{i=1}^n (t-T_i) | N(t)=n \right] \\ =& nt - E\left[\sum_{i=1}^n T_i |N(t)=n \right] . \end{aligned}\]
记\(U_1,U_2,\cdots,U_n\)为\(n\)个独立的服从\((0,t]\)上的均匀分布的随机变量, 由定理3.6 \[ E \left[\sum_{i=1}^n T_i | N(t)=n \right] = E\left[\sum_{i=1}^n U_i \right] = \frac{nt}{2} . \] 从而 \[ E\left[\sum_{i=1}^n(t-T_i) | N(t)=n \right] = nt - \frac{nt}{2} =\frac{nt}{2}. \] 所以 \[\begin{aligned} & E\left[\sum^{N(t)}_{i=1}(t-T_i)\right] \\ =& E\left[ E \left( \sum^{N(t)}_{i=1}(t-T_i)|N(t) \right)\right]\\ =&\frac{t}{2}E[N(t)]=\frac{\lambda t^2}{2} . \end{aligned}\]
例3.8 考虑定理3.2中每次事件发生时被记录到的概率随时间发生变化时的情况, 设事件A在\(s\)时刻发生被记录到的概率是\(p(s)\), 若以\(M(t)\)表示到\(t\)时刻被记录的事件数, 那么它还是泊松过程吗? 试给出\(M(t)\)的分布.
解: 易看出\(M(t)\)已不能形成一个泊松过程, 因为虽然它仍然具有独立增量性, 但由于\(p(s)\)的影响, 它已不再有平稳增量性. 但可以证明, 对\(\forall t\), \(M(t)\)依然是泊松分布, 参数与\(t\)和\(p(s)\)有关. 实际上,\(M(t)\)的均值为\(\lambda t \tilde p(t)\),其中 \[ \tilde p(t) = \frac{1}{t} \int_0^t p(s) \,ds. \]
事实上,若对\(N(t)\)给定的条件下取条件期望, 则有 \[\begin{aligned} & P(M(t) = m) \\ =& \sum_{k=0}^{\infty} P(M(t) = m | N(t) = m+k) P(N(t)=m+k) \\ =& \sum_{k=0}^{\infty} P(\text{已知}[0,t] \text{中发生了} m+k \text{次事件的条件下只有} m \text{件被记录}) \\ & \times P(N(t)=m+k) . \end{aligned}\] 在发生的\(m+k\)次事件中, 每一次的发生时间可以认为是独立同U(0,\(t\))分布的。
对其中的某一次事件, 其发生时间\(X \sim \text{U}(0,t)\), 用\(Y=1\)表示此事件被记录, \(Y=0\)表示不被记录, 被记录的概率用全期望公式计算为 \[\begin{aligned} \tilde p(t) =& P(Y=1) = E(Y) = E[ E(Y|X) ] \\ =& \int_0^t E(Y | X=s) \frac{1}{t} \,ds \\ =& \int_0^t P(Y=1 | X=s) \frac{1}{t} \,ds \\ =& \frac{1}{t} \int_0^t p(s) \,ds . \end{aligned}\]
这\(m+k\)个事件是否被记录是相互独立的, 而且每个事件的发生时间不计事件次序可以认为是独立的均匀分布U(0,\(t\)), 所以被记录的概率是相等的,都等于\(\tilde p(t)\), 于是\(m+k\)个事件中被记录的个数服从二项分布\(\text{B}(m+k, \tilde p(t))\),于是 \[\begin{aligned} & P(M(t) = m) \\ =& \sum_{k=0}^\infty \binom{m+k}{m} [\tilde p(t)]^m [1 - \tilde p(t)]^k \frac{(\lambda t)^{m+k}}{(m+k)!} e^{-\lambda t} \\ =& \sum_{k=0}^{\infty} \frac{(m+k)!}{m!k!} [\tilde p(t)]^m [1 - \tilde p(t)]^k \frac{(\lambda t)^{m+k}}{(m+k)!} e^{-\lambda t} \\ =& \frac{[\lambda t \tilde p(t)]^m}{m!} e^{-\lambda t} \sum_{k=0}^{\infty} \frac{[\lambda t (1 - \tilde p(t))]^k}{k!} \\ =& \frac{[\lambda t \tilde p(t)]^m}{m!} e^{-\lambda t} e^{\lambda t (1 - \tilde p(t))} \\ =& \frac{[\lambda t \tilde p(t)]^m}{m!} e^{-\lambda t \tilde p(t)}, \ m=0,1,\dots \end{aligned}\]
3.3 泊松过程的推广
3.3.1 非齐次泊松过程
当泊松过程的强度\(\lambda\)不再是常数, 而与时间\(t\)有关时, 泊松过程被推广为非齐次(非时齐)泊松过程. 一般来说, 非齐次泊松过程是不具备平稳增量的(见例3.8). 在实际中, 非齐次泊松过程也是比较常用的. 例如在考虑设备的故障率时, 由于设备使用年限的变化, 出故障的可能性会随之变化; 放射性物质的衰变速度, 会因各种外部条件的变化而随之不同; 昆虫产卵的平均数量随年龄和季节而变化等. 在这样的情况下, 再用齐次泊松过程来描述就不合适了, 于是改用非齐次的泊松过程来处理.
定义3.5 计数过程\(\{N(t), t \geq 0\}\)称做强度函数为\(\lambda(t) > 0\) (\(t \geq 0\))的非齐次泊松过程, 如果 \[\begin{aligned} (1)\ & N(0)=0; \\ (2)\ & \text{过程有独立增量}; \\ (3)\ & P(N(t+h) - N(t)=1) = \lambda(t) h + {\small o}(h); \\ (4)\ & P(N(t+h)-N(t) \geq 2) = {\small o}(h) . \end{aligned}\]
类似于泊松过程,非齐次泊松过程有如下的等价定义.
定义3.6 计数过程\(\{N(t), t \geq 0\}\)称为强度函数为\(\lambda (t) > 0\)(\(t \geq 0\))的非齐次泊松过程, 若 \[\begin{aligned} (1)\ & N(0)=0; \\ (2)\ & \text{过程有独立增量}; \\ (3)\ & \text{对任意实数} t \geq 0, s \geq 0, N(t+s) - N(t) \text{服从参数为} \\ & m(t+s) - m(t) = \int_t^{t+s} \lambda(u) du \\ & \text{的泊松分布}. \end{aligned}\]
注:\(m(t) = \int_0^t \lambda(s) \,ds\). 对齐次(时齐)的泊松过程, \(m(t) = \lambda \cdot t\), 不论时齐与否都有\(m(t) = E[N(t)]\), 即\(m(t)\)是\((0, t]\)时间段发生的事件个数的期望值。
泊松过程与非齐次泊松过程之间转换关系:
定理3.7 设\(\lambda(t) > 0\), \(\forall t \geq 0\), \(m(t) = \int_0^t \lambda(u) \,du\)。 若\(\{N(t), t \geq 0\}\)是一个强度函数为\(\lambda(t)\)的非齐次泊松过程. 令\(N^{*}(t) = N(m^{-1}(t))\), 则\(\{N^{*}(t)\}\)是一个强度参数为1的泊松过程。 反之, 若\(\{N^{*}(t)\}\)是一个强度参数为1的泊松过程, 则\(N(t) = N^*(m(t))\)是一个强度函数为\(\lambda(t)\)的非齐次泊松过程。
证明:用定义3.2验证\(\{N^{*}(t)\}\)是一个强度参数为1的泊松过程. 显然\(N^*(0)=0\), 且具有独立增量, 只要证明\(N^*(t+s) - N^*(s)\)服从参数为\(t\)的泊松分布。 事实上 \[\begin{aligned} & N^*(t+s) - N^*(s) \\ =& N(m^{-1}(t+s)) - N(m^{-1}(s)) \\ \sim& \text{Pois}[m(m^{-1}(t+s)) - m(m^{-1}(s))] \\ =& \text{Pois}(t) . \end{aligned}\]
反过来, 如果\(\{N^{*}(t)\}\)是一个强度参数为1的泊松过程, \(N(t) = N^*(m(t))\), 则\(N(0)=0\),\(\{ N(t) \}\)仍有独立增量, \[\begin{aligned} & N(t+s) - N(s) \\ =& N^*(m(t+s)) - N^*(m(s)) \\ \sim& \text{Pois}[m(t+s) - m(s)] , \end{aligned}\] 由定义3.6可知\(\{ N(t) \}\)是强度函数为\(\lambda(t)\)的非齐次泊松过程。
注1: 用此定理可以简化非齐次泊松过程的问题到泊松过程中进行讨论. 也从一个参数为\(1\)的齐次泊松过程构造一个强度函数为\(\lambda(t)\)的非齐次泊松过程.
注2: 若\(m(t)\)非严格单调增, 比如在某一区间\(\lambda(t)=0\)的情形, 可以取 \[ m^{-1}(u) = \inf \{ t: t > 0, m(t) \geq u \}, \ u > 0, \] 这时\(u \leq m(t) \iff t \geq m^{-1}(u)\)。
例3.9 设某设备的使用期限为10年, 在前5年内它平均2.5需要维修一次, 后5年平均2年需维修一次。 试求它在使用期内只维修过一次的概率.
解: 用非齐次泊松过程考虑,强度函数 \[ \lambda(t) = \begin{cases} \frac{1}{2.5}, & 0 \leq t \leq 5 , \\ \frac{1}{2}, & 5 < t \leq 10 , \end{cases} \] 有 \[ m(10) = \int_0^{10} \lambda(t) dt = \int_0^5 \frac{1}{2.5} dt + \int_5^{10} \frac{1}{2} dt = 4.5 \] 因此 \[ P(N(10)-N(0)=1) = e^{-4.5} \frac{(4.5)^1}{1!} = \frac{9}{2}e^{-\frac{9}{2}}. \]
3.3.2 复合泊松过程
定义3.7 称随机过程\(\{X(t), t \geq 0\}\)为复合泊松过程, 如果对于\(t \geq 0\), \(X(t)\)可以表示为 \[ X(t) = \sum_{i=1}^{N(t)} Y_i, \] 其中\(\{N(t), t \geq 0\}\)是一个泊松过程, \(Y_i\), \(i=1,2,\dots\)是一族独立同分布的随机变量, 并且与\(\{N(t), t \geq 0\}\)也是独立的.
注: 复合泊松过程不一定是计数过程, 但是当\(Y_i \equiv c\), \(i=1,2,\dots\), \(c\)为常数时, 可化为泊松过程. 定理3.2可以看成是\(Y_i \sim \text{b}(1,p)\)的复合泊松过程, 但恰好构成了参数为\(\lambda p\)的泊松过程。
例3.10 保险公司接到的索赔次数服从一个泊松过程\(\{N(t)\}\), 每次要求赔付的金额\(Y_i\)都相互独立, 且有同分布\(F\), 每次的索赔数额与它发生的时刻无关, 则\([0,t]\)时间区间内保险公司需要赔付的总金额\(\{X(t)\}\)就是一个复合泊松过程, \[ X(t) = \sum_{i=1}^{N(t)} Y_i . \]
例3.11 (顾客成批到达的排队系统) 设顾客到达某服务系统的时间\(S_1, S_2, \dots\)形成一强度为\(\lambda\)的泊松过程, 在每个时刻\(S_n\)可以同时有多名顾客到达. \(Y_n\)表示在时刻\(S_n\)到达的顾客人数, 假定\(Y_n\), \(n=1,2,\dots\)相互独立, 并且与\(\{S_n\}\)也独立, 则在\([0,t]\)时间区间内到达服务系统的顾客总人数也可用一复合泊松过程来描述.
例3.12 假设顾客按照参数为\(\lambda\)的泊松过程进入一个商店, 又假设各顾客所花费的金额形成一族独立同分布的随机变量。 以\(X(t)\)记到时间\(t\)为止顾客在此商店所花费的总额, 易知\(\{X(t), t \geq 0\}\)是一个复合泊松过程。
定理3.8 设\(\{ X(t) = \sum_{i=1}^{N(t)}Y_i, t \geq 0\}\)是一复合泊松过程, 泊松过程\(\{N(t), t \geq 0\}\)的强度为\(\lambda\), 则 \[\begin{aligned} (1)\ & X(t) \text{有独立增量}; \\ (2)\ & E[X(t)] = \lambda t \cdot E(Y_1); \\ & \text{Var}[X(t)] = \lambda t \cdot E(Y_1^2) . \end{aligned}\]
证明: (1)令\(0 \leq t_0 <t_1 < t_2 < \cdots < t_n\),则 \[ X(t_k) - X(t_{k-1}) = \sum_{i=N(t_{k-1})+1}^{N(t_k)} Y_i,\ k=1,2,\dots,n, \] 由过程的独立增量性及各\(Y_i\)(\(i=1,2,\dots,n\))之间的独立性不难得出\(X(t)\)的独立增量性.
(2)用全期望公式, \[\begin{aligned} E[X(t)] = E[E(X(t) | N(t))], \end{aligned}\] 其中 \[\begin{aligned} & E(X(t) | N(t) = n) = E \left( \sum_{i=1}^n Y_i | N(t) = n \right) \\ =& E \left( \sum_{i=1}^n Y_i \right) = n E(Y_1), \end{aligned}\] 故 \[\begin{aligned} E[X(t)] = E[N(t) E(Y_1)] = E[N(t)] E(Y_1) . \end{aligned}\]
对于\(\text{Var}(X(t))\),要利用条件方差公式 \[ \text{Var(X(t))} = E \left\{ \text{Var}\left[ X(t) | N(t) \right] \right\} + \text{Var} \left\{ E \left[ X(t) | N(t) \right] \right\}, \] 其中 \[\begin{aligned} & \text{Var}\left[ X(t) | N(t)=n \right] \\ =& E \left\{ \left[ X(t) - E(X(t) | N(t)=n) \right]^2 | N(t)=n \right\} \\ =& E \left\{ \left[ \sum_{i=1}^n Y_i - n E(Y_1) \right]^2 | N(t)=n \right\} \\ =& E \left\{ \left[ \sum_{i=1}^n Y_i - n E(Y_1) \right]^2 \right\} \\ =& E \left\{ \left[ \sum_{i=1}^n (Y_i - EY_i) \right]^2 \right\} \\ =& \text{Var}\left[ \sum_{i=1}^n (Y_i - EY_i) \right] = n \text{Var}(Y_1), \end{aligned}\] 于是 \[\begin{aligned} \text{Var(X(t))} =& E[ N(t) \text{Var}(Y_1)] + \text{Var}(N(t) E(Y_1)) \\ =& \lambda t \text{Var}(Y_1) + \lambda t [E(Y_1)]^2 = \lambda t E(Y_1^2) . \end{aligned}\]
例3.13 在保险中的索赔模型中, 设保险公司接到的索赔要求是强度为每个月两次的泊松过程。 每次赔付服从均值为10000元的正态分布, 则一年中保险公司平均的赔付额是多少?
解: 由定理3.8 \[ E[X(12)] = 2 \times12 \times 10000 = 240000 \text{(元)} . \]
例3.14 设顾客以每分钟6人的平均速率进入某商场, 这一过程可以用泊松过程来描述. 又设进入该商场的每位顾客买东西的概率为0.9, 且每位顾客是否买东西互不影响, 也与进入该商场的顾客数无关, 求一天(12小时)在该商场买东西的顾客数的分布与均值.
解: 由定理3.2, 这是一个复合泊松过程也是泊松过程, 速率参数为\(0.9 \times 6\), 所以一天(12小时,即720分钟)在该商场买东西的顾客数的分布为均值\(0.9 \times 6 \times 720 = 3888\)的泊松分布,
注:这个例子中若以\(Z_i\)表示进入该商场的第\(i\)位顾客在该商场所花的钱数(单位:元), 且有\(Z_i \sim B(200,0.5)\),则 \[ \tilde X(t) = \sum_{i=1}^{N_1(t)} Z_i \] 表示在时间\((0,t]\)内该商场的营业额, 则该商场一天的平均营业额为 \[ E[\tilde X(720)] = E[Z_1]E[N(720)] = (200 \times 0.5) \times (6 \times 720) = 432000\text{(元)}. \]
3.3.3 条件泊松过程
条件泊松过程, 有些像是统计学中的混合分布。 设随机变量\(I\)取值于\(\{1, 2\}\), \(\alpha = P(I=1)\), 随机变量\(X_1 \sim f_1(x)\), \(X_2 \sim f_2(x)\), 随机变量 \[ Y = \begin{cases} X_1, & \text{当} I=1, \\ X_2, & \text{当} I=2, \end{cases} \] 则\(Y\)的分布密度为 \[ f(x) = \alpha f_1(x) + (1-\alpha) f_2(x), \] 称这样的分布为混合分布。
泊松过程描述的是一个有着“风险”参数\(\lambda\)的个体发生某一事件的频率, 如果我们考虑一个总体, 其中的个体存在差异, 比如发生事故的倾向性因人而异, 这时我们可以把\(N(t)\)所服从的泊松分布解释为给定\(\lambda\)时, \(N(t)\)的条件分布.
定义3.8 设随机变量\(\Lambda > 0\), 在\(\Lambda=\lambda\)的条件下, 计数过程\(\{N(t), t \geq 0\}\)是参数为\(\lambda\)的泊松过程. 则称\(\{ N(t), t \geq 0\}\)为条件泊松过程.
命题3.1 设\(\Lambda\)的分布是\(G(\cdot)\), 那么在长度为\(t\)的时间区间内发生\(n\)次事件的概率为 \[ P(N(t+s)-N(s)=n) = \int_0^{\infty} e^{-\lambda t} \frac{(\lambda t)^n}{n!} \,dG(\lambda) . \]
证明: 利用全期望公式。 记\(I_A\)为事件\(A\)的示性函数, 则\(E(I_A) = P(A)\), \[\begin{aligned} & P(N(t+s)-N(s)=n) \\ =& E \left[ I_{\{ N(t+s)-N(s)=n \}} \right] \\ =& E \left\{ E \left[ I_{\{ N(t+s)-N(s)=n \}} | \Lambda \right] \right\} \\ =& \int_0^\infty E \left[ I_{\{ N(t+s)-N(s)=n \}} | \Lambda=\lambda \right] \,dG(\lambda) \\ =& \int_0^\infty P \left[ N(t+s)-N(s)=n | \Lambda=\lambda \right] \,dG(\lambda) \\ =& \int_0^{\infty} e^{-\lambda t} \frac{(\lambda t)^n}{n!} \,dG(\lambda) . \end{aligned}\]
定理3.9 设\(\{N(t), t \geq 0 \}\)是条件泊松过程, 且\(E(\Lambda^2) < \infty\), 则 \[\begin{aligned} (1)\ & E[N(t)] = t E(\Lambda) ; \\ (2)\ & \text{Var}[N(t)] = t^2 \text{Var}(\Lambda) + t E(\Lambda) . \end{aligned}\]
证明: (1) \[\begin{aligned} E[N(t)] = E[E(N(t)|\Lambda)] = E(t \Lambda ) = t E(\Lambda) . \end{aligned}\]
(2) \[\begin{aligned} \text{Var}(N(t)) =& E[N^2(t)] - [E(N(t))]^2 \\ =& E[\Lambda t + \Lambda^2 t^2] - [t E(\Lambda)]^2 \\ =& t E(\Lambda) + t^2 E(\Lambda^2) - t^2 [E(\Lambda)]^2 \\ =& t E(\Lambda) + t^2 \text{Var}(\Lambda) . \end{aligned}\]
例3.15 设意外事故的发生频率受某种未知因素影响有两种可能\(\lambda_1\), \(\lambda_2\), 且\(P(\Lambda = \lambda_1)=p\), \(P(\Lambda =\lambda_2)=1-p=q\), \(0<p<1\)为已知. 已知到时刻\(t\)已发生了\(n\)次事故. 求下一次事故在\(t+s\)之前不会到来的概率. 另外,这个发生频率为\(\lambda_1\)的后验概率是多少?
解: 关于第一个问题,有 \[\begin{aligned} & P((t, t+s] \text{内没有事故发生} | N(t)=n) \\ =& \frac{P((t, t+s] \text{内没有事故发生} ,\ N(t)=n)}{P(N(t)=n)} \\ =& \frac{P(N(t+s)-N(t)=0 ,\ N(t)=n)}{P(N(t)=n)} \\ =& \frac{\sum_{i=1}^2 P(\Lambda=\lambda_i) \; P(N(t+s)-N(t)=0 ,\ N(t)=n | \Lambda=\lambda_i)}{ \sum_{i=1}^2 P(\Lambda=\lambda_i) \; P(N(t)=n | \Lambda=\lambda_i)} \\ =& \frac{\sum_{i=1}^2 P(\Lambda=\lambda_i) \; \frac{(\lambda_i t)^n}{n!} e^{-\lambda_i t} e^{-\lambda_i s}}{ \sum_{i=1}^2 P(\Lambda=\lambda_i) \; \frac{(\lambda_i t)^n}{n!} e^{-\lambda_i t}} \\ =& \frac{p \lambda_1^n e^{-\lambda_1 (t+s)} + (1-p) \lambda_2^n e^{-\lambda_2 (t+s)}}{ p \lambda_1^n e^{-\lambda_1 t} + (1-p) \lambda_2^n e^{-\lambda_2 t} } . \end{aligned}\]
关于第二个问题,有 \[\begin{aligned} & P(\Lambda=\lambda_1 | N(t)=n) \\ =& \frac{P(N(t)=n, \Lambda=\lambda_1)}{P(N(t)=n)} \\ =& \frac{P(\Lambda=\lambda_1) P(N(t)=n | \Lambda=\lambda_1)}{ P(\Lambda=\lambda_1) P(N(t)=n | \Lambda=\lambda_1) + P(\Lambda=\lambda_2) P(N(t)=n | \Lambda=\lambda_2) } \\ =& \frac{p \frac{(\lambda_1 t)^n}{n!} e^{-\lambda_1 t}}{ p \frac{(\lambda_1 t)^n}{n!} e^{-\lambda_1 t} + (1-p) \frac{(\lambda_2 t)^n}{n!} e^{-\lambda_2 t} } \\ =& \frac{p \lambda_1^n e^{-\lambda_1 t}}{ p \lambda_1^n e^{-\lambda_1 t} + (1-p) \lambda_2^n e^{-\lambda_2 t} } . \end{aligned}\]
3.4 补充
3.4.1 泊松过程的无记忆性
定理3.10 设\(\{N(t), t \geq 0 \}\)为速率\(\lambda\)的泊松过程, \(T > 0\), 令\(Y(t) = N(T+t) - N(T)\), 则\(\{Y(t), t \geq 0 \}\)也是速率\(\lambda\)的泊松过程, 且\(\{Y(t), t \geq 0 \}\)的事件间隔时间序列与\(N(T)\)相互独立, 对任意\(0 < t_1 < \dots < t_n\), \((Y(t_1), \dots, Y(t_n))\)与\(N(T)\)相互独立。
见(陈大岳 and 章复熹 2023)P.159定理2.1.4和推论2.1.5。
3.4.2 泊松过程的马氏性
泊松过程是连续时间的马氏链:
定理3.11 设\(\{N(t), t \geq 0 \}\)为速率\(\lambda\)的泊松过程, \(0 < t_1 < \dots < t_n < t < t+s\), \(0 \leq k_1 \leq \dots \leq k_n \leq k \leq r\)为非负整数, 则 \[ P(N(t+s) = r | N(t_1)=k_1, \ldots, N(t_n)=k_n, N(t)=k) = P(N(t+s) = r | N(t)=k) . \]
见(陈大岳 and 章复熹 2023)P.162推论2.1.8。
3.4.3 泊松过程合并与分解
定理3.12 设\(\{N_1(t), t \geq 0 \}\)是参数为\(\lambda\)的泊松过程, \(\{N_2(t), t \geq 0 \}\)是参数为\(\mu\)的泊松过程, 且这两个泊松过程独立, 令\(N(t) = N_1(t) + N_2(t)\), 则\(\{N(t), t \geq 0 \}\)是参数为\(\lambda+\mu\)的泊松过程。
证明: 易见\(N(0)=0\), 独立增量性和平稳增量性从\(N_1\)和\(N_2\)的平稳独立增量性可得, 而\(N_1(t) + N_2(t)\)服从泊松Pois(\(\lambda + \mu\))分布, 结论成立。
上述定理可以推广到多个独立的泊松过程的和。
关于泊松过程的分解, 先给出定理3.2的严格证明。 参见(何书元 2008) P.49 定理4.3。
用\(Y_i\)表示第\(i\)个事件是否被记录的两点分布随机变量, \(\{Y_i \}\)相互独立且与\(\{N(t)\}\)相互独立, \[ M(t) = \sum_{j=1}^{N(t)} Y_j, \ t \geq 0 . \] 来证明\(\{M(t), t \geq 0 \}\)是参数为\(p \lambda\)的泊松过程。
对于\(0 \leq s < t\), \[ M(t) - M(s) = \sum_{j=N(s)+1}^{N(t)} Y_j \tag{3.1} \] 是\((s,t]\)内事件的到达次数。 由独立性, 对\(k \geq l\)可计算如下的条件概率: \[\begin{aligned} & P( M(t) - M(s) = n \,|\, N(s)=l, N(t)=k ) \\ =& P( \sum_{j=l+1}^{k} Y_j = n \,|\, N(s)=l, N(t)=k ) \\ =& P( \sum_{j=l+1}^{k} Y_j = n ) \\ =& \binom{k-l}{n} p^n q^{k-l-n} \\ \stackrel{\triangle}{=}& g(k-l, n) . \end{aligned}\] \(g(k,n)\)是\(\text{B}(k, p)\)随机变量等于\(n\)的概率。
于是, \[ E[I_{\{ M(t)-M(s) = n \}} \,|\, N(s), N(t)] = g(N(t)-N(s), n) . \] 两边取期望得 \[ P(M(t)-M(s) = n) = E[g(N(t)-N(s), n)] . \tag{3.2} \]
显然\(M(0)=0\), 由(3.2)和\(\{N(t)\}\)的平稳增量性可知\(\{M(t)\}\)为平稳增量过程。
来证明独立增量性。 对任意正整数\(m\)和\(0 = t_0 \leq t_1 < t_2 < \dots < t_m\)和整数\(0 = n_0 \leq n_1 \leq n_2 \leq \dots \leq n_m\), 定义 \[ \boldsymbol N = (N(t_1), N(t_2), \dots, N(t_m)), \ \boldsymbol n = (n_1, n_2, \dots, n_m) . \] 由(3.1)可知, 在\(\boldsymbol N = \boldsymbol n\)条件下, 以下各个随机变量 \[ M(t_j) - M(t_{j-1}) = \sum_{i=n_{j-1}}^{n_j} Y_i, \ j=1,2,\dots, m \] 相互独立, 并且与\(\boldsymbol N\)独立。 于是 \[\begin{aligned} & P(M(t_j) - M(t_{j-1}) = k_j, \; 1 \leq j \leq m \,|\, \boldsymbol N = \boldsymbol n) \\ =& P \left( \sum_{i=n_{j-1}}^{n_j} Y_i = k_j, \; 1 \leq j \leq m \,|\, \boldsymbol N = \boldsymbol n \right) \\ =& P \left( \sum_{i=n_{j-1}}^{n_j} Y_i = k_j, \; 1 \leq j \leq m \right) \\ =& \prod_{j=1}^m P \left( \sum_{i=n_{j-1}}^{n_j} Y_i = k_j \right) \\ =& \prod_{j=1}^m g(n_j - n_{j-1}, k_j) . \end{aligned}\] 于是 \[\begin{aligned} & E[ I_{\{ M(t_j) - M(t_{j-1}) = k_j, \; 1 \leq j \leq m \}} \,|\, \boldsymbol N ] \\ =& \prod_{j=1}^m g(N(t_j) - N(t_{j-1}), k_j) . \end{aligned}\] 对上式求无条件期望。 由\(\{N(t)\}\)的独立增量性有 \[\begin{aligned} & P(M(t_j) - M(t_{j-1}) = k_j, \; 1 \leq j \leq m) \\ =& \prod_{j=1}^m E[g(N(t_j) - N(t_{j-1}), k_j)] . \end{aligned}\] 这说明增量\(M(t_1) - M(t_0), M(t_2) - M(t_1), \dots, M(t_n)-M(t_{n-1})\)相互独立, 独立增量性得证。
最后只要证明\(M(t)\)服从参数为\(p \lambda t\)的泊松分布。 由(3.2), \[\begin{aligned} & P(M(t)=n) \\ =& E[g(N(t), n)] \\ =& \sum_{k=n}^\infty g(k,n) P(N(t)=k) \\ =& \sum_{k=n}^\infty \binom{k}{n} p^n q^{k-n} \frac{\lambda^k}{k!} e^{-\lambda} \\ =& \frac{(p \lambda)^n}{n!} e^{-p \lambda}, \ n=0,1,\dots . \end{aligned}\] 证毕。
定理3.13 设\(\{N(t)\}\)为参数\(\lambda\)的泊松过程, \(\{Y_j \}\)独立同\(\text{b}(1,p)\)分布, 且与\(\{N(t)\}\)独立。 令 \[\begin{aligned} N_1(t) = \sum_{j=1}^{N(t)} Y_j, \ N_2(t) = \sum_{j=1}^{N(t)} (1 - Y_j), \end{aligned}\] 则\(\{N_1(t)\}\)是参数为\(p\lambda\)的泊松过程, \(\{N_2(t)\}\)是参数为\((1-p)\lambda\)的泊松过程, 且\(\{N_1(t)\}\)和\(\{N_2(t)\}\)相互独立。
证明: 前面已证明\(\{N_1(t)\}\)是参数为\(p\lambda\)的泊松过程, \(\{N_2(t)\}\)同理可证。 下面用命题2.1证明这两个过程相互独立。
对任意正整数\(n\)和\(0 \leq t_1 < t_2 < \dots < t_n\), 对于整数 \[\begin{aligned} & 0 = k_0 \leq k_1 \leq k_2 \leq \dots \leq k_n, \\ & 0 = m_0 \leq m_1 \leq m_2 \leq \dots \leq m_n, \end{aligned}\] 记\(n_j = k_j + m_j\), \(\boldsymbol n = (n_1, n_2, \dots, n_n)\)。 如下的\(n\)个随机变量 \[ \xi_j = \sum_{i=n_{j-1}+1}^{n_j} Y_i, \ j=1,2, \dots \] 相互独立, 并且与泊松过程\(\{N(t) \}\)独立。 注意\(\xi_j \sim \text{B}(n_j - n_{j-1}, p)\), 于是 \[\begin{aligned} & P(N_1(t_j) = k_j, N_2(t_j) = m_j, 1 \leq j \leq n ) \\ =& P(N_1(t_j) = k_j, N(t_j) = n_j, 1 \leq j \leq n ) \\ =& P(N_1(t_j) - N_1(t_{j-1}) = k_j - k_{j-1}, N(t_j) = n_j, 1 \leq j \leq n ) \\ =& P(\xi_j = k_j - k_{j-1}, N(t_j) - N(t_{j-1}) = n_j - n_{j-1}, 1 \leq j \leq n ) \\ =& P(\xi_j = k_j - k_{j-1}, 1 \leq j \leq n ) \\ & P(N(t_j) - N(t_{j-1}) = n_j - n_{j-1}, 1 \leq j \leq n ) \\ =& \prod_{j=1}^n P(\xi_j = k_j - k_{j-1}) P(N(t_j) - N(t_{j-1}) = n_j - n_{j-1}) \\ =& \prod_{j=1}^n \frac{(n_j - n_{j-1})!}{(k_j - k_{j-1})!(m_j - m_{j-1})!} p^{k_j - k_{j-1}} q^{m_j - m_{j-1}} \\ & \cdot \frac{[\lambda(t_j - t_{j-1})]^{n_j - n_{j-1}}}{(n_j - n_{j-1})!} e^{-\lambda(t_j - t_{j-1})} \\ =& \prod_{j=1}^n \frac{[p \lambda (t_j - t_{j-1})]^{k_j - k_{j-1}}}{(k_j - k_{j-1})!} \\ & \prod_{j=1}^n \frac{[q \lambda (t_j - t_{j-1})]^{m_j - m_{j-1}}}{(m_j - m_{j-1})!} . \end{aligned}\] 所以两个随机过程独立。
上述泊松过程分解定理可以推广到分解成多个相互独立的泊松过程:
推论3.1 设\(\{N(t)\}\)为参数\(\lambda\)的泊松过程, \(p_j > 0\), \(j=1,2,\dots,m\)且\(p_1 + p_2 + \dots + p_m = 1\)。 则存在\(m\)个相互独立的泊松过程\(\{N_j(t), t \geq 0 \}\), 使得 \[ N(t) = \sum_{j=1}^m N_j(t) . \]
3.4.4 剩余寿命和年龄
对齐次泊松过程\(\{N(t)\}\), \(T_n\)表示第\(n\)次事件的发生时刻, \(N(t)\)表示截止到\(t\)为止已发生的事件个数, 则\(T_{N(t)}\)是\((0, t]\)时间段内最后一次事件的时间; \(T_{N(t)+1}\)是\((t, \infty)\)时间段内第一次事件的时间, \(t \in [T_{N(t)}, T_{N(t)+1})\)。 将每次事件的发生看成是更换新的设备, 并且\(t=0\)时刚刚更换过设备, 令 \[\begin{aligned} W(t) =& T_{N(t)+1} - t, \\ V(t) =& t - T_{N(t)}, \end{aligned}\] 则\(W(t)\)是\(t\)时刻正在使用的设备的剩余寿命, \(V(t)\)是\(t\)时刻正在使用的设备的年龄(已经使用的时间), 当\(N(t)=n-1\)时, \(X_n = V(t) + W(t)\)是第\(n-1\)次事件到第\(n\)次事件之间的间隔时间, 服从参数为\(\lambda\)的指数分布且各\(X_n\)相互独立。 讨论\(W(t)\)和\(V(t)\)的分布。
命题3.2 (1)\(W(t)\)与\(X_n\)同分布。
(2)\(V(t)\)服从截尾的指数分布: \[ P(V(t) \leq x) = \begin{cases} 1 - e^{-\lambda x}, & 0 \leq x < t, \\ 1, & x \geq t . \end{cases} \]
证明: (1) \[ W(t) > x \iff N(t+x) - N(t) = 0, \] 故 \[\begin{aligned} & P(W(t) > x) = P(N(t+x) - N(t) = 0) \\ =& P(N(x)=0) = e^{-\lambda x}, \ x > 0 . \end{aligned}\] 即\(W(t) \sim \text{Pois}(\lambda)\)。
而\(x < t\)时 \[ V(t) > x \iff N(t) - N(t-x) = 0, \] \(x \geq t\)时必然有\(V(t) \leq x\), 所以可得\(V(t)\)的分布。 注意\(V(t)\)是一个混合分布, 分布函数在\(x = t\)处有一个跳跃点。
定理3.14 对计数过程\(\{ N(t), t \geq 0 \}\),\(N(0)=0\), \(X_n\)表示事件之间的间隔时间, 各\(X_n\)相互独立同分布, 分布函数为\(F(x)\),\(F(0) = 0\), 若对任意\(t > 0\),余寿\(W(t)\)与\(X_1\)同分布, 则\(\{ N(t), t \geq 0 \}\)是泊松过程。
见(林元烈 2002) P.46定理2.3.3。