Sheldon M. Ross "Stochastic Processes" 2nd Edition
随机过程(第二版)习题

# 1.5

nn 次独立实验,每次的结果以 p1prp_1\sim p_r 的概率出现 1r1\sim r 之一。记出现结果 ii 的个数为 NiN_i\,. 计算:

  1. N1,,NrN_1,\cdots,N_r 之联合分布
  2. Cov(Ni,Nj)\mathrm{Cov}(\,N_{i}\,,\,N_{j}\,)
  3. 出现次数为 0 的个数之均值与方差

解:

(1) 先按乘法公式给出单个情形的概率,再乘以重复个数。于是有

P{N1=n1,N2=n2,,Nr=nr}=p1n1p2n2prnr(nn1)(nn1n2)(nn1n2n3)(nr1+nrnr)(nrnr)\begin{aligned} P\,\{N_1=n_1\,,\,N_2=n_2\,,\cdots,N_r=n_r\}&=p_1^{n_1}p_2^{n_2}\cdots p_r^{n_r}\cdot{n\choose n_1}{n-n_1\choose n_2}{n-n_1-n_2\choose n_3}\\&\quad\ \cdots{n_{r-1}+n_r\choose n_r}{n_r\choose n_r} \end{aligned}

组合数的乘积,分母是 j=1r(nj!)\prod\limits_{j=1}^r\left(n_j!\right),分子是 nn 乘到 nn1n-n_1、再从 nn1n-n_1 乘到 nn1n2n-n_1-n_2,一直下去全乘一起就是 n!n!. 于是所求联合分布

P{N1=n1,N2=n2,,Nr=nr}=p1n1p2n2×n!j=1r(nj!)=n!×j=1rpjrjnj!P\,\{N_1=n_1\,,\,N_2=n_2\,,\cdots,N_r=n_r\}=p_1^{n_1}p_2^{n_2}\cdots\times\frac{n!}{\prod\limits_{j=1}^r(n_j!)}=n!\times\prod\limits_{j=1}^r\dfrac{p_j^{r_j}}{n_j!}


(2) 依题意易知 NiB(n,pi)N_i\sim B\left(n\,,p_i\right)NjB(n,pj)N_j\sim B\left(n\,,p_j\right),于是由二项分布的性质立即有

Var(Ni)=npi(1pi)Var(Nj)=npj(1pj)\begin{matrix}{\mathrm{Var}}\left(N_i\right)=np_i\left(1-p_i\right)\\{\mathrm{Var}}\left(N_j\right)=np_j\left(1-p_j\right)\end{matrix}

使用公式 Var(Ni+Nj)=Var(Ni)+Var(Nj)+2Cov(Ni,Nj){\mathrm{Var}}\left(N_i+N_j\right)={\mathrm{Var}}\left(N_i\right)+{\mathrm{Var}}\left(N_j\right)+2{\mathrm{\ Cov}}\left(N_i,N_j\right) 计算所求值。由

P(Ni+Nj=k)=m=0kpimpjkm(1pipj)nkn!m!(km)!(nk)!=(1pipj)nkn!(nk)!k!m=0kpimpjkmk!m!(km)!=(1pipj)nk(nk)m=0kpimpjkm(km)=(1pipj)nk(nk)(pi+pj)k=(pi+pj)k(1pipj)nk(nk)\begin{aligned} P\left(N_i+N_j=k\right)&=\sum\limits_{m=0}^kp_i^mp_j^{k-m}\left(1-p_i-p_j\right)^{n-k}\dfrac{n!}{m!(k-m)!(n-k)!} \\ &=\left(1-p_i-p_j\right)^{n-k}\dfrac{n!}{(n-k)!k!}\sum\limits_{m=0}^kp_i^mp_j^{k-m}\dfrac{k!}{m!(k-m)!} \\ &=\left(1-p_i-p_j\right)^{n-k}{n\choose k}\sum\limits_{m=0}^kp_i^mp_j^{k-m}{k\choose m}\\ &=\left(1-p_i-p_j\right)^{n-k}{n\choose k}\left(p_i+p_j\right)^k\\ &=\left(p_i+p_j\right)^k\left(1-p_i-p_j\right)^{n-k}{n\choose k}\\ \end{aligned}

得,该分布具有二项分布形式,Ni+NjB(n,pi+pj)N_i+N_j\sim B\left(n\, ,p_i+p_j\right). 于是

Var(Ni+Nj)=npi(1pi)+npj(1pj)+2Cov(Ni,Nj)=n(pi+pj)(1pipj)\begin{aligned} {\mathrm{Var}}\left(N_i+N_j\right)&=np_i\left(1-p_i\right)+np_j\left(1-p_j\right)+2{\mathrm{\ Cov}}\left(N_i,N_j\right)\\&=n(p_i+p_j)(1-p_i-p_j) \end{aligned}

移项展开,一次项和平方项恰好消去,解得 Cov(Ni,Nj)=npipj{\mathrm{Cov}}\left(N_i\,,N_j\right)=-np_ip_j


(3) 由二项分布有 P(Nj=0)=(1pj)nP\left(N_j=0\right)=(1-p_j)^n. 令 Ij={1,Nj=00,ohtersI_j=\begin{cases}1,\,N_j=0\\0,\,\text{ohters}\end{cases},则出现次数为 0 的个数 V=IjV=\sum\limits I_j,于是

E(V)=E(Ij)=i=1r(1pj)nD(V)=D(Ij)+2i<jCov(Ii,Ij)=i=1rn(1pj)n(1(1pj)n)+2i<j(E(IiIj)E(Ii)E(Ij))\begin{aligned} E\left(V\right)&=\sum\limits E\left(I_j\right)=\sum\limits_{i=1}^r(1-p_j)^n \\ \\ D\left(V\right)&=\sum\limits D\left(I_j\right)+2\,\mathop{\sum\sum}\limits_{i<j}{\rm \,Cov}\left(I_i\, ,I_j\right) \\ &=\sum\limits_{i=1}^rn(1-p_j)^n(1-(1-p_j)^n)+2\,\mathop{\sum\sum}\limits_{i<j}\left(E(I_iI_j)-E(I_i)E(I_j)\right) \end{aligned}

其中 E(Ii)=(1pi)nE(I_i)=(1-p_i)^nE(Ij)=(1pj)nE(I_j)=(1-p_j)^n

事件 IiIj=1I_iI_j=1 表示 Ni=0N_i=0Nj=0N_j=0,于是E(IiIj)=P(Ni=0,Nj=0)=(1pipj)nE(I_iI_j)=P(N_i=0\,,N_j=0)=(1-p_i-p_j)^n,代入 D(V)D(V) 式即得解.


# 1.6

连续随机变量 X1,X2,X_1,X_2,\cdots 独立同分布。规定:若 Xn>max(X1,,Xn1)X_n>\max\left(X_1,\cdots,X_{n-1}\right)(其中 X0=X_0=-\infty),则称在 nn 时刻产生了一个记录,记录的值为 XnX_n.

  1. 时刻 nn 时产生的记录个数记为 NnN_n,计算 E(Nn)E(N_n)D(Nn)D(N_n)
  2. TT 标记第一次产生记录的时刻 nnn=1n=1 不在本题的考虑范围内),求 P(T>n)P\left(T>n\right),并证明 P(T<)=1P(T<\infty)=1E(T)=E(T)=\infty
  3. TyT_y 标记 “第一次产生大于 yy 的记录” 的时刻,证明 TyT_yXTyX_{T_y} 独立

解:

(1) 记 XiX_i 的分布函数为 F(xi)F(x_i)、其 PDF 为 f(xi)f(x_i). 由独立性可求得各个时刻产生记录的概率:

P(X2>X1)=+x2f(x1)f(x2)dx1dx2=+f(x2)x1f(x1)dx1dx2=+f(x2)F(x2)dx2=+F(x2)dF(x2)=01tdt=12\begin{aligned} P\left(X_2>X_1\right) &=\displaystyle\int_{-\infty}^{+\infty}\displaystyle\int_{-\infty}^{x_2}f(x_1)f(x_2)\ {\mathrm d}x_1{\mathrm d}x_2 \\ &=\displaystyle\int_{-\infty}^{+\infty}f(x_2)\displaystyle\int_{-\infty}^{x_1}f(x_1)\ {\mathrm d}x_1{\mathrm d}x_2 \\ &=\displaystyle\int_{-\infty}^{+\infty}f(x_2)F(x_2)\ {\mathrm d}x_2 \\ &=\displaystyle\int_{-\infty}^{+\infty}F(x_2)\ {\mathrm d}F(x_2) \\ &=\displaystyle\int_0^1t\ {\mathrm d}t=\frac12 \end{aligned}

P(X3>X1,X3>X2)=+x3x3f(x1)f(x2)f(x3)dx1dx2dx3=+x3f(x2)f(x3)x3f(x1)dx1dx2dx3=+f(x3)x3f(x2)F(x3)dx2dx3=+f(x3)F(x3)x3f(x2)dx2dx3=+f(x3)F2(x3)dx3=+F2(x3)dF(x3)=01t2dt=13\begin{aligned} P\left(X_3>X_1\,,X_3>X_2\right) &=\displaystyle\int_{-\infty}^{+\infty}\displaystyle\int_{-\infty}^{x_3}\displaystyle\int_{-\infty}^{x_3}f(x_1)f(x_2)f(x_3)\ {\mathrm d}x_1{\mathrm d}x_2{\mathrm d}x_3 \\ &=\displaystyle\int_{-\infty}^{+\infty}\displaystyle\int_{-\infty}^{x_3}f(x_2)f(x_3)\displaystyle\int_{-\infty}^{x_3}f(x_1)\ {\mathrm d}x_1{\mathrm d}x_2{\mathrm d}x_3 \\ &=\displaystyle\int_{-\infty}^{+\infty}f(x_3)\displaystyle\int_{-\infty}^{x_3}f(x_2)F(x_3)\ {\mathrm d}x_2{\mathrm d}x_3 \\ &=\displaystyle\int_{-\infty}^{+\infty}f(x_3)F(x_3)\displaystyle\int_{-\infty}^{x_3}f(x_2)\ {\mathrm d}x_2{\mathrm d}x_3 \\ &=\displaystyle\int_{-\infty}^{+\infty}f(x_3)F^2(x_3)\ {\mathrm d}x_3 \\ &=\displaystyle\int_{-\infty}^{+\infty}F^2(x_3)\ {\mathrm d}F(x_3) \\ &=\displaystyle\int_0^1t^2\ {\mathrm d}t=\frac13 \end{aligned}

同理可依次推得 P(Xn>max(X1,,Xn1))=1nP\left(X_n>\max\left(X_1,\cdots,X_{n-1}\right)\right)=\dfrac1n

In={1,n时产生记录0,ohtersI_n=\begin{cases}1,\,n时产生记录\\0,\,\text{ohters}\end{cases},显然他们相互独立。于是 Nn=1nIjN_n=\sum_1^n I_j,于是

E(Nn)=j=1nE(Ij)=j=1nE(Ij)=j=1n1jD(Nn)=j=1nD(Ij)=j=1n1j(11j)\begin{matrix} E\left(N_n\right)=\sum\limits_{j=1}^nE\left(I_j\right)=\sum\limits_{j=1}^nE\left(I_j\right)=\sum\limits_{j=1}^n\dfrac1j\\ D\left(N_n\right)=\sum\limits_{j=1}^nD\left(I_j\right)=\sum\limits_{j=1}^n\dfrac1j\left(1-\dfrac1j\right) \end{matrix}


(2) 第一次产生记录是在 nn 时刻之后,说明在 nn 及之前均没有产生记录,即都不比 X1X_1 大.

P(T>n)=P(X1>X2,X1>X3,,X1>Xn)=1nP(T>n)=P(X_1>X_2\,,X_1>X_3\,,\cdots\,,X_1>X_{n})=\frac1n

于是 P(T<)=limnP(T<n)=1limnP(Tn)=10=1P(T<\infty)=\lim\limits_{n\to\infty}P(T<n)=1-\lim\limits_{n\to\infty}P(T\geq n)=1-0=1

E(T)=1+nP(T=n)=1+P(T>n)=1+1/nE(T)=\sum_1^{+\infty} nP(T=n)=\sum_1^{+\infty} P(T>n)=\sum_1^{+\infty} 1/n,调和级数趋无穷,故 E(T)=E(T)=\infty


(3) 假设 Ty=nT_y=n 时产生记录,则该条件下记录值的分布为

P(XTy<kTy=n)=P(Xn<kXn>y,X1<y,,Xn1<y)=P(y<Xn<k)P(Xn>y)(由各个Xj的独立性)=F(k)F(y)1F(y)(ky时取0)\begin{aligned} P\left(X_{T_y}<k\mid T_y=n\right)&=P\left(X_n<k\mid X_n>y\,,X_1<y\,,\cdots,X_{n-1}<y\right)\\ &=\frac{P\left(y<X_n<k\right)}{P(X_n>y)}\quad(由各个X_j的独立性)\\ &=\dfrac{F(k)-F(y)}{1-F(y)}\quad(k\leq y\ 时取\ 0) \end{aligned}

说明 XTyX_{T_y} 的分布与 TyT_y 的取值 nn 无关,于是二者独立


# 1.11

XX 是一个非负整数值随机变量。对于 z1|z|\leq1,定义函数 P(z)=E[zX]=j=0zjP(X=j)P(z)=E[z^X]=\sum\limits_{j=0}^\infty z^jP(X=j),称为 XX 的概率生成函数.

  1. 证明 dkdzkP(z)z=0=k!P{X=k}\dfrac{\mathrm{d}^{k}}{\mathrm{d}z^{k}}P\left(z\right)|_{z=0}=k\,!\,P\lbrace X=\,k\rbrace
  2. 证明 P{X是偶数}=P(1)+P(1)2P\lbrace X 是偶数\rbrace =\dfrac{P(-1)+P(1)}{2}. 0 视为偶数.
  3. XB(n,p)X\sim B(n\,,p),证明 P{X是偶数}=1+(12p)n2P\lbrace X 是偶数\rbrace ={\dfrac{1+(1-2p)^{n}}{2}}
  4. XP(λ)X\sim P(\lambda),证明 P{X是偶数}=1+e2λ2P\lbrace X 是偶数\rbrace ={\dfrac{1+{\mathrm e}^{-2\lambda}}{2}}
  5. XG(p)X\sim G(p),证明 P{X是偶数}=1p2pP\lbrace X 是偶数\rbrace ={\dfrac{1-p}{2-p}}
  6. XX 服从参数为 rrpp 的负二项分布,证明 P{X是偶数}=12[1+(1)r(p2p)r]P\lbrace X 是偶数\rbrace =\dfrac12\left[1+(-1)^r\left(\dfrac{p}{2-p}\right)^r\right].(负二项分布:Bernoulli 试验中,恰好成功 rr 次时的试验次数,其中试验成功的概率为 pp

解:

(1) 幂级数在其收敛域内可逐项求导,于是

dkdzkP(z)=j=0dkzjdzkP(X=j)=j=kdkzjdzkP(X=j)=dkzkdzkP(X=k)+j=k+1ajzjk(ajR)=k!P(X=k)+j=k+1ajzjk(ajR)\begin{aligned} \dfrac{\mathrm{d}^{k}}{\mathrm{d}z^{k}}P(z)&=\sum\limits_{j=0}^\infty\dfrac{\mathrm{d}^{k}z^j}{\mathrm{d}z^{k}}P\left(X=j\right)\\ &=\sum\limits_{j=k}^\infty\dfrac{\mathrm{d}^{k}z^j}{\mathrm{d}z^{k}}P\left(X=j\right)\\ &=\dfrac{\mathrm{d}^{k}z^k}{\mathrm{d}z^{k}}P\left(X=k\right)+\sum\limits_{j=k+1}^\infty a_jz^{j-k}\quad(a_j\in\mathbb{R})\\ &=k\,!\,P\left(X=k\right)+\sum\limits_{j=k+1}^\infty a_jz^{j-k}\quad(a_j\in\mathbb{R}) \end{aligned}

代入 z=0z=0 后求和项为 0,原式得证.


(2) 从右往左证.

P(1)+P(1)2=12(j=0(1)jP(X=j)+j=0(1)jP(X=j))=12(j=0(1+(1)j)P(X=j))=12(j=02P(X=2j))=j=0P(X=2j)=P{X是偶数}\begin{aligned} \dfrac{P(-1)+P(1)}{2}&=\frac12\left(\sum\limits_{j=0}^\infty (-1)^jP\left(X=j\right)+\sum\limits_{j=0}^\infty (-1)^jP\left(X=j\right)\right)\\ &=\frac12\left(\sum\limits_{j=0}^\infty \left(1+(-1)^j\right)P\left(X=j\right)\right)\\ &=\frac12\left(\sum\limits_{j=0}^\infty \,2P\left(X=2j\right)\right)\\ &=\sum\limits_{j=0}^\infty P\left(X=2j\right)\\ &=P\lbrace X 是偶数\rbrace \end{aligned}


(3) 由二项分布,P(X=j)=(nj)pj(1p)njP\left(X=j\right)=\displaystyle\binom{n}{j}p^j(1-p)^{n-j},于是

P(z)=j=0nzj(nj)pj(1p)nj=j=0n(nj)(zp)j(1p)nj=(zp+1p)nP(z)=\sum\limits_{j=0}^n z^j\binom{n}{j}p^j(1-p)^{n-j}=\sum\limits_{j=0}^n \binom{n}{j}(zp)^j(1-p)^{n-j}=\left(zp+1-p\right)^n

于是 P(1)=(12p)nP(-1)=(1-2p)^nP(1)=1P(1)=1,代入 (2) 所得结论即得 P{X是偶数}=1+(12p)n2P\lbrace X 是偶数\rbrace ={\dfrac{1+(1-2p)^{n}}{2}}


(4) 由 Poisson 分布,P(X=j)=λjeλj!P\left(X=j\right)=\dfrac{\lambda^j\,{\mathrm e}^{-\lambda}}{j\,!},于是

P(z)=j=0zjλjeλj!=ezλλj=0(zλ)jezλj!=ezλλP(z)=\sum\limits_{j=0}^\infty z^j\dfrac{\lambda^j\,{\mathrm e}^{-\lambda}}{j\,!}={\mathrm e}^{z\lambda-\lambda}\sum\limits_{j=0}^\infty\dfrac{(z\lambda)^j\,{\mathrm e}^{-z\lambda}}{j\,!}={\mathrm e}^{z\lambda-\lambda}

于是 P(1)=e2λP(-1)={\mathrm e}^{-2\lambda}P(1)=1P(1)=1,代入 (2) 所得结论即得 P{X是偶数}=1+e2λ2P\lbrace X 是偶数\rbrace ={\dfrac{1+{\mathrm e}^{-2\lambda}}{2}}


(5) 由几何分布,P(X=j)={(1p)j1p,j>00,j=0P\left(X=j\right)=\begin{cases}(1-p)^{j-1}p\,,j>0\\0\quad\quad\quad\quad\,\,,j=0\end{cases},于是

P(z)=j=1zj(1p)j1p=p1pj=1(zzp)j=p(zzp)(1p)(1z+zp)=zp1z+zpP(z)=\sum\limits_{j=1}^\infty z^j(1-p)^{j-1}p=\dfrac{p}{1-p}\sum\limits_{j=1}^\infty (z-zp)^j=\dfrac{p(z-zp)}{(1-p)(1-z+zp)}=\dfrac{zp}{1-z+zp}

于是 P(1)=p2pP(-1)=\dfrac{-p}{2-p}P(1)=pp=1P(1)=\dfrac{p}{p}=1,代入 (2) 所得结论即得 P{X是偶数}=2pp2(2p)=1p2pP\left\{X是偶数\right\}=\dfrac{2-p-p}{2(2-p)}=\dfrac{1-p}{2-p}{}


(6) 由负二项分布,P(X=j)=(j1r1)pr(1p)jr,jrP\left(X=j\right)=\displaystyle\binom{j-1}{r-1}p^r(1-p)^{j-r}\,,j\geq r,于是

P(z)=j=rzj(j1r1)pr(1p)jr=(zp1z+zp)rj=r(j1r1)(1z+zp)r(zzp)jr=(zp1z+zp)r\begin{aligned} P(z)&=\sum\limits_{j=r}^\infty z^j\displaystyle\binom{j-1}{r-1}p^r(1-p)^{j-r}\\ &=\left(\dfrac{zp}{1-z+zp}\right)^r\sum\limits_{j=r}^\infty\binom{j-1}{r-1}\left(1-z+zp\right)^r(z-zp)^{j-r}\\ &=\left(\dfrac{zp}{1-z+zp}\right)^r \end{aligned}

于是 P(1)=(p2p)rP(-1)=\left(\dfrac{-p}{2-p}\right)^rP(1)=(pp)r=1P(1)=\left(\dfrac{p}{p}\right)^r=1,代入 (2) 所得结论即得 P{X是偶数}=12[1+(1)r(p2p)r]P\lbrace X 是偶数\rbrace =\dfrac12\left[1+(-1)^r\left(\dfrac{p}{2-p}\right)^r\right]


# 1.17

连续随机变量 X1,X2,X_1,X_2,\cdots 独立同分布,其分布函数记为 FF. 以 Xi,nX_{i,n}X1XnX_1\sim X_n 中第 ii 小值,记其分布函数为 Fi,nF_{i,n}. 证明:

  1. Fi,n(x)=F(x)Fi1,n1(x)+F(x)Fi,n1(x)F_{i,n}(x)=F(x)F_{i-1,n-1}(x)+\overline{F}(x)F_{i,n-1}(x)
  2. Fi,n1(x)=inFi+1,n(x)+ninFi,n(x)F_{i,n-1}(x)=\dfrac inF_{i+1,n}(x)+\dfrac{n-i}{n}F_{i,n}(x)

解:

(1) 取条件于是否有 XnxX_n\leq x.

P(Xi,n<x)=P(Xi,n<xXnx)P(Xnx)+P(Xi,n<xXn>x)P(Xn>x)P(X_{i,n}<x)=P(X_{i,n}<x\mid X_n\leq x)P(X_n\leq x)+P(X_{i,n}<x\mid X_n>x)P(X_n>x)

对于 “nn 个数中选第 ii 小值比 xx 小” 这个事:

  • XnxX_n\leq x,那么相当于剔除占位的 XnX_n、在余下的 n1n-1 个数选第 i1i-1 小值比 xx 小;
  • Xn>xX_n>x,那么剔除这个很大的 XnX_n 不影响第 ii 小的位置,相当于在余下的 n1n-1 个数选第 ii 小值比 xx 小.

于是

Fi,n(x)=P(Xi,n<x)=P(Xi1,n1<x)P(Xnx)+P(Xi,n1<x)P(Xn>x)=Fi1,n1(x)F(x)+Fi,n1(x)F(x)\begin{aligned} F_{i,n}(x)=P(X_{i,n}<x)&=P(X_{i-1,n-1}<x)P(X_n\leq x)+P(X_{i,n-1}<x)P(X_n>x)\\ &=F_{i-1,n-1}(x)F(x)+F_{i,n-1}(x)\overline{F}(x) \end{aligned}


(2) 取条件于 XnX_n 是否比第 ii 小值大(即 XnX_n 插入增序列的位置在第 ii 名之后还是之前。是否取等并不重要,因为连续型变量取等概率为 0).

P(Xi,n1<x)=P(Xi,n1<xXn>Xi,n)P(Xn>Xi,n)+P(Xi,n1<xXnXi,n)P(XnXi,n)P(X_{i,n-1}<x)=P(X_{i,n-1}<x\mid X_n>X_{i,n})P(X_n>X_{i,n})+P(X_{i,n-1}<x\mid X_n\leq X_{i,n})P(X_n\leq X_{i,n})

对于 “n1n-1 个数中选第 ii 小值比 xx 小” 这个事:

  • XnX_n 插在 ii 之后,则这个很大的 XnX_n 不会影响第 ii 小元素的位置,因此 P=P(Xi,n<x)P=P(X_{i,n}<x)
  • XnX_n 插在 ii 之前,则第 ii 小值变为第 i+1i+1 小值,因此 P=P(Xi+1,n<x)P=P(X_{i+1,n}<x).

由独立同分布,每个人有均等的机会成为第 ii 小,故 P(Xn>Xi,n)=ninP(X_n>X_{i,n})=\dfrac{n-i}{n}P(XnXi,n)=inP(X_n\leq X_{i,n})=\dfrac{i}{n}. 于是

Fi,n1(x)=P(Xi,n1<x)=P(Xi,n<x)nin+P(Xi+1,n<x)in=Fi,n(x)nin+Fi+1,n(x)in\begin{aligned} F_{i,n-1}(x)=P(X_{i,n-1}<x)&=P(X_{i,n}<x)\dfrac{n-i}{n}+P(X_{i+1,n}<x)\dfrac{i}{n}\\ &=F_{i,n}(x)\dfrac{n-i}{n}+F_{i+1,n}(x)\dfrac in \end{aligned}


# 1.20

在区间 (0,x)\left(0,x\right) 上进行填装。称如下操作为一次生成:生成一个开区间,其长度为 11、左端点服从 (0,x1)\left(0,x-1\right) 上的均匀分布。填装规则如下:首先生成一个开区间,记作 I1I_1,填入区间 (0,x)\left(0,x\right);重复生成开区间,直到这个开区间不与 I1IkI_1\sim I_{k} 中任意一个相交,记为 Ik+1I_{k+1},填入区间。反复执行上述操作,直到 (0,x)\left(0,x\right) 上无法再容下一个单位区间。记最终填入的开区间数量为 N(x)N(x)、再令 M(x)=E[N(x)]M(x)=E\left[N(x)\right]. 证明:

M(x)={0,x<12x10x1M(y)dy+1,x>1M(x)=\begin{cases}0,x<1\\\dfrac{2}{x-1}\displaystyle\int_0^{x-1}M(y){\mathrm d}y+1,x>1\end{cases}

解:

x<1x<1 时填不下任何一个区间,显然有 N(x)=0E(N(x))=0N(x)=0\Rightarrow E(N(x))=0.

x>1x>1 时。只有第一次是没有空间限制的、且其位置分布已知,故取条件于 I1I_1 左端点的位置 yy. 填入 I1I_1 后,将区间分成两个子区间,左侧长度 yy、右侧长度 x(y+1)x-(y+1),于是原问题分解为两个子问题

E(N(x)Y=y)=E(1+N(y)+N(xy1))=1+E(N(y))+E(N(xy1))E(N(x)\mid Y=y)=E(1+N(y)+N(x-y-1))=1+E(N(y))+E(N(x-y-1))

于是

E(N(x))=E[E(N(x)Y)]=0x1[1+E(N(y))+E(N(xy1))]f(x)dy=1x10x11+E(N(y))+E(N(xy1))dyM(x)=x1x1+1x10x1M(y)dy+1x10x1M(xy1)dy=1+1x10x1M(y)dy+1x10x1M(t)dt(t=xy1)=1+2x10x1M(y)dy\begin{aligned} E(N(x))&=E\big[E(N(x)\mid Y)\big]=\displaystyle\int_0^{x-1}\big[1+E(N(y))+E(N(x-y-1))\big]f(x){\mathrm d}y\\ &=\dfrac{1}{x-1}\displaystyle\int_0^{x-1}1+E(N(y))+E(N(x-y-1))\, {\mathrm d}y\\ M(x)&=\dfrac{x-1}{x-1}+\dfrac{1}{x-1}\displaystyle\int_0^{x-1}M(y)\,{\mathrm d}y+\dfrac{1}{x-1}\displaystyle\int_0^{x-1}M(x-y-1)\, {\mathrm d}y\\ &=1+\dfrac{1}{x-1}\displaystyle\int_0^{x-1}M(y)\,{\mathrm d}y+\dfrac{1}{x-1}\displaystyle\int_0^{x-1}M(t)\,{\mathrm d}t\quad(令\,t=x-y-1)\\ &=1+\dfrac{2}{x-1}\displaystyle\int_0^{x-1}M(y)\,{\mathrm d}y \end{aligned}


# 1.22

定义 XX 对给定 YY 的条件方差 Var(XY)=E[(XE(XY))2Y]\mathrm{Var}\left(X\mid Y\right)=E\big[\left(X-E(X\mid Y)\right)^2\mid Y\big]. 证明:

Var(X)=E[Var(XY)]+Var(E[XY])\mathrm{Var}(X)=E\big[\mathrm{Var}(X\mid Y)\big]+\mathrm{Var}(E[X\mid Y])

解:

RHS=E[E[(XE(XY))2Y]]+Var(E[XY])=E[E[X2Y]E[2XE(XY)Y]+E[E2(XY)Y]]+E[E2(XY)]E2[E[XY]]=E[E[X2Y]]E[E[2XE(XY)Y]]+E[E[E2(XY)Y]]+同上同上=E[X2]E[2E(XY)E[XY]]+E[E2(XY)Y]+同上同上=E[X2]2E[E2(XY)]+E[E2(XY)]+E[E2(XY)]E2[X]=E[X2]E2[X]=Var(X)\begin{aligned} \text{RHS}&=E\big[E[\left(X-E(X\mid Y)\right)^2\mid Y]\,\big]+\mathrm{Var}(E[X\mid Y])\\ &=E\big[E[X^2\mid Y]-E[\,2XE(X\mid Y)\mid Y]+E[E^2(X\mid Y)\mid Y]\big]+E\big[E^2(X\mid Y)\big]-E^2\big[E[X\mid Y]\big]\\ &=E\big[E[X^2\mid Y]\big]-E\big[E[\,2XE(X\mid Y)\mid Y]\big]+E\big[E[E^2(X\mid Y)\mid Y]\big]+同上-同上\\ &=E[X^2]-E\big[2E(X\mid Y)E[X\mid Y]\big]+E[E^2(X\mid Y)\mid Y]+同上-同上\\ &=E[X^2]-2E\big[E^2(X\mid Y)\big]+E\big[E^2(X\mid Y)\big]+E\big[E^2(X\mid Y)\big]-E^2[X]\\ &=E[X^2]-E^2[X]\\ &=\mathrm{Var}(X) \end{aligned}

使用此公式计算例 1.5B 的方差.

Var(XY=1)=0Var(XY=2)=Var(X)Var(XY=3)=Var(X)}E[Var(XY)]=23Var(X)\left.\begin{aligned} \mathrm{Var}(X\mid Y=1)&=0\\ \mathrm{Var}(X\mid Y=2)&=\mathrm{Var}(X)\\ \mathrm{Var}(X\mid Y=3)&=\mathrm{Var}(X)\\ \end{aligned}\right\} \Rightarrow E\big[\mathrm{Var}(X\mid Y)\big]=\dfrac23\mathrm{Var}(X)

E(XY=1)=2E(XY=2)=3+E(X)E(XY=3)=5+E(X)}Var(E[XY])=19(2E2(X)+8E(X)+14)\left. \begin{aligned} E(X\mid Y=1)&=2\\ E(X\mid Y=2)&=3+E(X)\\ E(X\mid Y=3)&=5+E(X)\\ \end{aligned} \right\} \Rightarrow\mathrm{Var}(E[X\mid Y])=\dfrac{1}{9}\big(2E^2(X)+8E(X)+14\big)

代入 E(X)=M(0)=10E(X)=M'(0)=10,得 Var(E[XY])=2949\mathrm{Var}(E[X\mid Y])=\dfrac{294}{9},于是 Var(X)=23Var(X)+2949\mathrm{Var}(X)=\dfrac23\mathrm{Var}(X)+\dfrac{294}{9},解得

Var(X)=2943=98\mathrm{Var}(X)=\dfrac{294}{3}=98

验证:E(X2)=M(0)=198E(X^2)=M''(0)=198Var(X)=E(X2)E2(X)=198102=98\mathrm{Var}(X)=E(X^2)-E^2(X)=198-10^2=98.


# 1.29

X1XnX_1\sim X_n 独立同分布、服从 E(λ)E(\lambda). 证明 1nXi\sum\limits_1^n X_i 的密度函数为

f(x)=λeλx(λx)n1/(n1)!f(x)=\lambda {\mathrm e}^{-\lambda x}(\lambda x)^{n-1}/(n-1)!

这样的分布称为参数为 (n,λ)(n,\lambda) 的 gamma 分布.

解:

XiX_i 的矩母函数 ψi(t)=λλt\psi_i(t)=\dfrac{\lambda}{\lambda-t}. 则 Xi\sum\limits X_i 的矩母函数

ψs(t)=E(etXi)=E(etX1etX2etXn)=E(etX1)E(etX2)E(etXn)=ψ1(t)ψ2(t)ψn(t)=(λλt)n\begin{aligned} \psi_s(t)=E({\mathrm e}^{t\sum\limits X_i})&=E({\mathrm e}^{tX_1}\cdot{\mathrm e}^{tX_2}\cdots{\mathrm e}^{tX_n})\\ &=E({\mathrm e}^{tX_1})\cdot E({\mathrm e}^{tX_2})\cdots E({\mathrm e}^{tX_n})\\ &=\psi_1(t)\psi_2(t)\cdots\psi_n(t)\\ &=\left(\dfrac{\lambda}{\lambda-t}\right)^n\\ \end{aligned}

题示密度函数对应的矩母函数为

0+etxf(x)dx=λn(n1)!0+e(tλ)xxn1dx=λn(n1)!0+1λte(tλ)x(n1)xn2dx=λn(n1)!n1λt0+1λte(tλ)x(n2)xn3dx==λn(n1)!(n1)!(λt)n10+e(tλ)xdx=(λλt)n\begin{aligned} \displaystyle\int_0^{+\infty}{\mathrm e}^{tx}f(x)\,{\mathrm d}x&=\dfrac{\lambda^n}{(n-1)!}\displaystyle\int_0^{+\infty}{\mathrm e}^{(t-\lambda)x}x^{n-1}\,{\mathrm d}x\\ &=\dfrac{\lambda^n}{(n-1)!}\displaystyle\int_0^{+\infty}\dfrac{1}{\lambda-t}{\mathrm e}^{(t-\lambda)x}(n-1)x^{n-2}\,{\mathrm d}x\\ &=\dfrac{\lambda^n}{(n-1)!}\dfrac{n-1}{\lambda-t}\displaystyle\int_0^{+\infty}\dfrac{1}{\lambda-t}{\mathrm e}^{(t-\lambda)x}(n-2)x^{n-3}\,{\mathrm d}x\\ &=\cdots \\ &=\dfrac{\lambda^n}{(n-1)!}\dfrac{(n-1)!}{(\lambda-t)^{n-1}}\displaystyle\int_0^{+\infty}{\mathrm e}^{(t-\lambda)x}\,{\mathrm d}x\\ &=\left(\dfrac{\lambda}{\lambda-t}\right)^n \end{aligned}

由矩母函数唯一性即得证.


# 1.34

X1X_1X2X_2 连续非负、独立,它们的失效率函数分别为 λ1(t)\lambda_1(t)λ2(t)\lambda_2(t). 证明:

P{X1<X2min(X1,X2)=t}=λ1(t)λ1(t)+λ2(t)P\{X_{1}\lt X_{2}\mid\min(X_{1}\,,X_{2})=t\}={\frac{\lambda_{1}(t)}{\lambda_{1}(t)+\lambda_{2}(t)}}

解:

LHS=P(X1=t,X2>t)P(min(X1,X2)=t)=P(X1=t)P(X2>t)P(X1=t)P(X2>t)+P(X2=t)P(X1>t)=f1(t)dtF2(t)f1(t)dtF2(t)+f2(t)dtF1(t)=f1(t)/F1(t)f1(t)/F1(t)+f2(t)/F2(t)=λ1(t)λ1(t)+λ2(t)\begin{aligned} \text{LHS}&=\dfrac{P(X_1=t\,,X_2>t)}{P(\min(X_1,X_2)=t)}\\ &=\dfrac{P(X_1=t)\cdot P(X_2>t)}{P(X_1=t)P(X_2>t)+P(X_2=t)P(X_1>t)}\\ &=\dfrac{f_1(t)\mathrm{d}t\cdot\overline{F_2}(t)}{f_1(t)\mathrm{d}t\cdot\overline{F_2}(t)+f_2(t)\mathrm{d}t\cdot\overline{F_1}(t)}\\ &=\dfrac{f_1(t)/\overline{F_1}(t)}{f_1(t)/\overline{F_1}(t)+f_2(t)/\overline{F_2}(t)}\\ &=\dfrac{\lambda_1(t)}{\lambda_1(t)+\lambda_2(t)} \end{aligned}

# 1.35

随机变量 XX 的密度函数 f(x)f(x)、矩母函数 M(t)=E(etX)M(t)=E(\mathrm{e}^{tX}). 定义它的倾斜密度函数

ft(x)=etxf(x)M(t)f_t(x)=\dfrac{\mathrm{e}^{tx}f(x)}{M(t)}

令随机变量 XtX_t 具有密度函数 ft(x)f_t(x)

  1. 证明对任意函数 h(x)h(x)E(h(x))=M(t)E[etXth(Xt)]E\left(h(x)\right)=M(t)E\big[{\mathrm e}^{-tX_t}h(X_t)\big]
  2. 证明对于 t>0t>0,有 P(X>a)M(t)etaP(Xt>a)P(X>a)\leq M(t){\mathrm e}^{-ta}P(X_t>a)
  3. 证明:若 E(Xt)=aE(X_{t^\star })=a,那么 mintM(t)eta=M(t)eta\min\limits_tM(t)\mathrm{e}^{-ta}=M(t^\star)\mathrm{e}^{-t^\star a}{}

解:

(1)

E(h(X))=+inftyh(x)f(x)dx=+h(x)M(t)ft(x)etxdx=M(t)+etxh(x)ft(x)dx\begin{aligned} E(h(X))&=\displaystyle\int_{-\infty}^{+infty}h(x)f(x)\,{\rm d}x\\ &=\displaystyle\int_{-\infty}^{+\infty}h(x)M(t)f_t(x){\rm e}^{-tx}\,{\rm d}x\\ &=M(t)\displaystyle\int_{-\infty}^{+\infty}{\rm e}^{-tx}h(x)f_t(x)\,{\rm d}x \end{aligned}

E(etXth(Xt))=+etxh(x)ft(x)dxE({\rm e}^{-tX_t}h(X_t))=\displaystyle\int_{-\infty}^{+\infty}{\rm e}^{-tx}h(x)f_t(x)\,{\rm d}x,代入即得证.


(2)

P(Xt>a)=a+etxf(x)M(t)dxetaM(t)P(Xt>a)=a+et(xa)f(x)dxa+f(x)dx(因为t>0,x>aet(xa)>1)=P(X>a)\begin{aligned} P(X_t>a)&=\displaystyle\int_a^{+\infty}\dfrac{ {\rm e}^{tx}f(x)}{M(t)}\,{\rm d}x\\ {\rm e}^{-ta}M(t)P(X_t>a)&=\displaystyle\int_a^{+\infty}{\rm e}^{t(x-a)}f(x)\,{\rm d}x\\ &\geqslant\displaystyle\int_a^{+\infty}f(x)\,{\rm d}x\quad(因为\,t>0, x>a\Rightarrow{\rm e}^{t(x-a)}>1)\\ &=P(X>a) \end{aligned}


(3) 令 g(t)=M(t)etag(t)=M(t){\rm e}^{-ta},原命题即证 ming(t)\min g(t)t=tt=t^\star 时取得.

g(t)=aM(t)eta+etaM(t)=aM(t)eta+eta+xetxf(x)dx=eta(aM(t)+M(t)+xetxf(x)M(t)dx)=M(t)eta(E(Xt)a)\begin{aligned} g'(t)&=-aM(t){\rm e}^{-ta}+{\rm e}^{-ta}M'(t)\\ &=-aM(t){\rm e}^{-ta}+{\rm e}^{-ta}\displaystyle\int_{-\infty}^{+\infty}x {\rm e}^{tx}f(x)\,{\rm d}x\\ &={\rm e}^{-ta}\left(-aM(t)+M(t)\displaystyle\int_{-\infty}^{+\infty}\dfrac{x{\rm e}^{tx}f(x)}{M(t)}\,{\rm d}x\right)\\ &=M(t){\rm e}^{-ta}\big(E(X_t)-a\big) \end{aligned}

观察 XtX_t 的密度函数,分母是分子对 xx 的积分,于是 E(Xt)E(X_t)tt 单增、M(t)eta>0M(t){\rm e}^{-ta}>0,故 g(t)g(t) 先减后增,在 E(Xt)=aE(X_t)=a 时取得最小值。而 E(Xt)=aE(X_{t^\star })=a,于是此时 t=tt=t^\star,原命题得证.


# 1.37

X1,X2,X_1,X_2,\cdots 独立同分布。若 Xn1<Xn>Xn+1X_{n-1}<X_n>X_{n+1},则称在时刻 nn 出现了一个峰值。证明:以概率为 11 地,峰值出现的时间比例等于 13\dfrac13.

解:

对某个固定的 kk,由习题 1.6.1,P(k是峰值)=P(Xk1<Xk>Xk+1)=13P(\,k\,是峰值)=P(X_{k-1}<X_k>X_{k+1})=\dfrac13.

Ii={1,i时刻出现峰值0,i时刻不是峰值I_i=\begin{cases}1,\ i\,时刻出现峰值 \\ 0,\ i\,时刻不是峰值\end{cases},再假设共有 nn 个这样的随机变量。记 Nn=1nIiN_n=\sum_1^nI_i,即峰值个数.

I1,,InI_1,\cdots,I_n 独立,则由 Chebyshev 大数定律,Nnn\dfrac{N_n}{n} 以概率 1 地收敛到 E[Ii]=P(i是峰值)=13E[I_i]=P(\,i\,是峰值)=\dfrac13,即峰值出现的时间比例等于 13\dfrac13. 但此处它们并不独立,因为显然当 kk 为峰值时,k+1k+1k1k-1 一定不为峰值.

但是 I1,I4,I7,I_1,I_4,I_7,\cdots 是独立的,可使用 Chebyshev 大数定律,即 I1+I4++I3n2n\dfrac{I_1+I_4+\cdots+I_{3n-2}}{n} 依概率收敛到 13\dfrac13,即

P(limnI1+I4++I3n2n=1/3)=1P\left(\lim\limits_{n\to\infty}\dfrac{I_1+I_4+\cdots+I_{3n-2}}{n}=1/3\right)=1

同理,I2,I5,I8,I_2,I_5,I_8,\cdotsI3,I6,I9,I_3,I_6,I_9,\cdots 是独立的,即

P(limnI2+I5++I3n1n=1/3)=1P(limnI3+I6++I3nn=1/3)=1\begin{aligned} P\left(\lim\limits_{n\to\infty}\dfrac{I_2+I_5+\cdots+I_{3n-1}}{n}=1/3\right)&=1\\ P\left(\lim\limits_{n\to\infty}\dfrac{I_3+I_6+\cdots+I_{3n}}{n}=1/3\right)&=1 \end{aligned}

三式相加即得 P(limnI1+I2++Inn=1/3)=1P\left(\lim\limits_{n\to\infty}\dfrac{I_1+I_2+\cdots+I_{n}}{n}=1/3\right)=1,即峰值出现的时间比例依概率收敛到 1/31/3.


# 1.39

0,1,,n0,1,\cdots,n 从左至右排成一排,一质点每一步等可能地移向它的任意一个邻居。证明:若质点从 00 出发,则到达 nn 的步数之期望为 n2n^2.

解:

考虑质点从 kk 出发,到达 nn 的步数之期望 E(k)E(k). 显然 E(n)=0E(n)=0. 欲求 E(0)E(0).

  • 对于 00,它下一步只能移动到 11,于是 E(0)=1+E(1)E(0)=1+E(1)
  • 对于 1kn11\leqslant k\leqslant n-1,它有 1/2 概率移动到其左侧、1/2 概率移动到其右侧,然后步数加一,即

E(k)=12(E(k1)+1)+12(E(k+1)+1)=12E(k1)+12E(k+1)+1E(k)=\dfrac12\big(E(k-1)+1\big)+\dfrac12\big(E(k+1)+1\big)=\dfrac12E(k-1)+\dfrac12E(k+1)+1

配凑前后项.

12(E(k)E(k1))=12(E(k+1)E(k))+1(E(k)E(k1))=(E(k+1)E(k))+2\begin{aligned} \dfrac12\big(E(k)-E(k-1)\big)&=\dfrac12\big(E(k+1)-E(k)\big)+1\\ \big(E(k)-E(k-1)\big)&=\big(E(k+1)-E(k)\big)+2 \end{aligned}

E(k)E(k1)E(k)-E(k-1) 为公差为 2-2 的等差数列,故设 E(k)E(k1)=2k+aE(k)-E(k-1)=-2k+a. 由 E(1)E(0)=1=2×1+aE(1)-E(0)=-1=-2\times1+aa=1a=1. 取 k=1,2,,nk=1,2,\cdots,n 累加上述递推式得

E(n)E(0)=2(1+n)n2+na=nn2+n=n2E(n)-E(0)=-2\cdot\dfrac{(1+n)n}{2}+na=-n-n^2+n=-n^2

于是 E(0)=E(n)+n2=n2E(0)=E(n)+n^2=n^2.


# 1.41

考虑由一个中心和 rr 条射线组成的星形图,其中一条射线由 mm 个顶点组成、其他 r1r-1 条射线由 nn 个顶点组成。质点从 00 出发,每一步都等可能地移向它的邻居,以 PrP_r 记由 mm 个顶点组成的射线上的叶子是最后访问的叶子的概率.

  1. P2P_2.
  2. Pr1P_{r-1} 表达 PrP_r

解:

记由 mm 个顶点组成的射线为 mm 线,其上的叶子为点 AA;由 nn 个顶点组成的射线为 nn 线,其上的叶子为点 Bi(1ir1)B_i\ (1\leqslant i\leqslant r-1)

(1) 记事件 “在访问 AA 前访问 BB 并返回 0” 为事件 SS,则 P2=P(S)P_2=P(S)

P(S先访问m线)=(11m)P(S)P(S先访问n线)=1n+(11n)P(S)\begin{aligned} P(S\mid 先访问m线)&=\left(1-\dfrac1m\right)P(S)\\ P(S\mid 先访问n线)&=\dfrac1n+\left(1-\dfrac1n\right)P(S) \end{aligned}

于是

P(S)=12((11m)P(S)+1n+(11n)P(S))2P(S)=P(S)(1m+1n)P(S)+1n+P(S)P(S)=1n(1/m+1/n)=mn+m\begin{aligned} P(S)&=\dfrac12\left(\left(1-\dfrac1m\right)P(S)+\dfrac1n+\left(1-\dfrac1n\right)P(S)\right)\\ 2P(S)&=P(S)-\left(\dfrac1m+\dfrac1n\right)P(S)+\dfrac1n+P(S)\\ P(S)&=\dfrac{1}{n\left(1/m+1/n\right)}=\dfrac{m}{n+m} \end{aligned}

也即 P2=mn+mP_2=\dfrac{m}{n+m}.


(2) 记事件 “在访问 AA 前访问完所有 Bi(1ir1)B_i\ (1\leqslant i\leqslant r-1) 并返回 0” 为事件 SrS_r,则 Pr=P(Sr)P_{r}=P(S_r)

  • 若先访问 mm 线,则和上述情况一致,P(Sr先访问m线)=(11m)P(Sr)P(S_r\mid 先访问m线)=\left(1-\dfrac1m\right)P(S_r)
  • 若先访问 r1r-1nn 线之一,记这条线为 n0n_0 线
    • 若在返回 0 之前已经走到了 n0n_0 线的叶子,那么下一步就是 “在访问 AA 前访问完 Bi(1ir2)B_i\ (1\leqslant i\leqslant r-2) 并返回 0”,概率为 1nPr1\dfrac1nP_{r-1}
    • 若在返回 0 时没走到 n0n_0 线的叶子,那么相等于没有执行任何操作、回到起始情形,概率为 (11n)P(Sr)\left(1-\dfrac1n\right)P(S_r)
    • 于是 P(Sr先访问n线)=1nPr1+(11n)P(Sr)P(S_r\mid 先访问n线)=\dfrac1nP_{r-1}+\left(1-\dfrac1n\right)P(S_r)

于是

P(Sr)=1r((11m)P(Sr))+r1r(1nPr1+(11n)P(Sr))rP(Sr)=P(Sr)(1m+r1n)P(Sr)+r1nPr1+(r1)P(Sr)P(Sr)=(r1)Pr1n(1/m+(r1)/n)=m(r1)Pr1n+m(r1)\begin{aligned} P(S_r)&=\dfrac1r\left(\left(1-\dfrac1m\right)P(S_r)\right)+\dfrac{r-1}{r}\left(\dfrac1nP_{r-1}+\left(1-\dfrac1n\right)P(S_r)\right)\\ rP(S_r)&=P(S_r)-\left(\dfrac1m+\dfrac{r-1}{n}\right)P(S_r)+\dfrac{r-1}{n}P_{r-1}+(r-1)P(S_r)\\ P(S_r)&=\dfrac{(r-1)P_{r-1} }{n\big(1/m+(r-1)/n\big)}=\dfrac{m(r-1)P_{r-1} }{n+m(r-1)} \end{aligned}

也即 Pr=m(r1)Pr1n+m(r1)P_r=\dfrac{m(r-1)P_{r-1} }{n+m(r-1)}.