Sheldon M. Ross "Stochastic Processes" 2nd Edition
随机过程(第二版)习题
# 1.5
n 次独立实验,每次的结果以 p1∼pr 的概率出现 1∼r 之一。记出现结果 i 的个数为 Ni. 计算:
- N1,⋯,Nr 之联合分布
- Cov(Ni,Nj)
- 出现次数为 0 的个数之均值与方差
解:
(1) 先按乘法公式给出单个情形的概率,再乘以重复个数。于是有
P{N1=n1,N2=n2,⋯,Nr=nr}=p1n1p2n2⋯prnr⋅(n1n)(n2n−n1)(n3n−n1−n2) ⋯(nrnr−1+nr)(nrnr)
组合数的乘积,分母是 j=1∏r(nj!),分子是 n 乘到 n−n1、再从 n−n1 乘到 n−n1−n2,一直下去全乘一起就是 n!. 于是所求联合分布
P{N1=n1,N2=n2,⋯,Nr=nr}=p1n1p2n2⋯×j=1∏r(nj!)n!=n!×j=1∏rnj!pjrj
(2) 依题意易知 Ni∼B(n,pi)、Nj∼B(n,pj),于是由二项分布的性质立即有
Var(Ni)=npi(1−pi)Var(Nj)=npj(1−pj)
使用公式 Var(Ni+Nj)=Var(Ni)+Var(Nj)+2 Cov(Ni,Nj) 计算所求值。由
P(Ni+Nj=k)=m=0∑kpimpjk−m(1−pi−pj)n−km!(k−m)!(n−k)!n!=(1−pi−pj)n−k(n−k)!k!n!m=0∑kpimpjk−mm!(k−m)!k!=(1−pi−pj)n−k(kn)m=0∑kpimpjk−m(mk)=(1−pi−pj)n−k(kn)(pi+pj)k=(pi+pj)k(1−pi−pj)n−k(kn)
得,该分布具有二项分布形式,Ni+Nj∼B(n,pi+pj). 于是
Var(Ni+Nj)=npi(1−pi)+npj(1−pj)+2 Cov(Ni,Nj)=n(pi+pj)(1−pi−pj)
移项展开,一次项和平方项恰好消去,解得 Cov(Ni,Nj)=−npipj
(3) 由二项分布有 P(Nj=0)=(1−pj)n. 令 Ij={1,Nj=00,ohters,则出现次数为 0 的个数 V=∑Ij,于是
E(V)D(V)=∑E(Ij)=i=1∑r(1−pj)n=∑D(Ij)+2i<j∑∑Cov(Ii,Ij)=i=1∑rn(1−pj)n(1−(1−pj)n)+2i<j∑∑(E(IiIj)−E(Ii)E(Ij))
其中 E(Ii)=(1−pi)n、E(Ij)=(1−pj)n
事件 IiIj=1 表示 Ni=0 且 Nj=0,于是E(IiIj)=P(Ni=0,Nj=0)=(1−pi−pj)n,代入 D(V) 式即得解.
# 1.6
连续随机变量 X1,X2,⋯ 独立同分布。规定:若 Xn>max(X1,⋯,Xn−1)(其中 X0=−∞),则称在 n 时刻产生了一个记录,记录的值为 Xn.
- 时刻 n 时产生的记录个数记为 Nn,计算 E(Nn) 和 D(Nn)
- 以 T 标记第一次产生记录的时刻 n(n=1 不在本题的考虑范围内),求 P(T>n),并证明 P(T<∞)=1 和 E(T)=∞
- 以 Ty 标记 “第一次产生大于 y 的记录” 的时刻,证明 Ty 与 XTy 独立
解:
(1) 记 Xi 的分布函数为 F(xi)、其 PDF 为 f(xi). 由独立性可求得各个时刻产生记录的概率:
P(X2>X1)=∫−∞+∞∫−∞x2f(x1)f(x2) dx1dx2=∫−∞+∞f(x2)∫−∞x1f(x1) dx1dx2=∫−∞+∞f(x2)F(x2) dx2=∫−∞+∞F(x2) dF(x2)=∫01t dt=21
P(X3>X1,X3>X2)=∫−∞+∞∫−∞x3∫−∞x3f(x1)f(x2)f(x3) dx1dx2dx3=∫−∞+∞∫−∞x3f(x2)f(x3)∫−∞x3f(x1) dx1dx2dx3=∫−∞+∞f(x3)∫−∞x3f(x2)F(x3) dx2dx3=∫−∞+∞f(x3)F(x3)∫−∞x3f(x2) dx2dx3=∫−∞+∞f(x3)F2(x3) dx3=∫−∞+∞F2(x3) dF(x3)=∫01t2 dt=31
同理可依次推得 P(Xn>max(X1,⋯,Xn−1))=n1
令 In={1,n时产生记录0,ohters,显然他们相互独立。于是 Nn=∑1nIj,于是
E(Nn)=j=1∑nE(Ij)=j=1∑nE(Ij)=j=1∑nj1D(Nn)=j=1∑nD(Ij)=j=1∑nj1(1−j1)
(2) 第一次产生记录是在 n 时刻之后,说明在 n 及之前均没有产生记录,即都不比 X1 大.
P(T>n)=P(X1>X2,X1>X3,⋯,X1>Xn)=n1
于是 P(T<∞)=n→∞limP(T<n)=1−n→∞limP(T≥n)=1−0=1
而 E(T)=∑1+∞nP(T=n)=∑1+∞P(T>n)=∑1+∞1/n,调和级数趋无穷,故 E(T)=∞
(3) 假设 Ty=n 时产生记录,则该条件下记录值的分布为
P(XTy<k∣Ty=n)=P(Xn<k∣Xn>y,X1<y,⋯,Xn−1<y)=P(Xn>y)P(y<Xn<k)(由各个Xj的独立性)=1−F(y)F(k)−F(y)(k≤y 时取 0)
说明 XTy 的分布与 Ty 的取值 n 无关,于是二者独立
# 1.11
X 是一个非负整数值随机变量。对于 ∣z∣≤1,定义函数 P(z)=E[zX]=j=0∑∞zjP(X=j),称为 X 的概率生成函数.
- 证明 dzkdkP(z)∣z=0=k!P{X=k}
- 证明 P{X是偶数}=2P(−1)+P(1). 0 视为偶数.
- 若 X∼B(n,p),证明 P{X是偶数}=21+(1−2p)n
- 若 X∼P(λ),证明 P{X是偶数}=21+e−2λ
- 若 X∼G(p),证明 P{X是偶数}=2−p1−p
- 若 X 服从参数为 r 和 p 的负二项分布,证明 P{X是偶数}=21[1+(−1)r(2−pp)r].(负二项分布:Bernoulli 试验中,恰好成功 r 次时的试验次数,其中试验成功的概率为 p)
解:
(1) 幂级数在其收敛域内可逐项求导,于是
dzkdkP(z)=j=0∑∞dzkdkzjP(X=j)=j=k∑∞dzkdkzjP(X=j)=dzkdkzkP(X=k)+j=k+1∑∞ajzj−k(aj∈R)=k!P(X=k)+j=k+1∑∞ajzj−k(aj∈R)
代入 z=0 后求和项为 0,原式得证.
(2) 从右往左证.
2P(−1)+P(1)=21(j=0∑∞(−1)jP(X=j)+j=0∑∞(−1)jP(X=j))=21(j=0∑∞(1+(−1)j)P(X=j))=21(j=0∑∞2P(X=2j))=j=0∑∞P(X=2j)=P{X是偶数}
(3) 由二项分布,P(X=j)=(jn)pj(1−p)n−j,于是
P(z)=j=0∑nzj(jn)pj(1−p)n−j=j=0∑n(jn)(zp)j(1−p)n−j=(zp+1−p)n
于是 P(−1)=(1−2p)n、P(1)=1,代入 (2) 所得结论即得 P{X是偶数}=21+(1−2p)n
(4) 由 Poisson 分布,P(X=j)=j!λje−λ,于是
P(z)=j=0∑∞zjj!λje−λ=ezλ−λj=0∑∞j!(zλ)je−zλ=ezλ−λ
于是 P(−1)=e−2λ、P(1)=1,代入 (2) 所得结论即得 P{X是偶数}=21+e−2λ
(5) 由几何分布,P(X=j)={(1−p)j−1p,j>00,j=0,于是
P(z)=j=1∑∞zj(1−p)j−1p=1−ppj=1∑∞(z−zp)j=(1−p)(1−z+zp)p(z−zp)=1−z+zpzp
于是 P(−1)=2−p−p、P(1)=pp=1,代入 (2) 所得结论即得 P{X是偶数}=2(2−p)2−p−p=2−p1−p
(6) 由负二项分布,P(X=j)=(r−1j−1)pr(1−p)j−r,j≥r,于是
P(z)=j=r∑∞zj(r−1j−1)pr(1−p)j−r=(1−z+zpzp)rj=r∑∞(r−1j−1)(1−z+zp)r(z−zp)j−r=(1−z+zpzp)r
于是 P(−1)=(2−p−p)r、P(1)=(pp)r=1,代入 (2) 所得结论即得 P{X是偶数}=21[1+(−1)r(2−pp)r]
# 1.17
连续随机变量 X1,X2,⋯ 独立同分布,其分布函数记为 F. 以 Xi,n 记 X1∼Xn 中第 i 小值,记其分布函数为 Fi,n. 证明:
- Fi,n(x)=F(x)Fi−1,n−1(x)+F(x)Fi,n−1(x)
- Fi,n−1(x)=niFi+1,n(x)+nn−iFi,n(x)
解:
(1) 取条件于是否有 Xn≤x.
P(Xi,n<x)=P(Xi,n<x∣Xn≤x)P(Xn≤x)+P(Xi,n<x∣Xn>x)P(Xn>x)
对于 “n 个数中选第 i 小值比 x 小” 这个事:
- 若 Xn≤x,那么相当于剔除占位的 Xn、在余下的 n−1 个数选第 i−1 小值比 x 小;
- 若 Xn>x,那么剔除这个很大的 Xn 不影响第 i 小的位置,相当于在余下的 n−1 个数选第 i 小值比 x 小.
于是
Fi,n(x)=P(Xi,n<x)=P(Xi−1,n−1<x)P(Xn≤x)+P(Xi,n−1<x)P(Xn>x)=Fi−1,n−1(x)F(x)+Fi,n−1(x)F(x)
(2) 取条件于 Xn 是否比第 i 小值大(即 Xn 插入增序列的位置在第 i 名之后还是之前。是否取等并不重要,因为连续型变量取等概率为 0).
P(Xi,n−1<x)=P(Xi,n−1<x∣Xn>Xi,n)P(Xn>Xi,n)+P(Xi,n−1<x∣Xn≤Xi,n)P(Xn≤Xi,n)
对于 “n−1 个数中选第 i 小值比 x 小” 这个事:
- 若 Xn 插在 i 之后,则这个很大的 Xn 不会影响第 i 小元素的位置,因此 P=P(Xi,n<x);
- 若 Xn 插在 i 之前,则第 i 小值变为第 i+1 小值,因此 P=P(Xi+1,n<x).
由独立同分布,每个人有均等的机会成为第 i 小,故 P(Xn>Xi,n)=nn−i、P(Xn≤Xi,n)=ni. 于是
Fi,n−1(x)=P(Xi,n−1<x)=P(Xi,n<x)nn−i+P(Xi+1,n<x)ni=Fi,n(x)nn−i+Fi+1,n(x)ni
# 1.20
在区间 (0,x) 上进行填装。称如下操作为一次生成:生成一个开区间,其长度为 1、左端点服从 (0,x−1) 上的均匀分布。填装规则如下:首先生成一个开区间,记作 I1,填入区间 (0,x);重复生成开区间,直到这个开区间不与 I1∼Ik 中任意一个相交,记为 Ik+1,填入区间。反复执行上述操作,直到 (0,x) 上无法再容下一个单位区间。记最终填入的开区间数量为 N(x)、再令 M(x)=E[N(x)]. 证明:
M(x)=⎩⎪⎨⎪⎧0,x<1x−12∫0x−1M(y)dy+1,x>1
解:
x<1 时填不下任何一个区间,显然有 N(x)=0⇒E(N(x))=0.
x>1 时。只有第一次是没有空间限制的、且其位置分布已知,故取条件于 I1 左端点的位置 y. 填入 I1 后,将区间分成两个子区间,左侧长度 y、右侧长度 x−(y+1),于是原问题分解为两个子问题
E(N(x)∣Y=y)=E(1+N(y)+N(x−y−1))=1+E(N(y))+E(N(x−y−1))
于是
E(N(x))M(x)=E[E(N(x)∣Y)]=∫0x−1[1+E(N(y))+E(N(x−y−1))]f(x)dy=x−11∫0x−11+E(N(y))+E(N(x−y−1))dy=x−1x−1+x−11∫0x−1M(y)dy+x−11∫0x−1M(x−y−1)dy=1+x−11∫0x−1M(y)dy+x−11∫0x−1M(t)dt(令t=x−y−1)=1+x−12∫0x−1M(y)dy
# 1.22
定义 X 对给定 Y 的条件方差 Var(X∣Y)=E[(X−E(X∣Y))2∣Y]. 证明:
Var(X)=E[Var(X∣Y)]+Var(E[X∣Y])
解:
RHS=E[E[(X−E(X∣Y))2∣Y]]+Var(E[X∣Y])=E[E[X2∣Y]−E[2XE(X∣Y)∣Y]+E[E2(X∣Y)∣Y]]+E[E2(X∣Y)]−E2[E[X∣Y]]=E[E[X2∣Y]]−E[E[2XE(X∣Y)∣Y]]+E[E[E2(X∣Y)∣Y]]+同上−同上=E[X2]−E[2E(X∣Y)E[X∣Y]]+E[E2(X∣Y)∣Y]+同上−同上=E[X2]−2E[E2(X∣Y)]+E[E2(X∣Y)]+E[E2(X∣Y)]−E2[X]=E[X2]−E2[X]=Var(X)
使用此公式计算例 1.5B 的方差.
Var(X∣Y=1)Var(X∣Y=2)Var(X∣Y=3)=0=Var(X)=Var(X)⎭⎪⎪⎬⎪⎪⎫⇒E[Var(X∣Y)]=32Var(X)
E(X∣Y=1)E(X∣Y=2)E(X∣Y=3)=2=3+E(X)=5+E(X)⎭⎪⎪⎬⎪⎪⎫⇒Var(E[X∣Y])=91(2E2(X)+8E(X)+14)
代入 E(X)=M′(0)=10,得 Var(E[X∣Y])=9294,于是 Var(X)=32Var(X)+9294,解得
Var(X)=3294=98
验证:E(X2)=M′′(0)=198,Var(X)=E(X2)−E2(X)=198−102=98.
# 1.29
X1∼Xn 独立同分布、服从 E(λ). 证明 1∑nXi 的密度函数为
f(x)=λe−λx(λx)n−1/(n−1)!
这样的分布称为参数为 (n,λ) 的 gamma 分布.
解:
Xi 的矩母函数 ψi(t)=λ−tλ. 则 ∑Xi 的矩母函数
ψs(t)=E(et∑Xi)=E(etX1⋅etX2⋯etXn)=E(etX1)⋅E(etX2)⋯E(etXn)=ψ1(t)ψ2(t)⋯ψn(t)=(λ−tλ)n
题示密度函数对应的矩母函数为
∫0+∞etxf(x)dx=(n−1)!λn∫0+∞e(t−λ)xxn−1dx=(n−1)!λn∫0+∞λ−t1e(t−λ)x(n−1)xn−2dx=(n−1)!λnλ−tn−1∫0+∞λ−t1e(t−λ)x(n−2)xn−3dx=⋯=(n−1)!λn(λ−t)n−1(n−1)!∫0+∞e(t−λ)xdx=(λ−tλ)n
由矩母函数唯一性即得证.
# 1.34
X1、X2 连续非负、独立,它们的失效率函数分别为 λ1(t) 和 λ2(t). 证明:
P{X1<X2∣min(X1,X2)=t}=λ1(t)+λ2(t)λ1(t)
解:
LHS=P(min(X1,X2)=t)P(X1=t,X2>t)=P(X1=t)P(X2>t)+P(X2=t)P(X1>t)P(X1=t)⋅P(X2>t)=f1(t)dt⋅F2(t)+f2(t)dt⋅F1(t)f1(t)dt⋅F2(t)=f1(t)/F1(t)+f2(t)/F2(t)f1(t)/F1(t)=λ1(t)+λ2(t)λ1(t)
# 1.35
随机变量 X 的密度函数 f(x)、矩母函数 M(t)=E(etX). 定义它的倾斜密度函数
ft(x)=M(t)etxf(x)
令随机变量 Xt 具有密度函数 ft(x)
- 证明对任意函数 h(x),E(h(x))=M(t)E[e−tXth(Xt)]
- 证明对于 t>0,有 P(X>a)≤M(t)e−taP(Xt>a)
- 证明:若 E(Xt⋆)=a,那么 tminM(t)e−ta=M(t⋆)e−t⋆a
解:
(1)
E(h(X))=∫−∞+inftyh(x)f(x)dx=∫−∞+∞h(x)M(t)ft(x)e−txdx=M(t)∫−∞+∞e−txh(x)ft(x)dx
而 E(e−tXth(Xt))=∫−∞+∞e−txh(x)ft(x)dx,代入即得证.
(2)
P(Xt>a)e−taM(t)P(Xt>a)=∫a+∞M(t)etxf(x)dx=∫a+∞et(x−a)f(x)dx⩾∫a+∞f(x)dx(因为t>0,x>a⇒et(x−a)>1)=P(X>a)
(3) 令 g(t)=M(t)e−ta,原命题即证 ming(t) 在 t=t⋆ 时取得.
g′(t)=−aM(t)e−ta+e−taM′(t)=−aM(t)e−ta+e−ta∫−∞+∞xetxf(x)dx=e−ta(−aM(t)+M(t)∫−∞+∞M(t)xetxf(x)dx)=M(t)e−ta(E(Xt)−a)
观察 Xt 的密度函数,分母是分子对 x 的积分,于是 E(Xt) 随 t 单增、M(t)e−ta>0,故 g(t) 先减后增,在 E(Xt)=a 时取得最小值。而 E(Xt⋆)=a,于是此时 t=t⋆,原命题得证.
# 1.37
X1,X2,⋯ 独立同分布。若 Xn−1<Xn>Xn+1,则称在时刻 n 出现了一个峰值。证明:以概率为 1 地,峰值出现的时间比例等于 31.
解:
对某个固定的 k,由习题 1.6.1,P(k是峰值)=P(Xk−1<Xk>Xk+1)=31.
令 Ii={1, i时刻出现峰值0, i时刻不是峰值,再假设共有 n 个这样的随机变量。记 Nn=∑1nIi,即峰值个数.
若 I1,⋯,In 独立,则由 Chebyshev 大数定律,nNn 以概率 1 地收敛到 E[Ii]=P(i是峰值)=31,即峰值出现的时间比例等于 31. 但此处它们并不独立,因为显然当 k 为峰值时,k+1、k−1 一定不为峰值.
但是 I1,I4,I7,⋯ 是独立的,可使用 Chebyshev 大数定律,即 nI1+I4+⋯+I3n−2 依概率收敛到 31,即
P(n→∞limnI1+I4+⋯+I3n−2=1/3)=1
同理,I2,I5,I8,⋯、I3,I6,I9,⋯ 是独立的,即
P(n→∞limnI2+I5+⋯+I3n−1=1/3)P(n→∞limnI3+I6+⋯+I3n=1/3)=1=1
三式相加即得 P(n→∞limnI1+I2+⋯+In=1/3)=1,即峰值出现的时间比例依概率收敛到 1/3.
# 1.39
0,1,⋯,n 从左至右排成一排,一质点每一步等可能地移向它的任意一个邻居。证明:若质点从 0 出发,则到达 n 的步数之期望为 n2.
解:
考虑质点从 k 出发,到达 n 的步数之期望 E(k). 显然 E(n)=0. 欲求 E(0).
- 对于 0,它下一步只能移动到 1,于是 E(0)=1+E(1);
- 对于 1⩽k⩽n−1,它有 1/2 概率移动到其左侧、1/2 概率移动到其右侧,然后步数加一,即
E(k)=21(E(k−1)+1)+21(E(k+1)+1)=21E(k−1)+21E(k+1)+1
配凑前后项.
21(E(k)−E(k−1))(E(k)−E(k−1))=21(E(k+1)−E(k))+1=(E(k+1)−E(k))+2
即 E(k)−E(k−1) 为公差为 −2 的等差数列,故设 E(k)−E(k−1)=−2k+a. 由 E(1)−E(0)=−1=−2×1+a 得 a=1. 取 k=1,2,⋯,n 累加上述递推式得
E(n)−E(0)=−2⋅2(1+n)n+na=−n−n2+n=−n2
于是 E(0)=E(n)+n2=n2.
# 1.41
考虑由一个中心和 r 条射线组成的星形图,其中一条射线由 m 个顶点组成、其他 r−1 条射线由 n 个顶点组成。质点从 0 出发,每一步都等可能地移向它的邻居,以 Pr 记由 m 个顶点组成的射线上的叶子是最后访问的叶子的概率.
- 求 P2.
- 用 Pr−1 表达 Pr
解:
记由 m 个顶点组成的射线为 m 线,其上的叶子为点 A;由 n 个顶点组成的射线为 n 线,其上的叶子为点 Bi (1⩽i⩽r−1)
(1) 记事件 “在访问 A 前访问 B 并返回 0” 为事件 S,则 P2=P(S)
P(S∣先访问m线)P(S∣先访问n线)=(1−m1)P(S)=n1+(1−n1)P(S)
于是
P(S)2P(S)P(S)=21((1−m1)P(S)+n1+(1−n1)P(S))=P(S)−(m1+n1)P(S)+n1+P(S)=n(1/m+1/n)1=n+mm
也即 P2=n+mm.
(2) 记事件 “在访问 A 前访问完所有 Bi (1⩽i⩽r−1) 并返回 0” 为事件 Sr,则 Pr=P(Sr)
- 若先访问 m 线,则和上述情况一致,P(Sr∣先访问m线)=(1−m1)P(Sr);
- 若先访问 r−1 条 n 线之一,记这条线为 n0 线
- 若在返回 0 之前已经走到了 n0 线的叶子,那么下一步就是 “在访问 A 前访问完 Bi (1⩽i⩽r−2) 并返回 0”,概率为 n1Pr−1;
- 若在返回 0 时没走到 n0 线的叶子,那么相等于没有执行任何操作、回到起始情形,概率为 (1−n1)P(Sr)
- 于是 P(Sr∣先访问n线)=n1Pr−1+(1−n1)P(Sr)
于是
P(Sr)rP(Sr)P(Sr)=r1((1−m1)P(Sr))+rr−1(n1Pr−1+(1−n1)P(Sr))=P(Sr)−(m1+nr−1)P(Sr)+nr−1Pr−1+(r−1)P(Sr)=n(1/m+(r−1)/n)(r−1)Pr−1=n+m(r−1)m(r−1)Pr−1
也即 Pr=n+m(r−1)m(r−1)Pr−1.