Skip to content

概率论-多维随机变量

多维随机变量及其分布

二维随机变量

二维随机变量 (X,Y)\displaystyle{ \left( X , Y \right) },对任意实数 x,y\displaystyle{ x , y },二元函数

F(x,y)=P(Xx,Yy),<x,y<+F(x,y)=P(X \leqslant x, Y \leqslant y), -\infty < x,y < +\infty

称为二维随机变量 (X,Y)\displaystyle{ \left( X , Y \right) } 的分布函数,或称随机变量 X\displaystyle{ X }Y\displaystyle{ Y } 的联合分布

性质
  • 0F(x,y)10 \leqslant F(x,y) \leqslant 1
  • F(,y)=F(x,)=F(,)=0,F(+,+)=1F(-\infty, y)=F(x,-\infty)=F(-\infty, -\infty)=0, F(+\infty, +\infty)=1
  • 关于 x,y\displaystyle{ x , y } 均单调不减
  • 关于 x,y\displaystyle{ x , y } 均右连续
  • P(a<Xb,c<Yd)=F(b,d)+F(a,c)F(b,c)F(a,d)P(a<X \leqslant b,c < Y \leqslant d)=F(b,d)+F(a,c)-F(b,c)-F(a,d)

边缘分布

FX(x)=P(Xx)=P(Xx,Y<+)=F(x,+)FY(y)=P(Yy)=P(X<+,Yy)=F(+,y)\begin{aligned} F_{X}(x) & = P(X \leqslant x) = P(X \leqslant x, Y < +\infty)=F(x,+\infty) \\ F_{Y}(y) & = P(Y \leqslant y) = P(X < +\infty, Y \leqslant y)=F(+\infty, y) \end{aligned}

条件概率

FXY(xy)=P(XxY=y)=limε0+P(Xxyε<Yy+ε)=limε0+P(Xx,yε<Yy+ε)P(yε<Yy+ε)\begin{aligned} F_{X|Y}(x \mid y) & = P(X \leqslant x \mid Y=y) \\ & = \lim_{\varepsilon \to 0^{+} }P(X \leqslant x \mid y - \varepsilon < Y \leqslant y + \varepsilon) \\ & = \lim_{\varepsilon \to 0^{+} } { P(X \leqslant x, y - \varepsilon < Y \leqslant y + \varepsilon) \over P(y - \varepsilon < Y \leqslant y + \varepsilon) } \end{aligned}

二维离散型随机变量

分布律——画二维表

二维连续型随机变量

F(x,y)=xyf(u,v)dudvF(x,y)=\int_{-\infty}^{x}\int_{-\infty}^{y}f(u,v) \mathrm{d}u \mathrm{d}v ++f(x,y)dxdy=1\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}f(x,y) \mathrm{d}x \mathrm{d}y=1 P((X,Y)D)=Df(x,y)dxdyP((X,Y) \in D) = \iint_{D}f(x,y) \mathrm{d} x \mathrm{d} y

边缘密度

fX(x)=+f(x,y)dyfY(y)=+f(x,y)dx\begin{aligned} f_{X}(x) & = \int _{-\infty} ^{+\infty} f(x,y) \mathrm{d} y \\ f_{Y}(y) & = \int _{-\infty} ^{+\infty} f(x,y) \mathrm{d} x \\ \end{aligned}

条件密度

条件分布

FXY(xy)=xf(s,y)fY(y)dsF_{X|Y}(x \mid y) = \int _{-\infty} ^{x} {f(s,y) \over f_{Y} (y)} \mathrm{d} s

在条件 Y=y\displaystyle{ Y = y } 下的条件密度

fXY(xy)=f(x,y)fY(y),fY(y)>0f_{X|Y}(x \mid y) = {f(x,y) \over f_{Y}(y)}, f_{Y}(y) > 0

随机变量的独立性

定义

如果对任意 x,y\displaystyle{ x , y } 都有

P{Xx,Yy}=P{Xx}PYyF(x,y)=FX(x)FY(y)\begin{aligned} P\{X \leqslant x, Y \leqslant y\} &= P\{ X \leqslant x\}P{Y \leqslant y} \\ F(x,y)&=F_{X}(x)F_{Y}(y) \end{aligned}

则称随机变量 X,Y\displaystyle{ X , Y } 相互独立

离散型随机变量 X\displaystyle{ X }Y\displaystyle{ Y } 相互独立的充要条件

对任意 i,j=1,2,i, j=1,2,\cdots 成立

P{X=xi,Y=yj}=P{X=xi}P{Y=yj}\displaystyle{ P \left\lbrace X = x _{ i } , Y = y _{ j } \right\rbrace = P \left\lbrace X = x _{ i } \right\rbrace P \left\lbrace Y = y _{ j } \right\rbrace }

pij=pipj\displaystyle{ p _{ i j } = p _{ i } p _{ j } },表现为表格行的边缘概率列的边缘概率乘积等于行列所在的单元格的概率

二维均匀分布和二维正态分布

定义

如果二维连续型随机变量 (X,Y)\displaystyle{ \left( X , Y \right) } 的概率密度为

f(x,y)={1A,(x,y)G0,elsef(x,y)=\begin{cases}{1\over A}, &(x,y)\in G \\ 0, & \text{else}\end{cases}

其中 A\displaystyle{ A } 是平面有界区域 G\displaystyle{ G } 的面积,则称 (X,Y)\displaystyle{ \left( X , Y \right) } 服从区域 G\displaystyle{ G } 熵的均匀分布

二维正态分布

(X,Y)N(μ1,μ2;σ1,σ2;ρ)(X,Y) \sim N(\mu_{1},\mu_{2};\sigma_{1},\sigma_{2}; \rho)

其中 μ1,μ2,σ1>0,σ2>0,1<ρ<1\mu_{1},\mu_{2},\sigma_{1}>0, \sigma_{2}>0, -1 < \rho < 1. 对于满足二维正态分布的随机变量 (X,Y)\displaystyle{ \left( X , Y \right) },有

  • XN(μ1,σ12),YN(μ2,σ22)X \sim N(\mu_{1},\sigma_{1}^{2}), Y \sim N(\mu_{2}, \sigma_{2}^{2})
  • X\displaystyle{ X }Y\displaystyle{ Y } 相互独立的充要条件是 ρ=0\rho=0
  • aX+bYN(aμ1+bμ2,a2σ12+2abσ1σ2ρ+b2σ22)aX+bY \sim N(a\mu_{1}+b\mu_{2}, a^{2}\sigma_{1}^{2}+2ab\sigma_{1}\sigma_{2}\rho +b^{2}\sigma_{2}^{2})
  • abbc0ab-bc \ne 0 时,(aX+bY,cX+dY)\displaystyle{ \left( a X + b Y , c X + d Y \right) } 也一定是二维正态分布

两个随机变量函数 Z=g(X,Y)\displaystyle{ Z = g \left( X , Y \right) } 的分布

均为离散型

和一维离散型类似

均为连续型

FZ(z)=P(Zz)=P(g(X,Y)z)=g(x,y)zf(x,y)dxdyF_{Z}(z) = P(Z \leqslant z) = P(g(X,Y) \leqslant z) = \underset{g(x,y)\leqslant z}{\iint}f(x,y) \mathrm{d} x \mathrm{d} y
Z=X+Y\displaystyle{ Z = X + Y }
FZ(z)=P(X+Yz)=x+yzf(x,y)dxdy=+dxzxf(x,y)dy=+dyzyf(x,y)dx\begin{aligned} F_{Z}(z) & = P(X+Y \leqslant z) = \underset{x+y \leqslant z}{\iint} f(x,y) \mathrm{d} x \mathrm{d} y \\ & = \int_{-\infty}^{+\infty} \mathrm{d} x \int_{-\infty}^{z-x}f(x,y) \mathrm{d} y = \int_{-\infty}^{+\infty} \mathrm{d} y \int_{-\infty}^{z-y}f(x,y) \mathrm{d} x \end{aligned}

由此得到 Z=X+Y\displaystyle{ Z = X + Y } 的概率密度为

fZ(z)=+f(x,zx)dxfZ(z)=+f(zy,y)dy\begin{aligned} f_{Z}(z) & =\int_{-\infty}^{+\infty}f(x, z-x) \mathrm{d} x \\ f_{Z}(z) & =\int_{-\infty}^{+\infty}f(z-y, y) \mathrm{d} y \end{aligned}

特别的,当 X\displaystyle{ X }Y\displaystyle{ Y } 相互独立时,f(x,y)=f{X}(x)f{Y}(y)\displaystyle{ f \left( x , y \right) = f _{ \left\lbrace X \right\rbrace } \left( x \right) f _{ \left\lbrace Y \right\rbrace } \left( y \right) },则有卷积公式

fZ(z)=+fX(x)fY(zx)dxfZ(z)=+fX(zy)fY(y)dy\begin{aligned} f_{Z}(z) & =\int_{-\infty}^{+\infty}f_{X}(x)f_{Y}(z-x) \mathrm{d} x \\ f_{Z}(z) & =\int_{-\infty}^{+\infty}f_{X}(z-y)f_{Y}(y) \mathrm{d} y \end{aligned}

X\displaystyle{ X } 为离散型,Y\displaystyle{ Y } 为连续型

X\displaystyle{ X }x1\displaystyle{ x _{ 1 } }x2\displaystyle{ x _{ 2 } }\cdotsxi\displaystyle{ x _{ i } }\cdots
P\displaystyle{ P }p1\displaystyle{ p _{ 1 } }p2\displaystyle{ p _{ 2 } }\cdotspi\displaystyle{ p _{ i } }\cdots
FZ(z)=P(Zz)=P(g(X,Y)z)=iP(X=xi)P(g(X,Y)zX=xi)=ipiP(g(X,Y)zX=xi)\begin{aligned} F_{Z}(z) &= P(Z \leqslant z)=P(g(X,Y) \leqslant z) \\ & = \sum\limits_{i}P(X=x_{i}) P(g(X,Y) \leqslant z \mid X=x_{i}) \\ & = \sum\limits_{i}p_{i}P(g(X,Y) \leqslant z \mid X=x_{i}) \end{aligned}
Z=max{X,Y}Z = \max \{X,Y\}

X,Y\displaystyle{ X , Y } 独立,有

P(Zz)=P(Xz,Yz)FZ(z)=P(Zz)=P(Xz,Yz)=P(Xz)P(Yz)=FX(x)FY(y)\begin{aligned} P(Z \leqslant z) &=P(X \leqslant z, Y \leqslant z) \\ F_{Z}(z) &=P(Z \leqslant z) = P(X \leqslant z, Y \leqslant z) \\ & = P(X \leqslant z)P(Y \leqslant z) = F_{X}(x)F_{Y}(y) \end{aligned}
Z=min{X,Y}Z = \min \{X,Y\}

X,Y\displaystyle{ X , Y } 独立,有

FZ(z)=P(Zz)=1P(Z>z)=1P(X>z,Y>z)=1P(X>z)P(Y>z)=1(1FX(x))(1FY(y))\begin{aligned} F_{Z}(z) &= P(Z \leqslant z) = 1 - P(Z > z) \\ & = 1 - P(X > z, Y > z) = 1 - P(X > z)P(Y>z) \\ &= 1-(1-F_{X}(x))(1-F_{Y}(y)) \end{aligned}