参数估计
点估计
用样本 X1,X2,⋯,Xn 构造的统计量 θ^(X1,X2,⋯,Xn) 来估计未知参数 θ 称为点估计,统计量 θ^(X1,X2,⋯,Xn) 称为估计量
设 θ^ 是 θ 的估计量,如果 E(θ^)=θ,则称 θ^=θ^(X1,X2,⋯,Xn) 是未知参数 θ 的无偏估计量
设 θ^1 和 θ^2 都是 θ 的无偏估计量,且 D(θ^1)⩽D(θ^2),则称 θ^1 比 θ^2 更有效
设 θ^(X1,X2,⋯,Xn) 是 θ 的估计,如果 θ^ 依概率收敛于 θ,则称 θ^(X1,X2,⋯,Xn) 是 θ 的一致估计量
与切比雪夫不等式相关的表示形式:对任意 ε>0
n→∞limP{θ^−θ⩾ε}=0
一致估计的一个等价条件(可以作为证明方法)
{Eθ^=θDθ^=0
估计量的求法和区间估计
矩估计法
设总体 X 的分布含有未知参数 θ1,θ2,⋯,θk,αl=E(Xl) 存在,显然它是 θ1,θ2,⋯,θk 的函数,记作 αl(θ1,θ2,⋯,θk),l=1,2,⋯,k,样本的 l 阶原点矩为
A=n1i=1∑nXil
令 αl(θ1,θ2,⋯,θk)=Al,l=1,2,⋯,k,从这 k 个方程组中,可以解得 θ1,θ2,⋯,θk
最大似然估计法
对于离散型总体 X,其概率分布为 P{X=ai}=p(ai,θ),i=1,2,⋯,称函数
L(θ)=L(x1,x2,⋯,xn;θ)=i=1∏np(xi;θ)
为参数 θ 的似然函数
对于连续型总体 X,概率密度为 f(x;θ),则称函数
L(θ)=L(x1,x2,⋯,xn;θ)=i=1∏nf(xi;θ)
为参数 θ 的似然函数
对于给定样本值 (x1,x2,⋯,xn),使似然函数 L 达到最大值的参数值 θ^=θ^(x1,x2,⋯,xn) 称为参数 θ 的最大似然估计值,对应的使似然函数 L(X1,X2,⋯,Xn;θ) 达到最大值的参数值 θ^=θ^(X1,X2,⋯,Xn) 称为 θ 的最大似然估计量
通常可以通过
∂θ∂L(θ) or ∂θ∂lnF(θ)
求解得到 θ^,有时不一定是驻点,这时不能用这个方程求解。
X∼N(μ,σ2),从总体中取样本
X1,X2,⋯,Xn,求 (1)
μ,σ2 的矩估计 (2) 极大似然估计
(1) 计算一阶和二阶矩
E(X)E(X2)=μ=D(X)+(EX)2=σ2+μ2⎩⎨⎧μ=Xσ2+μ2=n1i=1∑nXi2得到
μ^σ2^=X=n1i=1∑nXi2−X2=n1(i=1∑nXi2−nX2)=n1i=1∑n(Xi−X)2(2) X 的概率密度分布
f(x)=2πσ1e−2σ2(x−μ)2L(μ,σ2)lnL(μ,σ2)=(2πσ1)2exp{−2σ21i=1∑n(Xi−μ)2}=−2nln(2π)−2nln(σ2)−2σ21i=1∑n(Xi−μ)2⎩⎨⎧∂μ∂lnL=σ21i=1∑n(Xi−μ)=0∂σ2∂lnL=−2nσ21+2(σ2)21i=1∑n(Xi−μ)2=0解得
⎩⎨⎧μ^=Xσ2^=n1i=1∑n(Xi−X)2
一致估计量
设 θ^ 是 θ 的估计量,若对 ∀ε>0,有 n→∞limP(θ^−θ<ε)=1,或 n→∞limP(θ^−θ≥ε)=0,则 θ^ 是 θ 的一致估计量。
证明方法
{n→∞limEθ^=θn→∞limDθ^=0
区间估计
置信区间
设 θ 是总体 X 的未知参数,X1,X2,⋯,Xn 是来自总体 X 的样本,对于给定的 α(0<α<1),如果两个统计量 θ1,θ2 满足
P(θ1<θ<θ2)=1−α
则称随机区间 (θ1,θ2) 为参数 θ 的置信水平为 1−α 的置信区间。
一个正态总体参数的区间估计
设总体 X∼N(μ,σ2),Xi 是来自 X 的样本,X 是样本均值,S2 为样本方差
未知参数 | 条件 | 1−α 置信区间 |
---|
μ | σ2 已知 | (X−uα/2nσ,X+uα/2nσ) |
μ | σ2 未知 | (X−tα/2(n−1)nS,X+tα/2(n−1)nS) |
σ2 | | (χα/22(n−1)(n−1)S2,χ1−α/22(n−1)(n−1)S2) |
两个正态总体参数的区间估计
X∼N(μ1,σ12),Y∼N(μ2,σ22)
Sw=n1+n2−2(n1−1)S12+(n2−1)S22
未知参数 | 条件 | 1−α 置信区间 |
---|
μ1−μ2 | σ12,σ22 已知 | X−Y−uα/2n1σ12+n1σ22,X−Y+uα/2n1σ12+n1σ22 |
μ1−μ2 | σ2 未知但 σ12=σ22 | (X−Y−tα/2(n1+n2−2)Swn11+n21,X−Y+tα/2(n1+n2−2)Swn11+n21) |
σ12/σ22 | | (S22S12F1−α/2(n1−1,n2−1),S22S12Fα/2(n1−1,n2−1)) |
假设检验
假设分为原假设和备择假设
显著性检验
- 根据问题提出原假设 H{0}
- 给出显著性水平 α(0<α<1)
- 确定检验统计量及拒绝域形式
- 按犯第一类错误的概率等于 α 求出拒绝域 W
- 根据样本值计算检验统计量 T 的观测值 t,当 t∈W 时,拒绝原假设;否则,接受原假设
| H0 正确 | H0 错误 |
---|
拒绝 H0 | 第一类错误 | 正确 |
接受 H0 | 正确 | 第二类错误 |
检验 μ
σ2 已知,H0:μ=μ0
U=σ/nX−μ0
H0 为真时检验统计量的分布 N(0,1)
σ2 未知,H0:μ=μ0
T=S/nX−μ0
H0 为真时检验统计量的分布 N(0,1)
检验 σ2
μ 已知,H0:σ2=σ02
χ2=σ02i=1∑n(Xi−μ)2
H0 为真时检验统计量的分布 χ2(n)
μ 未知,H0:σ2=σ02
χ2=σ02(n−1)S2
H0 为真时检验统计量的分布 χ2(n−1)
检验 μ1−μ2
σ12,σ22 已知,H0:μ1−μ2=μ0
U=n1σ12+n2σ22X−Y−μ0
H0 为真时检验统计量的分布 N(0,1)
σ12,σ22 未知,但 σ12=σ22,H0:μ1−μ2=μ0
T=Swn11+n21X−Y−μ0,Sw=n1+n2−2(n1−1)S12+(n2−1)S22
H0 为真时检验统计量的分布 t(n1+n2−2)
检验 σ12−σ22
μ1,μ2 已知,H0:σ12=σ22
F=n1i=1∑n1(Xi−μ1)2/n2j=1∑n2(Xj−μ2)2
H0 为真时检验统计量的分布 F(n{1},n{2})
σ12,σ22 未知,H0:σ12=σ22
F=S22S12
H0 为真时检验统计量的分布 F(n1−1,n2−1)