抽样分布

统计量的定义

设$X_1,\dots,X_n$是从总体X中抽取容量为n的一个样本。如果由此样本构造一个函数$T(X_1,\dots,X_n)$，不依赖于任何参数，则称函数$T(X_1,\dots,X_n)$是一个统计量。

设$X_1,X_2,\dots,X_n$是从总体X中抽取的一个样本，则

$$ \bar{X}=\frac{1}{n}\sum_{i=1}^n X_i \

S^2=\frac{1}{n-1}\sum_{i=1}^n(X_i-\bar{X})^2 $$

都是统计量。而$\sum_{i=1}^n[X_i-E(X)]^2,[X_i-E(X)]/D(X)$都不是统计量。因为E(X)和D(X)都依赖于总体分布的未知参数。

统计量是样本的一个函数。由样本构造具体的统计量，实际是对样本所含的总体信息按某种要求进行加工处理，吧分散在样本中的信息集中到统计量的取值上。

统计量在统计学的地位相当于随机变量在概率论中的地位

常用统计量

样本均值

$$ \bar{X}=\frac{1}{n}X_i $$

样本方差

$$ S^2=\frac{1}{n-1}\sum_{i=1}^n(X_i-\bar{X})^2 $$

样本变异系数

$$ V=\frac{S}{\bar{X}} $$

样本k阶矩

$$ m_k=\frac{1}{n}\sum_{i=1}^nX^k_i $$

它反映出总体k阶矩的信息。$m_1=\bar{X}$是样本均值。

k阶中心矩

$$ v_k=\frac{1}{n-1}\sum_{i=1}^n(X_i-\bar{X})^k $$

它反映总体k阶中心矩的信息

$v_2$是样本方差

样本偏度

$$ \alpha_3=\sqrt{n-1}\sum_{i=1}^n(X_i-\bar{X})^3/(\sum_{i=1}^n(X_i-\bar{X} )^2)^{3/2} $$

反映总体偏斜信息，反映了随机变量密度函数曲线在众数(密度函数在这一点达到最大值)两边的偏斜性。

如果X~$N(\mu,\sigma^2)$, 则偏度$\alpha_3=0$

样本峰度

$$ \alpha_4=(n-1)\sum_{i=1}^n(X_i-\bar{X})^4/[\sum_{i=1}^n(X_i-\bar{X})^2]^2 $$

反映总体峰度信息，反映了密度函数曲线在众数附近“峰”的尖度。

如果X~$N(\mu,\sigma^2)$, 的峰度$\alpha_4=0$

t分布

t表示样本均值经标准化后的新随机变量。随着自由度增大，t分布趋于正态分布。当正态总体未知，小样本条件下对总体均值的估计和检验要用t分布。

$\chi^2$分布

$\chi^2$分布式n个独立正态变量的平方和分布(n个自由度)，记为$\chi^2(n)$。

设总体服从一般正态分布，则 $$ Z=\frac{X-\mu}{\sigma}~~N(0,1) $$ 令$Y=Z^2$，则Y服从自由度为1的$\chi^2$分布，即$Y~~\chi^2(1)$。对于n个独立变量$Y_i$，随机变量$Y=\sum_{i=1}^n Y_i^2$的分布具有n个自由度的$\chi^2$分布，记为$Y~\chi^2(n)$

$\chi^2$分布具有如下特点：

变量始终为正
形状取决于其自由度大小，通常形状为不对称的右偏分布,但随自由度增大逐渐趋于对称
期望值$E(\chi^2)=n$, 方差$D(X)=2n$，n为自由度
可加性。U+V~$\chi^2(n_1)+\chi^2(n_2)$

F分布

F分布是两个$\chi^2$之比。设U~$\chi^2(n_1)$, V~$\chi^2(n_2)$,U和V相互独立，则F=$\frac{U/n_1}{V/n_2}$,记为F~$F(n_1,n_2)$

F分布用于比较不同总体的方差是否有显著差异。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

抽样分布

统计量的定义

常用统计量

t分布

$\chi^2$分布

F分布

FilesExpand file tree

6.抽样分布.md

Latest commit

History

6.抽样分布.md

File metadata and controls

抽样分布

统计量的定义

常用统计量

t分布

$\chi^2$分布

F分布