Z检验 - 统计学

# Z检验 - 检验一个样本平均数与一个己知的总体平均数的差异是否显著 - 检验来自两个的两组样本平均数的差异性，从而判断它们各自代表的总体的差异是否显著 --- > **使用条件**： > 1. 正态分布 > 2. 总体标准差已知**或者**样本容量足够大(>30) 在讨论T检验之前，我们先回顾如何**将普通正态分布转换成标准正态分布**。这需要用到下面Z分数的计算公式：$Z_{i}=\frac{X_{i}-\mu}{\sigma}$，其中：$X_{i}$为数据总体中的第$i$个数据；$\mu$为总体均值；$\sigma$为总体标准差；通过上面这个公式计算得到的数值称为Z分数。对于容量比较大（大于100）的数据集，**如果其满足正态分布**，那么根据上面公式求出数据集中每个数值的Z分数，由这些Z分数构成一个新的序列，这个序列就是Z分布序列。有了Z分布，Z分数的计算公式不仅可以用作普通正态分布的标准化，还被用于判断均值差异显著性的Z检验，也就是下面的情况： **1、** 总体标准差已知或样本容量大于30，**比较两个样本的均值**是否有显著性的差异，检验公式如下： $Z=\frac{\left(\bar{X}_{1}-\bar{X}_{2}\right)-\left(\mu_{1}-\mu_{2}\right)}{\sqrt{\frac{\sigma_{1}^{2}}{n_{1}}+\frac{\sigma_{2}^{2}}{n_{2}}}}=\frac{\left(\bar{X}_{1}-\bar{X}_{2}\right)-0}{\sqrt{\frac{\sigma_{1}^{2}}{n_{1}}+\frac{\sigma_{2}^{2}}{n_{2}}}}$ （总体标准差已知） $Z=\frac{\left(\bar{X}_{1}-\bar{X}_{2}\right)-\left(\mu_{1}-\mu_{2}\right)}{\sqrt{\frac{S_{1}^{2}}{n_{1}}+\frac{S_{2}^{2}}{n_{2}}}}=\frac{\left(\bar{X}_{1}-\bar{X}_{2}\right)-0}{\sqrt{\frac{S_{1}^{2}}{n_{1}}+\frac{S_{2}^{2}}{n_{2}}}}$ （总体标准差未知，样本容量大）其中：$\bar{X}_{1}$、$\bar{X}_{2}$是两样本均值；$\mu_{1}$、$\mu_{2}$是两个样本的抽样总体的均值，**检验时假设两个总体的均值相等**，所以差为0；$\sigma_{1}$、$\sigma_{2}$是两个总体的标准差；$S_{1}$、$S_{2}$是两个样本的标准差； ![屏幕截图 20201119 210156.png](https://cos.easydoc.net/17082933/files/khougq6j.png) **2、** 总体标准差已知或样本容量大于30，**比较某个总体的均值与某个常数**是否有显著性的差异，检验公式如下： $Z=\frac{\bar{X}-\mu}{\frac{\sigma}{\sqrt{n}}}$ (总体标准差已知) $Z=\frac{\bar{X}-\mu}{\frac{S}{\sqrt{n}}}$ （总体标准差未知，样本容量大）其中：$\bar{X}$为样本均值；$\mu$为假设与样本均值无显著性差异的常数；$\sigma$为总体标准差；$S$为样本标准差； > **注意**：对比 Z分数：$Z_{i}=\frac{X_{i}-\mu}{\sigma}$ ，Z检验统计量为：$Z=\frac{\bar{X}-\mu}{\frac{\sigma}{\sqrt{n}}}$ 或 $Z=\frac{\bar{X}-\mu}{\frac{S}{\sqrt{n}}}$，可以发现分母不太一样，这是因为Z分数的分母是数据$x_i$的标准差，而Z统计量分母则是抽样得到的部分数据$X_i$的**均值**的标准差。$\frac{\sigma}{\sqrt{n}}$叫做标准误：[标准差与标准误区别](https://zhuanlan.zhihu.com/p/122897125)；专门衡量样本均值的标准差。 >当总体标准差未知是，用样本标准差$s$替代。样本标准差公式的分母是$n-1$;而不是总体标准差公式的$n$；这是因为一般样本的标准差都会小于总体，因此特地除以$n-1$来纠正。【但其实好像n-1指的是自由度】 --- >**总体均值**假设检验的检验统计量的总结 >![屏幕截图 20201202 152244.png](https://cos.easydoc.net/17082933/files/ki73aeyx.png) > > **注：** 当小样本(n < 30)，总体近似正态且总体方差未知时，T检验适用性优于Z检验 --- **重要公式：** ![屏幕截图 20201202 152244.png](https://cos.easydoc.net/17082933/files/ki73gw9d.png) ![屏幕截图 20201202 152244.png](https://cos.easydoc.net/17082933/files/ki73hlu0.png) ![屏幕截图 20201202 152244.png](https://cos.easydoc.net/17082933/files/ki73idly.png) --- ![20180624113146270.png](https://cos.easydoc.net/17082933/files/ke59tzsc.png) (注意：此图中n=16，它有错误) --- 参考： [如何理解Z检验和T检验？](https://zhuanlan.zhihu.com/p/49468324) [假设检验之z-检验，t-检验，卡方检验](https://blog.csdn.net/tianguiyuyu/article/details/80789856)