Z检验

# Z检验 - 检验一个样本平均数与一个己知的总体平均数的差异是否显著 - 检验来自两个的两组样本平均数的差异性,从而判断它们各自代表的总体的差异是否显著 --- > **使用条件**: > 1. 正态分布 > 2. 总体标准差已知**或者**样本容量足够大(>30) 在讨论T检验之前,我们先回顾如何**将普通正态分布转换成标准正态分布**。这需要用到下面Z分数的计算公式:$Z_{i}=\frac{X_{i}-\mu}{\sigma}$,其中:$X_{i}$为数据总体中的第$i$个数据;$\mu$为总体均值;$\sigma$为总体标准差; 通过上面这个公式计算得到的数值称为Z分数。对于容量比较大(大于100)的数据集,**如果其满足正态分布**,那么根据上面公式求出数据集中每个数值的Z分数,由这些Z分数构成一个新的序列,这个序列就是Z分布序列。 有了Z分布,Z分数的计算公式不仅可以用作普通正态分布的标准化,还被用于判断均值差异显著性的Z检验,也就是下面的情况: **1、** 总体标准差已知或样本容量大于30,**比较两个样本的均值**是否有显著性的差异,检验公式如下: $Z=\frac{\left(\bar{X}_{1}-\bar{X}_{2}\right)-\left(\mu_{1}-\mu_{2}\right)}{\sqrt{\frac{\sigma_{1}^{2}}{n_{1}}+\frac{\sigma_{2}^{2}}{n_{2}}}}=\frac{\left(\bar{X}_{1}-\bar{X}_{2}\right)-0}{\sqrt{\frac{\sigma_{1}^{2}}{n_{1}}+\frac{\sigma_{2}^{2}}{n_{2}}}}$ (总体标准差已知) $Z=\frac{\left(\bar{X}_{1}-\bar{X}_{2}\right)-\left(\mu_{1}-\mu_{2}\right)}{\sqrt{\frac{S_{1}^{2}}{n_{1}}+\frac{S_{2}^{2}}{n_{2}}}}=\frac{\left(\bar{X}_{1}-\bar{X}_{2}\right)-0}{\sqrt{\frac{S_{1}^{2}}{n_{1}}+\frac{S_{2}^{2}}{n_{2}}}}$ (总体标准差未知,样本容量大) 其中:$\bar{X}_{1}$、$\bar{X}_{2}$是两样本均值;$\mu_{1}$、$\mu_{2}$是两个样本的抽样总体的均值,**检验时假设两个总体的均值相等**,所以差为0;$\sigma_{1}$、$\sigma_{2}$是两个总体的标准差;$S_{1}$、$S_{2}$是两个样本的标准差; ![屏幕截图 20201119 210156.png](https://cos.easydoc.net/17082933/files/khougq6j.png) **2、** 总体标准差已知或样本容量大于30,**比较某个总体的均值与某个常数**是否有显著性的差异,检验公式如下: $Z=\frac{\bar{X}-\mu}{\frac{\sigma}{\sqrt{n}}}$ (总体标准差已知) $Z=\frac{\bar{X}-\mu}{\frac{S}{\sqrt{n}}}$ (总体标准差未知,样本容量大) 其中:$\bar{X}$为样本均值;$\mu$为假设与样本均值无显著性差异的常数;$\sigma$为总体标准差;$S$为样本标准差; > **注意**:对比 Z分数:$Z_{i}=\frac{X_{i}-\mu}{\sigma}$ ,Z检验统计量为:$Z=\frac{\bar{X}-\mu}{\frac{\sigma}{\sqrt{n}}}$ 或 $Z=\frac{\bar{X}-\mu}{\frac{S}{\sqrt{n}}}$,可以发现分母不太一样,这是因为Z分数的分母是数据$x_i$的标准差,而Z统计量分母则是抽样得到的部分数据$X_i$的**均值**的标准差。$\frac{\sigma}{\sqrt{n}}$叫做标准误:[标准差与标准误区别](https://zhuanlan.zhihu.com/p/122897125);专门衡量样本均值的标准差。 >当总体标准差未知是,用样本标准差$s$替代。 样本标准差公式的分母是$n-1$;而不是总体标准差公式的$n$;这是因为一般样本的标准差都会小于总体,因此特地除以$n-1$来纠正。【但其实好像n-1指的是自由度】 --- >**总体均值**假设检验的检验统计量的总结 >![屏幕截图 20201202 152244.png](https://cos.easydoc.net/17082933/files/ki73aeyx.png) > > **注:** 当小样本(n < 30),总体近似正态且总体方差未知时,T检验适用性优于Z检验 --- **重要公式:** ![屏幕截图 20201202 152244.png](https://cos.easydoc.net/17082933/files/ki73gw9d.png) ![屏幕截图 20201202 152244.png](https://cos.easydoc.net/17082933/files/ki73hlu0.png) ![屏幕截图 20201202 152244.png](https://cos.easydoc.net/17082933/files/ki73idly.png) --- ![20180624113146270.png](https://cos.easydoc.net/17082933/files/ke59tzsc.png) (注意:此图中n=16,它有错误) --- 参考: [如何理解Z检验和T检验?](https://zhuanlan.zhihu.com/p/49468324) [假设检验之z-检验,t-检验,卡方检验](https://blog.csdn.net/tianguiyuyu/article/details/80789856)