方差分析

# [方差分析](https://www.jianshu.com/p/bab2b41ed919)(ANOVA) 方差分析就相当于是能够分析三组及以上数据的**两样本T检验升级版**,判断三组或者更多组数据是否存在不同。 --- > 方差分析有三个**使用条件**: > > 1.每组样本数据对应的总体应该**服从正态分布**; >2.每组样本数据对应的总体方差要相等,方差相等又叫**方差齐性**; >3.每组之间的值是**相互独立**的,就是A、B、C组的值不会相互影响。 ### 1、 方差分析流程 #### 1.1 建立假设 H0:各组数据均值相等; H1:各组数据均值不相等或不全等。 检验水准为0.05。 #### 1.2 计算检验统计量F值 F值 = 组间方差/组内方差。我们主要是通过比较F值的大小来判断各组之间是否存在显著差异。 所谓的组间方差就是用来反映组与组之间的差异程度,组内方差就是用来反映各组内部数据的差异程度。 要来计算方差,我们需要先计算平方和。为了让大家能够更加理解,我们来**举个例子来讲解各个指标怎么计算**。 **现在有两组数据:** 第一组:80、85、96 第二组:110、125、130、145、160 第一组和第二组的**总算术平均值**为: (80+85+96+110+125+130+145+160)/8 = 116.375。 **第一组的算术平均值**:(80+85+96)/3 = 87 **第二组的算术平均值:**(110+125+130+145+160)/5 = 134 **组间平方和(SSA):** = 第一组平均值与总体平均值的平方和×第一组样本数+第二组平均值与总体平均值的平方和×第二组样本数 = (87-116.375)^2×3 + (134-116.375)^2×5 = 4141.875 **组内平方和(SSE):** = 第一组平方和 + 第二组平方和 =(80-87)^2 +(85-87)^2 +(96-87)^2 +(110-134)^2 +(125-134)^2 +(130-134)^2 +(145-134)^2 +(160-134)^2 =134+1470=1604 **总体平方和(SST):** =所有样本数据与总体平均值之间的平方和 =(80-116.375)^2 +(85-116.375)^2 +(96-116.375)^2 +(110-116.375)^2 +(125-116.375)^2 +(130-116.375)^2 +(145-116.375)^2 +(160-116.375)^2 =5745.875 通过以上数据,我们可以看出 **SST = SSA + SSE** 总平方和会有一个问题,就是随着数据量越大,这个值会越大,所以我们引入另外一个概念:均方。**均方=平方和/自由度**,其中自由度是样本数-1。 **组间均方(MSA)**= SSA/自由度 = 4141.875/(2-1) = 4141.875 **组内均方(MSE)**= SSE/自由度 = 1604/(8-2) = 267.333 MSA又称为**组间方差**,MSE称为**组内方差**。 **F = MSA/MSE** = 4141.875/267.333 = 15.4933 #### 1.3 确定边界值并做出决策 此时我们就可以通过查F表,来获得置信度为95%时的F边界值: 如果F<F边界值表面各组数据之间没有显著差异,接受H0假设; 如果F≥F边界值表面各组数据之间存在明显差异,拒绝H0假设,接受H1假设。 如果我们证实了各组数据之间是存在明显差异的,这个时候就可以去拿各组的均值来进行比较,均值越大,可以说明策略效果越好。 [点击查看:F值表](https://wenku.baidu.com/view/3165819af71fb7360b4c2e3f5727a5e9846a2743.html) 转载:[https://blog.csdn.net/junhongzhang/article/details/99143064](https://blog.csdn.net/junhongzhang/article/details/99143064)