方差分析
# [方差分析](https://www.jianshu.com/p/bab2b41ed919)(ANOVA)
方差分析就相当于是能够分析三组及以上数据的**两样本T检验升级版**,判断三组或者更多组数据是否存在不同。
---
> 方差分析有三个**使用条件**:
>
> 1.每组样本数据对应的总体应该**服从正态分布**;
>2.每组样本数据对应的总体方差要相等,方差相等又叫**方差齐性**;
>3.每组之间的值是**相互独立**的,就是A、B、C组的值不会相互影响。
### 1、 方差分析流程
#### 1.1 建立假设
H0:各组数据均值相等;
H1:各组数据均值不相等或不全等。
检验水准为0.05。
#### 1.2 计算检验统计量F值
F值 = 组间方差/组内方差。我们主要是通过比较F值的大小来判断各组之间是否存在显著差异。
所谓的组间方差就是用来反映组与组之间的差异程度,组内方差就是用来反映各组内部数据的差异程度。
要来计算方差,我们需要先计算平方和。为了让大家能够更加理解,我们来**举个例子来讲解各个指标怎么计算**。
**现在有两组数据:**
第一组:80、85、96
第二组:110、125、130、145、160
第一组和第二组的**总算术平均值**为:
(80+85+96+110+125+130+145+160)/8 = 116.375。
**第一组的算术平均值**:(80+85+96)/3 = 87
**第二组的算术平均值:**(110+125+130+145+160)/5 = 134
**组间平方和(SSA):**
= 第一组平均值与总体平均值的平方和×第一组样本数+第二组平均值与总体平均值的平方和×第二组样本数
= (87-116.375)^2×3 + (134-116.375)^2×5 = 4141.875
**组内平方和(SSE):**
= 第一组平方和 + 第二组平方和
=(80-87)^2 +(85-87)^2 +(96-87)^2
+(110-134)^2 +(125-134)^2 +(130-134)^2 +(145-134)^2 +(160-134)^2
=134+1470=1604
**总体平方和(SST):**
=所有样本数据与总体平均值之间的平方和
=(80-116.375)^2 +(85-116.375)^2 +(96-116.375)^2
+(110-116.375)^2 +(125-116.375)^2 +(130-116.375)^2 +(145-116.375)^2 +(160-116.375)^2
=5745.875
通过以上数据,我们可以看出 **SST = SSA + SSE**
总平方和会有一个问题,就是随着数据量越大,这个值会越大,所以我们引入另外一个概念:均方。**均方=平方和/自由度**,其中自由度是样本数-1。
**组间均方(MSA)**= SSA/自由度 = 4141.875/(2-1) = 4141.875
**组内均方(MSE)**= SSE/自由度 = 1604/(8-2) = 267.333
MSA又称为**组间方差**,MSE称为**组内方差**。
**F = MSA/MSE** = 4141.875/267.333 = 15.4933
#### 1.3 确定边界值并做出决策
此时我们就可以通过查F表,来获得置信度为95%时的F边界值:
如果F<F边界值表面各组数据之间没有显著差异,接受H0假设;
如果F≥F边界值表面各组数据之间存在明显差异,拒绝H0假设,接受H1假设。
如果我们证实了各组数据之间是存在明显差异的,这个时候就可以去拿各组的均值来进行比较,均值越大,可以说明策略效果越好。
[点击查看:F值表](https://wenku.baidu.com/view/3165819af71fb7360b4c2e3f5727a5e9846a2743.html)
转载:[https://blog.csdn.net/junhongzhang/article/details/99143064](https://blog.csdn.net/junhongzhang/article/details/99143064)