回归评价指标

# 1、均方误差(MSE) MSE (Mean Squared Error)叫做均方误差。看公式 ::: hljs-center $\frac{1}{m} \sum_{i=1}^{m}\left(y_{i}-\hat{y}_{i}\right)^2$ ::: 这里的y是测试集上的。 用 真实值-预测值 然后平方之后求和平均。 猛着看一下这个公式是不是觉得眼熟,这不就是线性回归的损失函数嘛!!! 对,在线性回归的时候我们的目的就是让这个损失函数最小。那么模型做出来了,我们把损失函数丢到测试集上去看看损失值不就好了嘛。简单直观暴力! >**优点**:解决了不光滑的问题。 > >**缺点**:MSE与我们的目标变量的量纲不一致 # 2、均方根误差(RMSE) RMSE(Root Mean Squard Error)均方根误差。 ::: hljs-center $\sqrt{\frac{1}{m} \sum_{i=1}^{m}\left(y_{i}-\hat{y}_{i}\right)^{2}}$ ::: 这不就是MSE开个根号么。有意义么?其实实质是一样的。只不过用于数据更好的描述。 例如:要做房价预测,每平方是万元(真贵),我们预测结果也是万元。那么差值的平方单位应该是 千万级别的。那我们不太好描述自己做的模型效果。怎么说呢?我们的模型误差是 多少千万?。。。。。。于是干脆就开个根号就好了。我们误差的结果就跟我们数据是一个级别的可,在描述模型的时候就说,我们模型的误差是多少万元。 >**优点**:解决了MSE的缺点。 > >**缺点**:它是使用平均误差,而平均值对异常点(outliers)较敏感,如果回归器对某个点的回归值很不理性,那么它的误差则较大,从而会对RMSE的值有较大影响,即平均值是非鲁棒的。 # 3、MAE(平均绝对误差) ::: hljs-center $\frac{1}{m} \sum_{i=1}^{m} \mid\left(y_{i}-\hat{y}_{i}\right)|$ ::: >**优点**:可以把绝对误差和相对误差里面正负相互抵消的问题去掉。 > >**缺点**:因为用了绝对值,所以会有一些点无法求导~ # 4、R Squared 上面的几种衡量标准针对不同的模型会有不同的值。比如说预测房价 那么误差单位就是万元。数子可能是3,4,5之类的。那么预测身高就可能是0.1,0.6之类的。没有什么可读性,到底多少才算好呢?不知道,那要根据模型的应用场景来。 看看分类算法的衡量标准就是正确率,而正确率又在0~1之间,最高百分之百。最低0。很直观,而且不同模型一样的。那么线性回归有没有这样的衡量标准呢?答案是有的。 那就是R Squared也就R方 ::: hljs-center $R^{2}=1-\frac{S S_{\text {residual}}}{S S_{\text {total}}}$ ::: 光看这些东西很懵逼,其中分子是Residual Sum of Squares 分母是 Total Sum of Squares 那就看公式吧 ::: hljs-center $R^{2}=1-\frac{\sum_{i}\left(\hat{y}_{i}-y_{i}\right)^{2}}{\sum_{i}\left(\hat{y}_{i}-y_{i}\right)^{2}}$ ::: 懵逼(X2) 慢慢解释。其实这个很简单。 上面分子就是我们训练出的模型预测的所有误差。 下面分母就是不管什么我们猜的结果就是y的平均数。(瞎猜的误差) 那结果就来了。 如果结果是0,就说明我们的模型跟瞎猜差不多。 如果结果是1。就说明我们模型无错误。 如果结果是0-1之间的数,就是我们模型的好坏程度。 如果结果是负数。说明我们的模型还不如瞎猜。(其实导致这种情况说明我们的数据其实没有啥线性关系) 化简上面的公式 分子分母同时除以m ::: hljs-center $R^{2}=1-\frac{\left(\sum_{i}\left(\hat{y}_{i}-y_{i}\right)^{2}\right) / m}{\left(\sum_{i}\left(\hat{y}_{i}-y_{i}\right)^{2}\right) / m}$ ::: 那么分子就变成了我们的均方误差MSE,下面分母就变成了方差。 ::: hljs-center $R^{2}=1-\frac{\left(\sum_{i}\left(y_{i}-y_{i}\right)^{2}\right) / m}{\left(\sum_{i}\left(y_{i}-y_{i}\right)^{2}\right) / m}$ $=1-\frac{M S E(y, y)}{{Var}(y)}$ ::: 参考: [回归评价指标MSE、RMSE、MAE、R-Squared](https://www.jianshu.com/p/9ee85fdad150)