如果分类问题的评价指标为精度,则回归算法的评价指标为MSE、RMSE、MAE、R-Squared
1 .均方误差MSE ) )。
MSEmeansquarederror )称为均方差。 看公式
这里的两个y分别是真值和测试集中的预测值。
真值-使用预测值,平方后合计平均值。
是线性回归的损失函数! 在线回归时,我们的目的是使这个损失函数最小。 那么模型做好了,把损失函数丢到测试集中看看损失值不就行了吗?
2 .均方根误差RMSE ) )。
RMSE 均方根误差)。
是MSE起根号吗? 实质上是一样的。 只是对数据的更好描述。
例如,要预测房价,每平方万元,我们的预测结果也是万元。 那么,差的平方单位应该是千万级。 不利于解释。 加上根本号码就是数量水平。
MAE 平均绝对误差) )。
R Squared
上式中,分子部分表示真值与预测值平方误差之和,类似于均方误差MSE; 分母部分表示真值和平均值的平方误差之和,与方差Var相似。 根据R-Squared的取值判断模型的好坏。 如果结果为0,则表示模型拟合效果差的结果为1,则模型没有错误。 一般来说,R-Squared越大,表示模型拟合的效果越好。 R-Squared反映了有多正确。 因为,随着样本数的增加,R-Square必然增加,无法真正定量地解释准确性,只能进行近似定量。
根据情况,即使只看R-Squared,也无法推测增加的特征是否有意义。 通常,添加一个特征后,R-Squared可能会变大,也可能不会改变。 两者不一定呈正相关。
使用修正决定系数Adjusted R-Square )时:
其中,n是采样数,p是特征数。 Adjusted R-Square抵消了样本数量对R-Square的影响,达到了真正的0~1。 越大越好。
各种评价指标scikit-learn中的表示法
froms klearn.metricsimportmean _ squared _ error #均方误差
froms klearn.metricsimportmean _ absolute _ error #平方绝对误差
froms klearn.metrics importr2_ score # r square
#呼叫
mean_squared_errory_test,y_predict ) )。
mean_absolute_errory_test,y_predict )。
R2_scorey_test,y_predict ) ) ) ) ) ) ) ) R2_scorey_test,y_predict ) ) ) ) ) ) ) ) R2 ) ) )0)0)0)