决定系数,在一些书里被翻译为决定系数,也被称为拟合优度。
决定系数的波动中有多少百分比反映了Y可以用X的波动来描述,即因变量Y的变化中有多少百分比可以用受控自变量X来解释.
表达式:R平方=SSR/SST=1-SSE/SST
其中:SST=SSR SSE,SST总平方和)为总平方和,SSR回归平方和)为回归平方和,SSE误差平方和)为残差平方和。
回归平方和:SSR回归平方和)=ESS解释平方和)
残差平方和:SSE误差平方和)=RSS残差平方和)
总偏差平方和:SST总平方和)=TSS总平方和)
SSE SSR=SST RSS ESS=TSS
显著性:拟合优度越大,自变量对因变量的解释程度越高,因自变量引起的变化占总变化的百分比越高。越密集的观测点越靠近回归线。值范围:0-1。
示例:
假设有10个点,如下图:
r用来实现如何求线性方程和R2:
#线性回归方程
mylr=函数x,y){ 0
曲线图x,y)
x _均值=均值x)
y _均值=均值y)
xy_mean=平均值x*y)
xx _均值=均值x*x)
yy_mean=平均值y*y)
m=x _均值* y _均值-xy_mean)/x_mean^2-xx _均值)
b=y _均值-m * x _均值
F=m*x b#线性回归方程
线条x,f)
sst=sumy-y_mean)^2)
sse=sumy-f)^2)
ssr=sumf-y_mean)^2)
结果=cm,b,sst,sse,ssr)
名称结果)=c’m ‘,’ b ‘,’ sst ‘,’ sse ‘,’ ssr ‘)
返回结果)
}
x=c60,34,12,34,71,28,96,34,42,37)
y=c301,169,47,178,365,126,491,157,202,184)
f=mylrx,y)
f[‘m’]
f[‘b’]
f[‘sse’] f[‘ssr’]
f[‘sst’]
R2=f[‘ssr’]/f[‘sst’]
最终方程为:fx)=5.3x-15.5
R2是99.8,说明X对y的解释度非常高。
本课程到此结束。感谢您的耐心等待!每日更新,敬请关注!
【兴华开生物医药统计】微信微信官方账号xhkdata)