回归分析是统计学的核心,其实是一个广义的概念,通常指那些用一个或多个预测变量(自变量或解释变量)来预测响应变量(因变量、校标变量或结果变量)的方法。
回归分析可以用来挑选与响应变量相关的解释变量,可以描述两者的关系,也可以生成等式,通过解释变量来预测响应变量。
回归分析可以解释的部分问题,举例:
预测人在跑步机上锻炼时消耗的卡路里数。
其响应变量就是消耗的卡路里数,预测变量可以很多,比如锻炼时间、目标心率的时间比、平均速度、年龄、性别和身体质量指数(BMI)。
从理论上来说,回归分析可以帮助解释如下问题:
1、锻炼时间和消耗卡路里数是什么关系?是否是线性相关的,还是曲线?
2、耗费精力(处于目标心率的时间比,平均行进速度)将被如何计算在内?
3、这些关系对于不同身材的人是否适用
从实际上来看:
1、一名23岁男,BMI为28.7,若以每小时4公里行走45分钟,并80%时间都在目标心率,消耗卡路里为多少?
2、为提高预测卡路里数的准确率,该最少收集多少变量?
3、预测的准确度可达到多少?
回归分析的变体:
http://www.360doc.com/content/20/1023/19/72085106_942042475.shtml
OLS回归(普通最小二乘回归法)
通过预测变量的加权和来预测量化的因变量,其中权重是通过数据估计而得的参数。
OLS回归拟合模型的形式:
拟合线性模型最基本的函数时lm),格式:
fit <- lmformula,data)
Jetbrains全家桶1年46,售后保障稳定