引导程序
在原始训练数据集上重复随机选择n个数据。
核心思想是给出训练集,当高个子前辈认为给定的训练集不能很好地反应数据的真实分布时,可以采用重采样的方法来增大样本。
百吉集团
引导聚合
在现有训练数据集D DD上,采用bootstrap的方法独立选取m mm个训练集,分别训练m mm个分类器/回归,组合成最终的分类器/回归。
Bagging方法有效地平均多个分类器之间的不稳定性,因此可以提高不稳定的分类器的识别精度
博世电脑
虽然Boosting也类似地生成多个子分类器,但多个子分类器的生成是有序的,即,一个分类器依赖于先前的分类器,且子分类器关注先前的分类器错误识别的样本。