集成学习基础知识
集成方法:集体智慧
关注集成学习原因
单个模型中的拟合度与复杂性
第一个集成模型
集成方法的术语和分类
基本集成方法
同质并行集成:Bagging法和随机森林
并行集成
Bagging: Boostrap结合算法
随机森林
更多同质并行集成
案例研究: 乳腺癌诊断
异构并行集成:结合强学习器
异质集成的基础估计器
通过加权结合预测
通过元学习结合预测
案例研究:情感分析
顺序集成: 自适应提升
弱学习器的顺序集成
AdaBoost: 自适应提升
AdaBoost在实践中的应用
案例研究: 手写数字分类
LogitBoost:使用逻辑损失进行提升
顺序继承: 梯度提升
用梯度下降实现最小化
梯度提升: 梯度下降+提升
LightGBM: 梯度提升框架
LightGBM在实践中的应用
案例研究: 文档检索
顺序集成: 牛顿提升
最小化牛顿法
牛顿提升:牛顿法+ Boosting
XGBoost: 牛顿提升框架
XGBoost实践
案例实践: 文档检索
集成之外: 将继承方法应用于你的数据
学习连续和计数标签
回归的简要回顾
回归的并行集成
用于回归的顺序集成
案例研究:需求预测
学习分类特征
编码分类特征
CatBoost
案例研究:收入预测
集成学习可解释性
可解释性的含义
案例研究:数据驱动的营销
全局可解释性的黑盒方法
适用于可解释性的黑盒方法
白盒集成:训练解释性