梯度提升树

发表于 2025-07-26 更新于 2025-09-26 分类于数理统计

梯度提升树（Gradient Boosting Trees, GBT 或 GBDT） 是一种强大的机器学习算法，广泛应用于回归、分类等任务中。它结合了多个决策树的预测结果，以构建一个更强的模型。

梯度提升树的核心思想是：

逐步构建多个弱学习器（通常是决策树），每一棵新树都试图纠正之前所有树预测的残差（错误）。

假设你想拟合目标函数 $y = f(x)$，GBDT 做法是：

XGBoost：高效、支持正则化
LightGBM：微软出品，速度更快，内存更省
CatBoost：对类别特征处理更好
scikit-learn 也提供了 GBDT 的基础版本 GradientBoostingClassifier 和 GradientBoostingRegressor

在 梯度提升树（GBT/GBDT） 中，第 3 步“拟合残差” 是算法的核心所在。这一步的本质是用一棵新的决策树来逼近当前模型的预测误差，从而改进整个模型。

假设我们已经有了一个当前模型 $F_{m-1}(x)$，它给出每个输入 $x_i$ 的预测值。但它并不是完全准确的，所以我们定义：

\[ \text{残差 } r_i = y_i - F_{m-1}(x_i) \]

这个残差表示当前模型对第 $i$ 个样本的预测错误。

我们要用一棵新的决策树 $h_m(x)$ 来学习这些残差。换句话说，新树的目标是：

“你来学学我哪里错了，下一次你帮我改正。”

假设我们用决策树来预测房价。

现在我们训练一棵新树，它的目标是预测这个 “$20,000”。这棵树被加入到模型中，从而让下一轮的预测更接近真实值。

在平方损失（L2）下：

\[ L(y_i, F(x_i)) = \frac{1}{2}(y_i - F(x_i))^2 \]

计算负梯度（残差）：

\[ r_i = -\frac{\partial L}{\partial F(x_i)} = y_i - F(x_i) \]

也就是说，残差就是目标值减去当前模型预测值。在这一轮，我们训练一个新树 $h_m(x)$ 来“拟合”这些 $r_i$。

模型更新如下：

\[ F_m(x) = F_{m-1}(x) + \nu \cdot h_m(x) \]

其中 $\nu$ 是学习率（防止一步走太猛），一般取 0.01 ~ 0.1。