CatBoost(categorical boosting)是一種能夠很好地處理類別型特征的梯度提升算法庫。本文中,我們對 CatBoost 基本原理及應用實例做個詳細介紹。後面小猴子還將針對其中幾個重要特性做專門介紹,如 CatBoost 對類別型特征處理、特征選擇、文本特征處理、超參數調整以及多標簽目標處理,看完記得點個贊支持下!
要理解 boosting,我們首先理解集成學習,為了獲得更好的預測性能,集成學習結合多個模型(弱學習器)的預測結果。它的策略就是大力出奇跡,因為弱學習器的有效組合可以生成更准確和更魯棒的模型。集成學習方法分為三大類:
- Bagging:該技術使用隨機數據子集並行構建不