XGB特征重要性程度是怎么判断的【面试题详解】

今天爱分享给大家带来XGB特征重要性程度是怎么判断的【面试题详解】,希望能够帮助到大家。

官网上给出的方案,total_gain就是特征带来的总的分裂增益,也就是我们常规意义上的分裂总增益,weight,被用来作为分裂节点的次数,也就是我们常规意义上的分裂总次数,gain=total_gain/weight,计算的是每一次分裂带来的平均增益,total_cover表示特征分裂的样本数,举个例子,假设初始样本有10000个,第一次分裂的时候使用了特征A,也就是特征A在这10000个样本上分裂,则此时的cover值为10000,假设根据特征A分裂出左枝的样本有1000个,右边有9000个,而在左枝特征B是最优特征根据这1000个样本进行分裂,则B当前的cover是1000,依次类推最后求和。而cover显然就是total_cover/weight,也就是平均每次分裂所“负责”的样本数。

人已赞赏
Python

xgb的预排序算法是怎么做的呢【面试题详解】

2020-12-26 16:06:49

Python

XGBoost和GBDT的区别有哪些【面试题详解】

2020-12-26 16:07:58

'); })();