如何在一个数据集上选择重要的变量【面试题详解】

今天爱分享给大家带来如何在一个数据集上选择重要的变量【面试题详解】,希望能够帮助到大家。
以下是你可以使用的选择变量的方法:

1.选择重要的变量之前除去相关变量
2.用线性回归然后基于P值选择变量
3.使用前向选择,后向选择,逐步选择
4.使用随机森林和Xgboost,然后画出变量重要性图
5.使用lasso回归
6.测量可用的特征集的的信息增益,并相应地选择前n个特征量。

人已赞赏
Python

Ridge回归优于Lasso回归是什么时候【面试题详解】

2020-12-25 15:33:00

Python

Gradient boosting算法(GBM)和随机森林都是基于树的算法,它们有什么区别【面试题详解】

2020-12-25 15:34:19

'); })();