今天爱分享给大家带来如何在一个数据集上选择重要的变量【面试题详解】,希望能够帮助到大家。
以下是你可以使用的选择变量的方法:
1.选择重要的变量之前除去相关变量
2.用线性回归然后基于P值选择变量
3.使用前向选择,后向选择,逐步选择
4.使用随机森林和Xgboost,然后画出变量重要性图
5.使用lasso回归
6.测量可用的特征集的的信息增益,并相应地选择前n个特征量。
原文链接:https://blog.itblood.com/4333.html,转载请注明出处。
今天爱分享给大家带来如何在一个数据集上选择重要的变量【面试题详解】,希望能够帮助到大家。
以下是你可以使用的选择变量的方法:
1.选择重要的变量之前除去相关变量
2.用线性回归然后基于P值选择变量
3.使用前向选择,后向选择,逐步选择
4.使用随机森林和Xgboost,然后画出变量重要性图
5.使用lasso回归
6.测量可用的特征集的的信息增益,并相应地选择前n个特征量。