数据预处理方法有哪些【详细讲解】

今天爱分享给大家带来数据预处理方法有哪些【详细讲解】,希望能够帮助到大家。
1. 缺失值,填充缺失值fillna:
i. 离散:None,
ii. 连续:均值。
iii. 缺失值太多,则直接去除该列

2. 连续值:离散化。有的模型(如决策树)需要离散值

3. 对定量特征二值化。核心在于设定一个阈值,大于阈值的赋值为1,小于等于阈值的赋值为0。如图像操作

4. 皮尔逊相关系数,去除高度相关的列

人已赞赏
Python

什么是真、伪阳性率【详细讲解】

2020-12-24 18:59:45

Python

梯度消失问题造成的原因是什么【详细讲解】

2020-12-24 19:02:56

'); })();