跳到主要内容

特征工程

特征工程-特征预处理
1.定义
通过一些转换函数将特征数据转换成更加适合算法模型的特征数据过程
2.包含内容:
归一化
标准化
3.api
sklearn.preprocessing
4.归一化
定义:
对原始数据进行变换把数据映射到(默认为[0,1])之间
api:
sklearn.preprocessing.MinMaxSca
ler (feature range= (0, 1)
参数:
feature range 自己指定范围,默认0-1
总结:
鲁棒性(稳定性)比较差(容易受到异常点的影响)
只适合传统精确小数据场景(以后不会用你了)


5标准化
定义:
对原始数据进行变换把数据变换到均值为0,标准差为1范围内
api:
sklearn.preprocessing. Standardscaler()

总结:
异常值对我影响小
适合现代嘈杂大数据场景(以后就是用你了)