赞
踩
step by step.
目录
1、 数据预处理目的
现实中数据的缺点:
处理方法:
2、 数据清理
(1) 填写缺失值
(2) 光滑噪声数据
a. 分箱 【 排序 -> 分箱(等宽/等深) -> 平滑(平均值平滑/边界值平滑)】
练习题
b. 回归
c. 聚类
(3) 数据清理过程
3、 数据集成和数据变换
(1) 数据集成
(2) 数据变换
规范化方法:
(3) 数据归约
要看具体章节复习汇总请见