主要服务内容:
业务理解、数据理解、数据准备、模型构建、模型修正、模型部署、性能监控
主要服务流程:
1、数据集收取
2、数据集预处理:提高数据质量,即保证数据的准确性、完整性和一致性。
数据清理 填充缺失值、光滑噪声、识别离群点
数据集成 集成多个数据库
数据规约 数据集的简化表示
数据变换 规范化、数据离散化、概念分层等
3、数据分析算法
4、分析总结与改进