大数据挖掘是从大量、不完整、有噪声、模糊和随机的数据中提取潜在有用信息和知识的过程。数据挖掘通常与计算机科学相关,它通过统计分析、在线解析、信息检索、机器学习算法、专家系统和模式识别等方法进行。
数据挖掘过程:
定义问题:明确定义业务问题,确定数据挖掘的目的。
数据准备:数据准备包括:选择数据-从大型数据库和数据仓库目标中提取数据挖掘的目标数据集;数据预处理-数据再处理,包括检查数据的完整性和一致性、去除噪音、填充缺失字段、删除无效数据等。
数据挖掘:根据数据函数的类型和数据的特点,选择相应的算法,对经过净化和转换的数据集进行数据挖掘。
结果分析:对数据挖掘的结果进行解释和评价,并将其转化为用户能够理解的知识。
@xuefen.com.cn 2013-2022 闽ICP备2023010389号-3 最近更新