数据挖掘(Data mining),又译为资料探勘、数据采矿。它是数据库知识发现(Knowledge-Discovery in Databases,简称:KDD)中的一个步骤。数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。
数据挖掘是通过仔细分析大量数据来揭示有意义的新的关系、趋势和模式的过程+其出现于20世纪80年代后期,是数据库研究中一个很有应用价值的新领域,是一门交叉性学科,融合了人工智能、数据库技术、模式识别、机器学习、统计学和数据可视化等多个领域的理论和技术!数据挖掘作为一种技术,它的生命周期正处于沟坎(chasm)阶段,需要时间和精力去研究、开发和逐步成熟,并最终为人们所接受。由于数据挖掘是数据库中知识发现(knowledge discovery in databases,KDD)的核心步骤(如图1所示),发现了隐藏的模式,所以从模式处理的角度,许多人认为两者是等同的。