由于数据发掘过程是在数据被获取后立刻执行的,因此找到那些可以针对不同数据结构停止分类、分析与发掘的工具,是至关重要的。下面,让我们来讨论十种业界常用的发掘工具。
1. Oracle Data Mining
Oracle Data Mining(也称为ODM)是Oracle高级分析数据库(Advanced Analytics Database)的一个模块。该数据发掘工具既可以方便数据分析师生成详细的数据见解,并做出预测;又可以协助辨认到交叉销售(Cross-sells)的机会,开发出用户画像(profiles),并最终预测用户的行为。
2. Rapid Miner
由Java言语编写的Rapid Miner,是目前最好的预测分析系统之一。它可以为深度学习、文本发掘、机器学习和预测分析,提供一套集成化的环境。其系列产品可以被用来构建全新的数据发掘过程,以及执行预测性的设置分析。
3. Orange Data Mining
作为可用于机器学习和数据发掘的完美软件套件,Orange Data Mining经过基于组件的方式,来协助完成数据的可视化。它的组件常被称为“widgets”,其中包括各种预处理、数据可视化、算法评价、以及预测建模等部件。它们可以协助完成:显示数据表,选择不同的功能,读取数据,训练预测变量,比较学习算法,以及可视化数据元素等服务。
4. Weka