找回密码
 立即注册
搜索

5个开源数据发掘工具,收下这波干货

数据发掘是从大量数据中提取隐藏的或未知,但能够有用信息的过程。尤其在机器学习中,数据发掘是非常重要的一环。明天给大家引见5个开源数据发掘工具,收下这波干货吧。





1、Orange

Orange 是由C++ 和 Python开发的,基于组件的数据发掘和机器学习软件套装,它的功能很丰富,而且弱小。它包含了一系列组件,能停止数据预处理,并提供了数据帐目,过渡,建模,形式评价和勘探的功能。经过它疾速且多功能的可视化编程前端,可以阅读数据分析和可视化,可以绑定Python停止脚本开发。

2、KNIME

KNIME 由Java写成,它基于Eclipse,是一个开源的、智能的,而且有丰富数据集成,数据处理,数据分析和数据勘探的平台。它可视化的方式,可以创建数据流或数据通道,而且可以选择性地运转分析步骤,并研讨结果,模型以及可交互的视图。并且,可以集成到其它各种各样的开源项目中,比如:R言语,Weka, Chemistry Development Kit等。

3、Apache Mahout

Apache Mahout是分布式线性代数框架,这个框架是具有数学表达才能的Scala DSL,构建了一个用于疾速创建可扩展,且功能驱动的机器学习运用程序的环境,可以使得数据迷信家、统计学家等更迅速地完成其算法。

4、Weka

Weka是用Java编写的,可以在大部分平台上运转,是一种开源机器学习软件,能经过图形用户界面,标准终端运用程序或Java API停止访问。总之它是一个集合,用来处理实践数据发掘成绩的机器学习算法。

5、DataMelt

DataMelt是一个开源软件,用于数值计算,数学、统计、符号计算,数据分析和数据可视化的。DataMelt可以与Java平台的几种脚本言语一同运用,例如Jython,Groovy,JRuby(Ruby编程言语)和BeanShell等。

5个开源数据发掘工具你收藏了吗?假如还有什么想要了解的,或者你有其他的好用的数据发掘工具,可以在下方回复留言和大家一同讨论~

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

大神点评3

书写人生 2020-9-26 07:16:23 来自手机 显示全部楼层
我是个凑数的。。。
回复

使用道具 举报

前排,哇咔咔
回复

使用道具 举报

流苏鹿晗 2020-9-27 22:35:43 显示全部楼层
边撸边过
回复

使用道具 举报

高级模式
B Color Image Link Quote Code Smilies