智客公社

标题: 数据挖掘常用流程及算法 [打印本页]

作者: ailanes80    时间: 2022-6-9 21:30
标题: 数据挖掘常用流程及算法
[attach]728426[/attach]

数据挖掘的基本流程

1、理解商业数据:只要是效力于企业,所有的工作都是为了商业化,因此一定要从商业的角度理解项目需求,在这个基础上再对数据挖掘的目的进行定义。

2、数据的理解:理解数据的定义,至少当你和人讲起的时候,你们讲的是同一个东西。然后对数据进行描述以及质量的验证。

3、数据准备:收集数据、数据的清洗及特征处理都在这一步完成。

4、模型的建立:选择和应用各种数据挖掘模型,并进行优化,以达到更好的效果。

5、模型的评估:对模型进行评价和打分,并检查模型的每个步骤,确认模型实现了商业目标。

6、上线发布:从数据中提炼出结论和知识,转化成一中用户可以使用的方式,可以是一份报告、也可以是一个比较复杂的重复挖掘的脚本,作为之后日常工作的一部分。

数据挖掘常用算法

为了进行数据挖掘,数据科学家们提出了各种模型,在众多的数据挖掘模型中,国际权威学术组织ICDM ( the IEEE International Conference on Data Mining )筛选出了十个最常用的算法。

按照使用的目的,可以分为四类。

分类算法:C4.5、朴素贝叶斯、SVM、KNN、Adaboost、CART

聚类算法:K-Means、EM

关联分析:Apriorl

连接分析:PageRank

以上是关于数据挖掘的一些学习心得,希望对你有帮助。

[attach]728427[/attach]
作者: 名被占用    时间: 2022-6-9 21:31
转发了
作者: ebuqifa    时间: 2022-6-9 21:32
转发了
作者: fsbdsz    时间: 2022-6-12 18:48
是爷们的娘们的都帮顶!大力支持




欢迎光临 智客公社 (http://bbs.cnaiplus.com/) Powered by Discuz! X3.4