数据挖掘常用流程及算法

ailanes80 · 2022-6-9 21:30:39

数据挖掘的基本流程

1、理解商业数据：只要是效力于企业，所有的工作都是为了商业化，因此一定要从商业的角度理解项目需求，在这个基础上再对数据挖掘的目的进行定义。

2、数据的理解：理解数据的定义，至少当你和人讲起的时候，你们讲的是同一个东西。然后对数据进行描述以及质量的验证。

3、数据准备：收集数据、数据的清洗及特征处理都在这一步完成。

4、模型的建立：选择和应用各种数据挖掘模型，并进行优化，以达到更好的效果。

5、模型的评估：对模型进行评价和打分，并检查模型的每个步骤，确认模型实现了商业目标。

6、上线发布：从数据中提炼出结论和知识，转化成一中用户可以使用的方式，可以是一份报告、也可以是一个比较复杂的重复挖掘的脚本，作为之后日常工作的一部分。

数据挖掘常用算法

为了进行数据挖掘，数据科学家们提出了各种模型，在众多的数据挖掘模型中，国际权威学术组织ICDM ( the IEEE International Conference on Data Mining )筛选出了十个最常用的算法。

按照使用的目的，可以分为四类。

分类算法：C4.5、朴素贝叶斯、SVM、KNN、Adaboost、CART

聚类算法：K-Means、EM

关联分析：Apriorl

连接分析：PageRank

以上是关于数据挖掘的一些学习心得，希望对你有帮助。

名被占用 · 2022-6-9 21:31:33

转发了

ebuqifa · 2022-6-9 21:32:32

转发了

fsbdsz · 2022-6-12 18:48:44

是爷们的娘们的都帮顶！大力支持

		自动登录	找回密码
密码			立即注册

数据挖掘常用流程及算法

本帖子中包含更多资源

大神点评3

最近发表

公社版块

关注我们