智客公社

标题: 秒懂数据挖掘,玩转数据分析的高级应用不在话下 [打印本页]

作者: Mai丶Jordan    时间: 2023-5-29 08:31
标题: 秒懂数据挖掘,玩转数据分析的高级应用不在话下
随着时代的发展,人类产生的数据成倍增长,数据的开放性应用和数据可挖掘价值越来越高。在大数据精准营销、大数据洞察等一系列热词背后,正是数据挖掘、分析技术发挥着重要的作用。数据挖掘技术不仅成为当今政务部门提升治理能力的重要手段,也成为各行各业提升核心竞争力的关键。

[attach]805649[/attach]

什么是数据挖掘


数据挖掘是从大量的不完全的有噪声的模糊的随机的数据中,提取隐含在其中的、人们事先不知道的、但有潜在的有用信息和知识的过程。




[attach]805650[/attach]

可以看出,数据挖掘是一个过程结果的称谓,即主要目标是从数据中挖取隐藏的信息。它是一个交叉科学领域,受多个学科影响,包括数据库系统、统计、机器学习、可视化和信息科学。
数据挖掘与商业智能的关系

举个简单点的例子:

[attach]805651[/attach]

也就是说:

利用数据挖掘技术,对大量的业务数进行探索和分析揭示隐藏的、未知的规律,是商业智能的高级应用。
数据挖掘能解决哪些问题

根据数据挖掘的应用方向,常见的数据挖掘能解决的问题体现在下面几个方面。

1. 分类与回归

分类根据样本数据中标记的类别对原数据进行分类总结,进而也可以预测未来数据的归类。

回归是确定一种或多种变量间相互依赖关系的一种统计分析方法。

分类与回归本质上解决的都是预测问题,不同的是分类适用于离散型目标变量的预测,而回归适用于连续型目标变量的预测。下面这些问题可以用分类和回归技术来解决:

下图是一个基于决策树预测银行客户是否存在贷款风险的示例:

[attach]805652[/attach]

2. 聚类

聚类是在预先不知道欲划分类的情况下,根据数据相似度原则进行数据归类的方法。

中国有句古话是“物以类聚,人以群分”,其实已经蕴含了聚类算法的基本思想。聚类能解决如下方面的问题:

例如下图,找到共性的数据,然后聚类显示:

[attach]805653[/attach]

3. 关联规则

关联规则在一个数据集中找出各个物品或者商品之间的关系,也被称为购物篮分析。

关联规则描述的是在一个事物中物品间同时出现的规律的知识模式,可以应用到很多实际业务中:

下图是某商场购物蓝推荐结果示例:

[attach]805654[/attach]

4. 时间序列预测

通过已有的时间序列数据进行类推,以预测下一段时间的趋势。

时间序列预测是在与时间相关的历史数据中,找到数据随时间变动的规律。你可以用来解决如下问题:

下图是某公司红酒销量的预测图:

[attach]805655[/attach]

5. 关系网络分析

关系网络分析用来探索社会行动者及其间的关系,例如:社会关系、亲属关系、角色关系、行为关系、流动关系、地理空间关系等等。

关系网络分析也叫社会网络分析。通过社会网络分析,可以探索和发现行动者之间隐藏的关系。常见的关系有:

下面是对《悲惨世界》一书中人物的关系网络分析的一个示例:

[attach]805656[/attach]


[attach]805657[/attach]

数据挖掘是一个周而复始的过程,在生成规则的过程中不断地对模型进行调整,从而提升精度。那么,怎么才能更好地掌握数据挖掘呢,亿信华辰数据挖掘软件豌豆DM是一个不错的选择。

豌豆DM内置分类分析、回归分析、聚类分析、关联规则分析以及时间序列应用等五大类十几个小类的数据挖掘算法,并支持R语言算法扩展。让用户可以通过半自动化或者自动化地分析业务数据,做出归纳性的推理,从中挖掘出潜在的模式,帮助你解决客户流失分析、客户细分、银行客户贷款风险分析、客户信用评价、关联推荐(购物篮分析)等各类数据分析应用问题。
作者: w打手机    时间: 2023-5-29 14:17
沙发???
作者: rice米生生    时间: 2023-5-31 13:29
向楼主学习
作者: 阳村阿辉    时间: 2023-5-31 19:49
好,很好,非常好!




欢迎光临 智客公社 (https://bbs.cnaiplus.com/) Powered by Discuz! X3.5