找回密码
 立即注册
搜索

大数据、数据分析和数据挖掘的区别是什么?

大数据是指用现有的计算机软硬件设施难以采集,储存,管理,分析和使用的超大规模的数据集。大数据具有规模大,种类杂,快速化,价值密度低等特点(4V特性)。大数据的“大”是一个相对概念,没有具体标准,如果一定要给一个标准,那么10-100TB通常称为大数据的门槛。

数据分析可以分为广义的数据分析和狭义的数据分析,广义的数据分析就包括狭义的数据分析和数据挖掘,我们常说的数据分析就是指狭义的数据分析。

一、数据分析(狭义)

(1)定义:简单来说,数据分析就是对数据进行分析。专业的说法,数据分析是指根据分析目的,用适当的统计分析方法及工具,对收集来的数据进行处理与分析,提取有价值的信息,发挥数据的作用。

(2)作用:它主要实现三大作用:现状分析、原因分析、预测分析(定量)。数据分析的目标明确,先做假设,然后通过数据分析来验证假设是否正确,从而得到相应的结论。

(3)方法:主要采用对比分析、分组分析、交叉分析、回归分析等常用分析方法;

(4)结果:数据分析一般都是得到一个指标统计量结果,如总和、平均值等,这些指标数据都需要与业务结合进行解读,才能发挥出数据的价值与作用。

二、数据挖掘

(1)定义:数据挖掘是指从大量的数据中,通过统计学、人工智能、机器学习等方法,挖掘出未知的、且有价值的信息和知识的过程。

(2)作用:数据挖掘主要侧重解决四类问题:分类、聚类、关联和预测(定量、定性),数据挖掘的重点在寻找未知的模式与规律;如我们常说的数据挖掘案例:啤酒与尿布、安全套与巧克力等,这就是事先未知的,但又是非常有价值的信息;

(3)方法:主要采用决策树、神经网络、关联规则、聚类分析等统计学、人工智能、机器学习等方法进行挖掘;

(4)结果:输出模型或规则,并且可相应得到模型得分或标签,模型得分如流失概率值、总和得分、相似度、预测值等,标签如高中低价值用户、流失与非流失、信用优良中差等。

综合起来,数据分析(狭义)与数据挖掘的本质都是一样的,都是从数据里面发现关于业务的知识(有价值的信息),从而帮助业务运营、改进产品以及帮助企业做更好的决策。所以数据分析(狭义)与数据挖掘构成广义的数据分析。

回复

使用道具 举报

大神点评3

jingjing24 2024-5-9 18:27:15 来自手机 显示全部楼层
广告位,,坐下看看
回复

使用道具 举报

Sex欲帝丶 2024-5-10 07:00:39 显示全部楼层
发发呆,回回帖,工作结束~
回复

使用道具 举报

我i舞飞 2024-5-10 12:08:49 显示全部楼层
愣着干嘛,鼓掌啊
回复

使用道具 举报

高级模式
B Color Image Link Quote Code Smilies