找回密码
 立即注册
搜索

数据统计、数据发掘、大数据和OLAP,真正的区别是什么?

原创: 云帆 多智时代

在数据范畴里,常常会看到,例如数据发掘、OLAP、数据统计等等的专业词汇。假如仅仅从字面上,我们很难说清楚每个词汇的意义和区别。

明天,我们就来经过一些大数据在高校运用的例子,来为大家阐明白—数据发掘、大数据、OLAP、数据统计的区别。

数据分析

数据分析相对来说,是一个比较大的概念,在实际上,任何对数据停止计算、处理从而得出一些有意义的结论的过程,都叫数据分析。从数据本身的复杂程度、以及对数据停止处理的复杂度和深度来看,可以把数据分析分为以下4个层次:数据统计,OLAP,数据发掘,大数据。

数据统计

数据统计是最基本、最传统的数据分析,自古有之。是指经过统计学方法对数据停止排序、挑选、运算、统计等处理,从而得出一些有意义的结论。

举例,对全年级先生按照平均成绩从高到低排序,前10%的先生可以获得央求研讨生免试资历。

传统的查询和报表工具是告诉你数据库中有什么(What happened)

OLAP

联机分析处理(On-Line Analytical Processing,OLAP)是指基于数据仓库的在线多维统计分析。它允许用户在线地从多个维度观察某个度量值,从而为决策提供支持。

举例,学校招生时要决议往年在江苏的招生目的,不能简单地参照去年的计划,而是要参考多个维度的数据积累。学校要在这些数据的支持下做出合理的决策。

OLAP更进一步告诉你下一步会怎样样(What next),假如我采取这样的措施又会怎样样(What if)

数据发掘

数据发掘是指从海量数据中找到人们未知的、能够有用的、隐藏的规则,可以经过关联分析、聚类分析、时序分析等各种算法发现一些无法经过观察图表得出的深层次缘由。

举例,学校发现高等数学等主干课的不及格率有逐年上升的趋向,普通以为是学习不仔细所致,但做了很多工作效果并不明县,这时经过数据发掘……

针对此可以采取有针对性的管理措施。

大数据

大数据是指用现有的计算机软硬件设备难以采集、存储、管理、分析和运用的超大规模的数据集。大数据具有规模大、种类杂、疾速化、价值密度低等特点(4V特性)。大数据的“大”是一个相对概念,没有详细标准,假如一定要给一个标准,那么10-100TB通常称为大数据的门槛。

从数据分析的角度来看,目前绝大多数学校的数据运用产品都还处在数据统计和报表分析的阶段,可以完成有效的OLAP分析与数据发掘的还很少,而可以达到大数据运用阶段的非常少,至少还没有用过有效的大数据集。

聚焦多智时代,引领智能变革,更多的人工智能科谱,请关注多智时代!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

大神点评7

偌小兜 2019-10-9 19:06:15 显示全部楼层
分享了
回复

使用道具 举报

猫大宏 2019-10-9 19:16:44 显示全部楼层
分享了
回复

使用道具 举报

@Xizi_o3YrXI3W 2019-10-9 19:20:33 显示全部楼层
分享了
回复

使用道具 举报

jhttpy11 2019-10-9 19:25:38 显示全部楼层
分享了
回复

使用道具 举报

蛀心虫1号 2019-10-10 19:50:13 显示全部楼层
LZ是天才,坚定完毕
回复

使用道具 举报

520手掌心 2019-10-11 18:08:54 来自手机 显示全部楼层
占位编辑
回复

使用道具 举报

minzhou 2019-10-12 16:16:38 显示全部楼层
我是个凑数的。。。
回复

使用道具 举报

高级模式
B Color Image Link Quote Code Smilies