找回密码
 立即注册
搜索

数据发掘=数据分析?90%的人都错了

“爱数据学习社”关注我们吧! -



文末支付【数据发掘入门思想导图】

数据分析与数据发掘,把很多人和公司都搞糊涂了,很多人以为数据分析=数据发掘。

其实,这样的观念并不完全正确。从广义上讲,这两者都互有交集,在技术范畴上也有很多相似的地方。但分析和发掘岗位在招聘时却是工作职责不同的两个岗位。

那到底什么是数据发掘呢?我们明天来详细聊一聊。

01 什么是数据发掘

简介

数据发掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事前不知道的、潜在的有用信息和知识的过程。



从图中可以看出,数据发掘是一个过程结果的称谓,即次要目的是从数据中挖取隐藏的信息。它是一个交叉迷信范畴,受多个学科影响,包括数据库系统、统计、机器学习、可视化和信息迷信。

02 数据发掘与数据分析的区别

1.数据分析,重在“分析”

做数据分析,首先要有一定的数据灵敏度和数学底子,知道在什么样的数据规模下,需求看什么样的数据目的。了解常规的数据分析方法,可以运用一些工具得到预期的结果。

运用工具的话是需求公司系统支持一些数据分析的软件,SPSS,BI等等。假如没有,弄个Excel表格在有些公司也叫数据分析师。但大部分公司会成立一个BI部门,集合了一群数据分析师,每天找开发提数据需求,然后运用工具做一些预测。

2.数据发掘,重点是“发掘”

数据发掘对于人的要求就是要熟习发掘的方法、发掘的工具,或者至少知道在什么平台应该用什么工具,面对什么样的需求应该怎样解。

简单来说就是担任接收需求然后产出结果,大部分公司的数据发掘工程师都比较被动,比如BI找你说“我要10年内的销售数据,而且要知道每年的销售状况、订单状况”,这时分你就需求做数据采集(爬虫、文本处理、etc.等),加工整理(ETL),结果产出(可视化)等等,次要是看重算法。

03 数据发掘的工作内容

说到这里,我们先来看下招聘网站上的岗位JD.



可以发现,JD中出现了画像、建模、运营等多项专有名词。为了方便大家的了解,接上去,我们就从技术和运用两个层面来解构下数据发掘的工作内容。

1.技术层面

从技术层面来说,按照数据发掘产出的工作内容可以粗分为两大类:描画型发掘和预测型发掘。

述型发掘是对现有数据的进一步精炼和归纳,从中抽取中更宏观的反映数据特征的概念描画。举个例子来说,某家银行有几百万客户,数据仓库中存储了每个客户的人口统计信息、账户信息、买卖信息、客服联络信息等详细数据。但是银行不能够清楚地了解每位客户是什么样的客户,客户的消费形式到底是怎样的?

这时普通需求把全体客户停止细分,划分为几个客户群,而且这种划分可以保证具有相似行为、相似价值的客户会被放入同一个群组中。有了这些客户群,银行就能更容易地发现营销机会并制定营销战略。

这个例子中所用的发掘技术是聚类模型,它就是一种典型的描画型发掘。

测型发掘,顾名思义,就是建立的发掘模型具有预测才能。这种预测才能能够包括预测哪些客户下个月会流失,哪些客户对促销活动会积极呼应,哪些客户的将来价值会长大以及长大多少等等。预测型发掘常常对企业运营具有更强的指点作用,从而更快地见效。

2.运用层面

从运用层面来说,数据发掘可以运用到很多行业中,包括电信、银行、证券、保险、制造、互联网等等。

最后,抛开详细行业的特定运用不谈,在各个行业中普通都会把数据发掘运用在客户关系管理(CRM)之中。在CRM中的数据发掘运用,包括客户细分、客户价值分析、客户获取、客户保持、交叉销售和提升销售等等。此外,信誉评分、欺诈侦测和文本发掘等也是常见的运用。

长按下方海报添加微信支付【数据发掘思想导图】



· 爱数据每周收费直播 ·

直播主题:数据发掘岗位工作内容及运用

直播内容:

    数据发掘初步认知:什么是数据发掘?为什么做数据发掘?

    数据发掘工作内容引见及发掘方法讲解

    数据发掘运用场景及数据发掘案例分享

直播工夫:7月2日今晚20:30准时直播分享

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

大神点评3

核平小日a 2020-7-3 13:30:57 显示全部楼层
回个帖子,下班咯~
回复

使用道具 举报

刘能 2020-7-4 18:18:15 来自手机 显示全部楼层
啊啊啊啊啊啊啊啊啊啊啊
回复

使用道具 举报

小冷子 2020-7-5 14:31:04 显示全部楼层
你用实力诠释了一句话,高手在民间
回复

使用道具 举报

高级模式
B Color Image Link Quote Code Smilies