数据挖掘=数据分析?90%的人都错了
“爱数据学习社”关注我们吧! -文末领取【数据挖掘入门思维导图】
数据分析与数据挖掘,把很多人和公司都搞糊涂了,很多人以为数据分析=数据挖掘。
其实,这样的观念并不完全正确。从广义上讲,这两者都互有交集,在技术范畴上也有很多相似的地方。但分析和挖掘岗位在招聘时却是工作职责不同的两个岗位。
那到底什么是数据挖掘呢?我们今天来详细聊一聊。
01 什么是数据挖掘
简介
数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、潜在的有用信息和知识的过程。
从图中可以看出,数据挖掘是一个过程结果的称谓,即主要目标是从数据中挖取隐藏的信息。它是一个交叉科学领域,受多个学科影响,包括数据库系统、统计、机器学习、可视化和信息科学。
02 数据挖掘与数据分析的区别
1.数据分析,重在“分析”
做数据分析,首先要有一定的数据灵敏度和数学底子,知道在什么样的数据规模下,需要看什么样的数据指标。了解常规的数据分析方法,可以使用一些工具得到预期的结果。
使用工具的话是需要公司系统支持一些数据分析的软件,SPSS,BI等等。如果没有,弄个Excel表格在有些公司也叫数据分析师。但大部分公司会成立一个BI部门,集合了一群数据分析师,每天找开发提数据需求,然后使用工具做一些预测。
2.数据挖掘,重点是“挖掘”
数据挖掘对于人的要求就是要熟悉挖掘的方法、挖掘的工具,或者至少知道在什么平台应该用什么工具,面对什么样的需求应该怎么解。
简单来说就是负责接收需求然后产出结果,大部分公司的数据挖掘工程师都比较被动,比如BI找你说“我要10年内的销售数据,而且要知道每年的销售情况、订单情况”,这时候你就需要做数据采集(爬虫、文本处理、etc.等),加工整理(ETL),结果产出(可视化)等等,主要是看重算法。
03 数据挖掘的工作内容
说到这里,我们先来看下招聘网站上的岗位JD.
可以发现,JD中出现了画像、建模、运营等多项专有名词。为了方便大家的理解,接下来,我们就从技术和应用两个层面来解构下数据挖掘的工作内容。
1.技术层面
从技术层面来说,按照数据挖掘产出的工作内容可以粗分为两大类:描述型挖掘和预测型挖掘。
描述型挖掘是对现有数据的进一步精炼和归纳,从中抽取中更宏观的反映数据特征的概念描述。举个例子来说,某家银行有几百万客户,数据仓库中存储了每个客户的人口统计信息、账户信息、交易信息、客服联络信息等详细数据。但是银行不可能清楚地了解每位客户是什么样的客户,客户的消费模式到底是怎样的?
这时一般需要把全体客户进行细分,划分为几个客户群,而且这种划分可以保证具有相似行为、相似价值的客户会被放入同一个群组中。有了这些客户群,银行就能更容易地发现营销机会并制定营销战略。
这个例子中所用的挖掘技术是聚类模型,它就是一种典型的描述型挖掘。
预测型挖掘,顾名思义,就是建立的挖掘模型具备预测能力。这种预测能力可能包括预测哪些客户下个月会流失,哪些客户对促销活动会积极响应,哪些客户的未来价值会成长以及成长多少等等。预测型挖掘常常对企业运营具有更强的指导作用,从而更快地见效。
2.应用层面
从应用层面来说,数据挖掘可以应用到很多行业中,包括电信、银行、证券、保险、制造、互联网等等。
最后,抛开具体行业的特定应用不谈,在各个行业中一般都会把数据挖掘应用在客户关系管理(CRM)之中。在CRM中的数据挖掘应用,包括客户细分、客户价值分析、客户获取、客户保持、交叉销售和提升销售等等。此外,信用评分、欺诈侦测和文本挖掘等也是常见的应用。
长按下方海报添加微信领取【数据挖掘思维导图】
· 爱数据每周免费直播 ·
直播主题:数据挖掘岗位工作内容及应用
直播内容:
数据挖掘初步认知:什么是数据挖掘?为什么做数据挖掘?
数据挖掘工作内容介绍及挖掘方法讲解
数据挖掘应用场景及数据挖掘案例分享
直播时间:7月2日今晚20:30准时直播分享
转发了 确实不错,顶先 顶
页:
[1]