请选择 进入手机版 | 继续访问电脑版
 找回密码
 立即注册
搜索

数据挖掘实战:带你做客户价值分析(附代码)

XVOIk3Ss23MIZcoq.jpg


背景与挖掘目标

1. 背景
航空公司业务竞争激烈,从产品中心转化为客户中心

针对不同类型客户,进行精准营销,实现利润最大化

建立客户价值评估模型,进行客户分类,是解决问题的办法

2. 挖掘目标
借助航空公司客户数据,对客户进行分类

对不同的客户类别进行特征分析,比较不同类客户的客户价值

对不同价值的客户类别提供个性化服务,制定相应的营销策略

详情数据见数据集内容中的air_data.csv和客户信息属性说明。



分析方法与过程

1. 分析方法
首先,明确目标是客户价值识别

识别客户价值,应用最广泛的模型是三个指标(消费时间间隔(Recency),消费频率(Frequency),消费金额(Monetary))

以上指标简称RFM模型,作用是识别高价值的客户

消费金额,一般表示一段时间内,消费的总额。但是,因为航空票价收到距离和舱位等级的影响,同样金额对航空公司价值不同

因此,需要修改指标。选定变量,舱位因素=舱位所对应的折扣系数的平均值=C,距离因素=一定时间内积累的飞行里程=M

再考虑到,航空公司的会员系统,用户的入会时间长短能在一定程度上影响客户价值,所以增加指标L=入会时间长度=客户关系长度

总共确定了五个指标,消费时间间隔R,客户关系长度L,消费频率F,飞行里程M和折扣系数的平均值C

以上指标,作为航空公司识别客户价值指标,记为LRFMC模型

如果采用传统的RFM模型,如下图。它是依据,各个属性的平均值进行划分,但是,细分的客户群太多,精准营销的成本太高。



gqOZbyKAKuo4OIQY.jpg


综上,这次案例,采用聚类的办法进行识别客户价值,以LRFMC模型为基础

本案例,总体流程如下图



dqhlvMrmrZKpHprt.jpg


2.挖掘步骤
从航空公司,选择性抽取与新增数据抽取,形成历史数据和增量数据

对步骤一的两个数据,进行数据探索性分析和预处理,主要有缺失值与异常值的分析处理,属性规约、清洗和变换

利用步骤2中的已处理数据作为建模数据,基于旅客价值的LRFMC模型进行客户分群,对各个客户群再进行特征分析,识别有价值客户

针对模型结果得到不同价值的客户,采用不同的营销手段,指定定制化的营销服务,或者针对性的优惠与关怀。(重点维护老客户)

3. 数据抽取
选取,2014-03-31为结束时间,选取宽度为两年的时间段,作为观测窗口,抽取观测窗口内所有客户的详细数据,形成历史数据

对于后续新增的客户信息,采用目前的时间作为重点,形成新增数据

4. 探索性分析
本案例的探索分析,主要对数据进行缺失值和异常值分析

发现,存在票价为控制,折扣率为0,飞行公里数为0。票价为空值,可能是不存在飞行记录,其他空值可能是,飞机票来自于积分兑换等渠道

查找每列属性观测值中空值的个数、最大值、最小值的代码如下



vDS61OyOSHDQC6ZO.jpg

E115CGCDC1CL8yE1.jpg

oiFL6w66Tz92Pf8P.jpg



5. 数据预处理
数据清洗

丢弃票价为空记录

丢弃票价为0、平均折扣率不为0、总飞行公里数大于0的记录



v2dVOkW3joBW9OlR.jpg

HJpbBZbZVmXj3MBq.jpg



6. 属性规约
原始数据中属性太多,根据航空公司客户价值LRFMC模型,选择与模型相关的六个属性

删除其他无用属性,如会员卡号等等



UMh998oRVlXhmDHk.jpg

SggvuGgPTTyXyM77.jpg



7. 数据变换
意思是,将原始数据转换成“适当”的格式,用来适应算法和分析等等的需要

本案例,主要采用数据变换的方式为属性构造和数据标准化 3.需要构造LRFMC的五个指标


  • L=LOAD_TIME-FFP_DATE(会员入会时间距观测窗口结束的月数=观测窗口的结束时间-入会时间(单位:月))

  • R=LAST_TO_END(客户最近一次乘坐公司距观测窗口结束的月数=最后一次。。。)

  • F=FLIGHT_COUNT(观测窗口内的飞行次数)

  • M=SEG_KM_SUM(观测窗口的总飞行里程)

  • C=AVG_DISCOUNT(平均折扣率)



w59zRH9bquhl5qH9.jpg


模型构建

1. 客户聚类
利用K-Means聚类算法对客户数据进行客户分群,聚成五类(根据业务理解和需要,分析与讨论后,确定客户类别数量)。

代码如下:



p49X69Y6JYyDH3d8.jpg




TNFwQTA33WDSx2HZ.jpg


就剩下最后一步,画图:



SdU0Jhm026f0vRhB.jpg




gLrzIi55SSclkI55.jpg




TMxIJfvK33HxVQmK.jpg



  • 客户群1:red,

  • 客户群2:green,

  • 客户群3:yellow,

  • 客户群4:blue,

  • 客户群5:black



bC1mB5qqvV0xMEkB.jpg



客户关系长度L,消费时间间隔R,消费频率F,飞行里程M,折扣系数的平均值C。

横坐标上,总共有五个节点,按顺序对应LRFMC。

对应节点上的客户群的属性值,代表该客户群的该属性的程度。

2. 客户价值分析
我们重点关注的是L,F,M,从图中可以看到:


  • 客户群4[blue] 的F,M很高,L也不低,可以看做是重要保持的客户;

  • 客户群3[yellow] 重要发展客户

  • 客户群1[red] 重要挽留客户,原因:入会时间长,但是F,M较低

  • 客户群2[green] 一般客户

  • 客户群5[black] 低价值客户

重要保持客户:R(最近乘坐航班)低,F(乘坐次数)、C(平均折扣率高,舱位较高)、M(里程数)高。最优先的目标,进行差异化管理,提高满意度。

重要发展客户:R低,C高,F或M较低,潜在价值客户。虽然说,当前价值不高,但是却有很大的发展潜力,促使这类客户在本公司消费和合作伙伴处消费。

重要挽留客户:C、F、M较高,但是较长时间没有乘坐(R)小。增加与这类客户的互动,了解情况,采取一定手段,延长客户生命周期。

一般与低价值客户:C、F、M、L低,R高。他们可能是在公司打折促销时才会乘坐本公司航班。



noxxnqnol6U96HVm.jpg



3. 模型应用
会员的升级与保级(积分兑换原理相同)

会员可以分为,钻石,白金,金卡,银卡…

部分客户会因为不了解自身积分情况,错失升级机会,客户和航空公司都会有损失

在会员接近升级前,对高价值客户进行促销活动,刺激他们消费达到标准,双方获利

4. 交叉销售
通过发行联名卡与非航空公司各做,使得企业在其他企业消费过程中获得本公司的积分,增强与本公司联系,提高忠诚度。

5. 管理模式
企业要获得长期的丰厚利润,必须需要大量稳定的、高质量的客户

维持老客户的成本远远低于新客户,保持优质客户是十分重要的

精准营销中,也有成本因素,所以按照客户价值排名,进行优先的,特别的营销策略,是维持客户的关键。



小结

本文,结合航空公司客户价值案例的分析,重点介绍了数据挖掘算法中K-Means聚类算法的应用。 针对,传统RFM模型的不足,结合案例进行改造,设定了五个指标的LRFMC模型。最后通过聚类的结果,选出客户价值排行,并且制定相应策略。



往期精彩回顾












网络大数据
 (ID:raincent_com)


网络大数据 www.raincent.com
致力于打造中国最专业的网络大数据科学门户网站。


Zun5KH1wPcPwyYpN.jpg
识别二维码,关注网络大数据
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册