智客公社
标题:
基于深度学习的自然语言处理
[打印本页]
作者:
高台高高画角
时间:
2018-10-14 20:51
标题:
基于深度学习的自然语言处理
[attach]51768[/attach][attach]51769[/attach][attach]51770[/attach]
基于深度学习的自然语言处理
——某客服中心客户营销可能性分析
1
背景
客服中心直面客户,每天要接听10万余次电话,与上万个客户打交道。在目前网点客流日益减少的情况下,客户中心作为与客户沟通的重要渠道作用日益凸显。如何提升客服中心的营销水平,成为某客服中心最为关注的问题之一。
本文主要研究通过客户电话录音,利用深度学习技术来识别客户营销可能性。
2
模型设计及对比
我们对某客服中心的20518条电话录音进行语音识别,由业务专家进行对其打上“可营销客户”、“不可营销客户”的标签,正负样本数目如下:
[attach]51771[/attach]我们设计了5个模型,分别为简单神经网络、简单CNN、FastText(分别作了1-gram,2-gram两个模型)、TextCNN,运行环境为Keras + Tensorflow后端,采用jieba作为中文粉刺软件,GPU为NVidia GTX1060 6G。
各模型结构如下:
Simple NN:
[attach]51772[/attach]CNN:
[attach]51773[/attach]FastText:
[attach]51774[/attach]TextCNN:
[attach]51775[/attach][attach]51776[/attach]对比结果如下:
[attach]51778[/attach]各模型训练的准确率和损失对比图:
[attach]51780[/attach][attach]51782[/attach][attach]51784[/attach][attach]51786[/attach][attach]51787[/attach][attach]51788[/attach][attach]51789[/attach][attach]51790[/attach][attach]51791[/attach][attach]51792[/attach]3
总结
从上面对比我们可以看出,FastText模型很好的取得了训练时间和准确率的平衡,同时也很好地抑制了过拟合,其余几种模型都存在过拟合问题。
就本数据集来说,FastText1-gram和2-gram效果差不多。
因此,我们建议在短文本分类上,推荐采用FastText 1-gram模型进行分类。
本文简单地对比了几种模型,没有对各种参数进行调优,同时由于第三方语音识别的准确率不高,大概只有80%左右,这个因素也会影响到模型的准确率。
4
展望
1、我们在做客户画像的时候总是从一些客观数据入手。比如客户的身份信息、账户信息等。但是总有一些客户他在银行内的客户评级系统中评级不是很高且账户中的活期、定期存款也不是很多。但是这并不一定就代表这个客户本身没有“钱”。可以尝试把客户意愿加入到客户画像当中,使我们的画像更完善。
2、如果有足够的数据和标签来训练模型,那在语音识别系统中在客户提出问题后就能更准确的给出满意答案。
转载本公众号文章请联系我们
◆ 公众号内容仅用于内部分享
◆ “工作随笔”欢迎投稿:
zouli@abchina.com
顾 问:赵维平
杜 俊
主 编:张 勇
轮值编辑:马 凯
邹 黎
轮值审稿:陈宏晓
[attach]51793[/attach]
识别二维码,
了解【数说吧】
欢迎光临 智客公社 (https://bbs.cnaiplus.com/)
Powered by Discuz! X3.5