门户
图库
科技
数据
VR
区块链
学院
论坛
百科
导航
登录
注册
帮助中心
公社首页
中国人工智能社区
公社版块
广播
Follow
升级会员
动态
Space
用户名
Email
自动登录
找回密码
密码
登录
立即注册
登录后你可以:
登录
首次使用?
点我去注册
搜索
搜索
本版
文章
帖子
公社群组
用户
好友
收藏
道具
勋章
任务
淘帖
动态
日志
相册
分享
记录
留言板
广播
群组
门户
导读
排行榜
设置
我的收藏
退出
首页
›
智能技术
›
数据挖掘
›
如何做好数据挖掘工作?
返回列表
如何做好数据挖掘工作?
[复制链接]
干掉自己
2022-6-24 09:53:41
显示全部楼层
|
阅读模式
一个完整的应用示例所需要经历的步骤
项目背景和业务分析需求的提出
数据分析师参与需求讨论
针对需求收集相关的背景数据和指标,与业务方一起熟悉背景中的相关业务逻辑,并收集业务方对需求的相关建议、看法,这些信息对于需求的确认和思路的规划乃至后期的分析都是至关重要的。从数据分析的专业角度评价初步的业务分析需求是否合理,是否可行。
制定需求分析框架和分析计划
分析需求转化成数据分析项目中目标变量的定义。分析思路的大致描述。分析样本的数据抽取规则。潜在分析变量(模型输入变量)的大致圈定和罗列。分析过程中的项目风险思考和主要的应对策略。项目的落地应用价值分析和展望。
抽取样本数据、熟悉数据、数据清晰和摸底
按计划初步搭建挖掘模型
进一步筛选模型的输入变量。尝试不同的挖掘算法和分析方法,并比较不同方案的效果、效率和稳定性。整理核心变量。
与业务方讨论模型的初步结论,提出新的思路和模型优化方案
按优化方案重新抽取样本并建模,提炼结论并验证模型
完成分析报告和落地应用建议
模型的预测效果和效率,以及在最新的实际数据中验证模型的结果,即模型的稳定性。通过模型整理出来的可以作为运营参考的重要自变量及相应的特征、规律。提出建议。
制定具体的落地应用方案和评估方案
业务方事实落地饮用方案并跟踪、评估效果
落地应用方案在实际效果评估后,不断修正完善
不同运营方案的评估、总结和反馈
项目应用后的总结和反思
数据挖掘建模的优化和限度
模型的优化和完善是有限度的。
数据挖掘模型的优化要遵循有效、适度的原则
如何有效地优化模型
从业务思路上优化:
有没有更加明显且直观的规则、指标可以代替复杂的建模?有没有一些明显的业务逻辑(业务假设)在前期的建模阶段被疏忽了呢?通过前期的初步建模和数据熟悉,是否有新的发现,甚至能颠覆之前的业务推测或业务直觉呢?目标变量的定义是否稳定?
从建模的技术思路上优化:
针对细分群体分别建模也是建模过程中常用的、有效的模型优化思路和方法之一。
从建模的技术技巧上优化
如何思考优化的限度
时效性、投入产出比
模型效果评价的主要指标体系
评价模型准确度和精度的系列指标
正确率、错误率、灵敏性、特效性、精度、错正率、负元正确率、正元错误率
ROC
KS
LIFT
模型稳定性的评估:不同时间窗口的数据
数据挖掘实践的质量保障流程和制度
一个有效的质量保障流程制度
业务需求的收集
明确责任人明确数据分析需求的两个来源需要给出需求文档
评估小组评估需求的优先级
需求评估小组定期(或不定期)对于各业务线的接口数据分析师所提交的业务分析需求进行评估。了解背景、数据、业务逻辑。需求评估小组负责人负责。
课题组的成立及前期摸底
向业务方提交课题(项目)计划书
数据分析挖掘的课题展开
向业务方提交结论报告及业务裸体应用建议
课题(项目)的落地应用和效果监控反馈
质量保障流程制度的非常重要
如何支持与强化质量保障流程制度
组织架构、项目管理、个人绩效考核
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
回复
使用道具
举报
大神点评
2
美丑一张脸Miss
2022-6-24 15:00:42
显示全部楼层
顶
回复
使用道具
举报
1550216188
2022-6-27 07:52:47
来自手机
显示全部楼层
楼主呀,,,您太有才了。。。
回复
使用道具
举报
发表新帖
回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
干掉自己
高级会员
0
关注
0
粉丝
85
帖子
Ta的主页
发布
发消息
加好友
最近发表
青岛海尔申请用于控制智能家居设备的方法及装置等专利,提高用户
最新AI大模型来了!马斯克发布Grok 3聊天机器人
菲律宾难受了,一架翼龙无人机飞向黄岩岛,可24小时不间断警戒
先进制造业进入爆发期 中国智能机器人产业崛起
智能家居-米家全屋智能方案
无人驾驶!亮相宜春一街头
公社版块
版块推荐
更多版块
智能穿戴
智能家居
机器人
无人驾驶
无人机
反馈吐槽
闲聊灌水
大话智能
大数据
图像识别
自然语言
数据挖掘
大话智能
数据挖掘
北大讲座
清华讲座
网贷观察
股市评论
区块链
闲聊灌水
反馈吐槽
站务通知
关注我们