门户
图库
科技
数据
VR
区块链
学院
论坛
百科
导航
登录
注册
帮助中心
公社首页
中国人工智能社区
公社版块
广播
Follow
升级会员
动态
Space
用户名
Email
自动登录
找回密码
密码
登录
立即注册
登录后你可以:
登录
首次使用?
点我去注册
搜索
搜索
本版
文章
帖子
公社群组
用户
好友
收藏
道具
勋章
任务
淘帖
动态
日志
相册
分享
记录
留言板
广播
群组
门户
导读
排行榜
设置
我的收藏
退出
首页
›
智能技术
›
数据挖掘
›
浅谈数据挖掘的基本概念及其最常用算法 ...
返回列表
浅谈数据挖掘的基本概念及其最常用算法
[复制链接]
乐鑫金缘
2022-6-25 17:48:24
显示全部楼层
|
阅读模式
当前,大数据的理论和应用正在国民经济和生活的各个领域如火如荼的进行。很多人对大数据的基本概念和特点已经有所了解,那么我们仅仅将大数据进行获取、存储、检索和共享是不够的,怎么样才能在大数据中找出未知的且有价值的信息和知识呢?
知识发现(KDD)就是从大数据中识别出有效的、新颖的、潜在有用的,以及最终可理解的模式的过程。
知识发现的流程图
数据挖掘是大数据知识发现(KDD)中不可缺少一部分,是大数据理论和应用中非常重要的一部分。数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但潜在的有用信息和知识的过程。大部分人是通过一个案例认识到数据挖掘:这是因为沃尔玛通过数据分析发现,男性顾客在购买婴儿尿片时,常常会顺便搭配几瓶啤酒来犒劳自己,于是尝试推出了将啤酒和尿布摆在一起的促销手段;没想到这个举措居然使尿布和啤酒的销量都大幅增加了。虽然这个故事很可能是假的, 但是确实让不少人开始接触数据挖掘。
数据挖掘基本框架
数据挖掘的最常用的几种算法:
(1)预测建模:将已有数据和模型用于对未知变量的语言。
1)分类,用于预测离散的目标变量
2)回归,用于预测连续的目标变量
(2)聚类分析:发现紧密相关的观测值组群,使得与属于不同簇的观测值相比,属于同一簇的观测值相互之间尽可能类似。
(3)关联分析(又称关系模式):反映一个事物与其他事物之间的相互依存性和关联性。用来发现描述数据中强关联特征的模式。
(4)异常检测:识别其特征显著不同于其他数据的观测值。
有时也把数据挖掘分为:分类,回归,聚类,关联分析。
数据挖掘的四种典型算法
数据挖掘和机器学习有区别,也有关系,我们将在以后的文章中对其进行介绍。
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
回复
使用道具
举报
大神点评
6
花痕709
2022-6-25 17:48:50
显示全部楼层
转发了
回复
使用道具
举报
spiegesq
2022-6-25 17:49:45
显示全部楼层
转发了
回复
使用道具
举报
志铭维权
2022-6-25 17:50:00
显示全部楼层
转发了
回复
使用道具
举报
ava04872003
2022-6-25 17:50:36
显示全部楼层
转发了
回复
使用道具
举报
@Xizi_19Br4ttB
2022-6-27 09:15:47
显示全部楼层
好,很好,非常好!
回复
使用道具
举报
新鲜旧情人い
2022-6-28 14:37:49
显示全部楼层
我擦!我要沙发!
回复
使用道具
举报
发表新帖
回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
乐鑫金缘
注册会员
0
关注
0
粉丝
16
帖子
Ta的主页
发布
发消息
加好友
最近发表
力合微:PLC技术助力智能家居实现无需布线的智能化升级
智能穿戴设备概念升温 消费电子板块或迎估值重塑
孙傲:中国古代的“机器人”
智能穿戴概念21日主力净流入11.27亿元,中兴通讯、兆易创新居前
成都朗泽创智申请物联网环境下的智能家居能源管理优化专利,降低
数说“三农”丨25万架植保无人机:春耕时节的科技新军
公社版块
版块推荐
更多版块
智能穿戴
智能家居
机器人
无人驾驶
无人机
反馈吐槽
闲聊灌水
大话智能
大数据
图像识别
自然语言
数据挖掘
大话智能
数据挖掘
北大讲座
清华讲座
网贷观察
股市评论
区块链
闲聊灌水
反馈吐槽
站务通知
关注我们