智客公社

标题: Python机器学习(八)之数据挖掘整体介绍 [打印本页]

作者: 滇之风    时间: 2022-3-13 20:16
标题: Python机器学习(八)之数据挖掘整体介绍
一、前言

文中部分内容来自书籍和网络,部分内容为自己的理解。希望借助笔记的方式能够加深自己对该部分知识的掌握,也作为日后回顾的记录。
二、基本概念

很多小伙伴听到数据挖掘这四个字的时候很困惑,虽然字面意思大家都知道,但是数据挖掘到底是个什么东西,需要用到什么技术来实现却并不了解,下面我们就来剖析一下,到底什么是数据挖掘。
按照惯例,先来一个百度百科的定义:
数据挖掘(英语:Data mining),又译为资料探勘、数据采矿。它是数据库知识发现(英语:Knowledge-Discovery in Databases,简称:KDD)中的一个步骤。数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。
根据定义可以看出,数据挖掘是一个过程结果的称谓。即主要目标是从数据中挖取隐藏的信息。挖取的过程中会采用许多技术,包括运用一系列统计方法、模式识别、机器学习(归根结底都是统计方法啦)等等技术,来实现挖取隐藏信息的目的。
引用一张图来阐明数据挖掘在整个数据处理流程中的阶段和作用:




[attach]701160[/attach]

三、挖掘的数据对象

四、挖掘的模式


[attach]701161[/attach]

回归(regression):建立连续值函数模型
相关分析(relevance analysis):在做分类和回归之前,先识别与分类和回归过程显著相关的属性,其他不相关的属性可以不考虑。


[attach]701162[/attach]

五、数据挖掘使用的技术




[attach]701163[/attach]




[attach]701164[/attach]


[attach]701165[/attach]


[attach]701166[/attach]


[attach]701167[/attach]
作者: joy3118    时间: 2022-3-13 20:17
转发了
作者: 山葉小猴    时间: 2022-3-15 10:38
锄禾日当午,发帖真辛苦。谁知坛中餐,帖帖皆辛苦!
作者: 喝点酒脸就红    时间: 2022-3-16 17:37
顶一个,顶一个,顶一个




欢迎光临 智客公社 (http://bbs.cnaiplus.com/) Powered by Discuz! X3.4