找回密码
 立即注册
搜索

什么是机器学习

什么是机器学习?

机器学习就是让计算机具有像人一样的学习能力的技术,是从大数据中寻找有用信息的数据挖掘技术,进而去支持决策。



人类学习的过程:观察过去发生的大量事实--归纳总结并大胆作出假设--验证假设并得到规律,也就是我们常说的经验,在遇到新的问题根据经验将问题代入规律中进而预测未来。

机器学习的过程:收集与问题大量相关的历史数据--借助科学计算的方法挖掘数据中特征之间的关联关系--得到代表特征关系的模型,而后在遇到新的问题时,只需要将相关的数据输入模型即可预测未知的属性。



在正式开始之前,先理解一些基本的概念将会让后续对机器学习的学习更加轻松。
    数据集:收集到的用于训练和验证模型的数据的集合称之数据集。示例/样本/特征向量:数据集中描述一个事件或对象的每一条记录。属性/特征:反映事件或对象在某方面的表现或性质的事项。属性值:属性上的取值。属性空间/样本空间/输入空间:属性张开的空间。如由三个特征分别为xyz轴可组成一个三维空间,每个样本都可以在这个空间中找到自己的位置。学习/训练:算法从历史数据中学习的过程。训练数据:训练过程中使用的数据。训练样本:训练数据中的样本。label:训练样本的结果信息。如根据已有的身高、体重、肺活量、性别等数据训练一个模型,根据其他特征来预测样本的性别,这里的性别就是label。

机器学习的种类

有监督学习:训练数据中有label的学习。

无监督学习:训练数据中无label的学习。

强化学习/增强学习:与有监督学习类似,也是使机器获得对没有学习过的问题的泛化能力,但学习过程中并没有label,但算法会对训练结果进行自我评估,进而不断的进行学习。

常用的机器学习方法




机器学习建模流程

机器学习是一种数据挖掘的技术,而对机器学习建模的整个过程总结最全面的要属"跨行业标准的数据挖掘流程"。主要过程为:商业理解--数据理解--数据准备--数据建模--模型评估--模型发布。



1.商业理解

从商业角度全面了解项目需求和主要目标,并将需求和目标转化为数据挖掘中的定义和目标。主要事项有确定商业目标,评估环境,确定数据挖掘目标,制定项目计划。

2.数据理解

对数据的可用性进行评估,发现有用的数据和数据的潜在价值。主要事项有收集原始数据,描述数据,探索数据,检验数据质量。

3.数据准备

将原始数据处理成最终建模需要的数据。该过程可能需要多次执行,是非常重要且耗时的一步。主要事项有特征选择、数据清洗、数据预处理、数据转化、特征工程等。

4.数据建模

使用机器学习模型进行建模,并对参数进行调优。主要事项有选择建模技术、生成测试设计、构建模型、评估模型。

5.模型评估

通过训练得到了高质量的模型,在正式部署前要对模型做全面的评估。目的主要是判断模型是否达到了既定的商业目标,是否有改进空间。

6.部署

建模结束之后便是把模型部署应用起来,并对后续的监控和维护做出规划。



以上主要从宏观的角度对机器学习做了简单的介绍,在了解了这些基础的知识后,我们就可以对学习数据挖掘和机器学习建模做出整体的规划了。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

大神点评4

陌小姐 2022-7-6 09:14:22 显示全部楼层
转发了
回复

使用道具 举报

啊优 2022-7-7 17:56:57 显示全部楼层
赞赞赞赞赞赞赞赞
回复

使用道具 举报

昊乐23 2022-7-8 22:34:25 来自手机 显示全部楼层
赞一个!
回复

使用道具 举报

我是个凑数的。。。
回复

使用道具 举报

高级模式
B Color Image Link Quote Code Smilies