智客公社
标题:
什么是机器学习
[打印本页]
作者:
赤胆法援
时间:
2022-7-6 09:13
标题:
什么是机器学习
什么是机器学习?
机器学习就是让计算机具有像人一样的学习能力的技术,是从大数据中寻找有用信息的数据挖掘技术,进而去支持决策。
[attach]760148[/attach]
人类学习的过程:观察过去发生的大量事实--归纳总结并大胆作出假设--验证假设并得到规律,也就是我们常说的经验,在遇到新的问题根据经验将问题代入规律中进而预测未来。
机器学习的过程:收集与问题大量相关的历史数据--借助科学计算的方法挖掘数据中特征之间的关联关系--得到代表特征关系的模型,而后在遇到新的问题时,只需要将相关的数据输入模型即可预测未知的属性。
[attach]760149[/attach]
在正式开始之前,先理解一些基本的概念将会让后续对机器学习的学习更加轻松。
数据集:收集到的用于训练和验证模型的数据的集合称之数据集。示例/样本/特征向量:数据集中描述一个事件或对象的每一条记录。属性/特征:反映事件或对象在某方面的表现或性质的事项。属性值:属性上的取值。属性空间/样本空间/输入空间:属性张开的空间。如由三个特征分别为xyz轴可组成一个三维空间,每个样本都可以在这个空间中找到自己的位置。学习/训练:算法从历史数据中学习的过程。训练数据:训练过程中使用的数据。训练样本:训练数据中的样本。label:训练样本的结果信息。如根据已有的身高、体重、肺活量、性别等数据训练一个模型,根据其他特征来预测样本的性别,这里的性别就是label。
机器学习的种类
有监督学习:训练数据中有label的学习。
无监督学习:训练数据中无label的学习。
强化学习/增强学习:与有监督学习类似,也是使机器获得对没有学习过的问题的泛化能力,但学习过程中并没有label,但算法会对训练结果进行自我评估,进而不断的进行学习。
常用的机器学习方法
[attach]760150[/attach]
机器学习建模流程
机器学习是一种数据挖掘的技术,而对机器学习建模的整个过程总结最全面的要属"跨行业标准的数据挖掘流程"。主要过程为:商业理解--数据理解--数据准备--数据建模--模型评估--模型发布。
[attach]760151[/attach]
1.商业理解
从商业角度全面了解项目需求和主要目标,并将需求和目标转化为数据挖掘中的定义和目标。主要事项有确定商业目标,评估环境,确定数据挖掘目标,制定项目计划。
2.数据理解
对数据的可用性进行评估,发现有用的数据和数据的潜在价值。主要事项有收集原始数据,描述数据,探索数据,检验数据质量。
3.数据准备
将原始数据处理成最终建模需要的数据。该过程可能需要多次执行,是非常重要且耗时的一步。主要事项有特征选择、数据清洗、数据预处理、数据转化、特征工程等。
4.数据建模
使用机器学习模型进行建模,并对参数进行调优。主要事项有选择建模技术、生成测试设计、构建模型、评估模型。
5.模型评估
通过训练得到了高质量的模型,在正式部署前要对模型做全面的评估。目的主要是判断模型是否达到了既定的商业目标,是否有改进空间。
6.部署
建模结束之后便是把模型部署应用起来,并对后续的监控和维护做出规划。
[attach]760152[/attach]
以上主要从宏观的角度对机器学习做了简单的介绍,在了解了这些基础的知识后,我们就可以对学习数据挖掘和机器学习建模做出整体的规划了。
作者:
陌小姐
时间:
2022-7-6 09:14
转发了
作者:
啊优
时间:
2022-7-7 17:56
赞赞赞赞赞赞赞赞
作者:
昊乐23
时间:
2022-7-8 22:34
赞一个!
作者:
321顽童乐天下
时间:
2022-7-9 08:16
我是个凑数的。。。
欢迎光临 智客公社 (http://bbs.cnaiplus.com/)
Powered by Discuz! X3.4