智客公社

标题: 机器学习概述 [打印本页]

作者: hqingxi    时间: 2022-4-21 14:42
标题: 机器学习概述
[attach]710103[/attach]

1.什么是人工智能,是计算机科学的一个分支学科,主要研究用计算机模拟人的思考方式和行为方式,从而在某些领域代替人进行工作。
2.人工智能的学科体系
3.人工智能与传统软件的区别
传统软件,执行人的指令和算法,在执行之前人已经给出了解决方法,无法超越人的思想和认知范围。
人工智能,尝试突破人的思想和认知范畴,使得计算机拥有自主的的学习能力,尝试解决传统计算机无法解决的难题。
4.什么是机器学习,百度的定义如下:
“机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计 算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
它是人工智能核心,是使计算机具有智能的根本途径。”
4.1我们为什么需要机器学习。
实现程序的自我升级。
解决那些过于复杂的算法问题,甚至是没有已知算法的问题。
从机器学习中获得洞见,启发人类。
5.机器学习的形式
5.1建模问题,基本形式就是对已有数据进行统计、推理的方法,来寻找一个接受特定的输入X,并给出预期输出Y功能的函数。
5.2评估问题,针对已知的输入,函数给出输出与实际的目标值存在一定的误差,因此需要构建一个评估体系,根据误差得到大小判定模型的优劣。
5.3优化问题,学习的核心是改善性能,通过对数据和算法的反复训练,不断通过提升函数预测的准确性,直至获得满足实际需求的最优解,这个过程就是机器学习。
6.机器学习的分类
6.1有监督、无监督、半监督
有监督学习,在对已知数据标注的情况下对模型进行训练,根据输出进行调整和优化称为有监督学习。
无监督学习,没有已知输出的学习,仅仅根据数据输入的相关性进行类别的划分。
半监督,先通过无监督学习对类别进行划分,再通过人工标记的方式来实现预测输出。
强化学习,通过对不同决策成果得到奖励、惩罚、使用机器学习系统在经过足够长的训练时间后,越来越倾向于期望的结果输出。
6.2批量学习,增量学习
批量学习,将学习过程和应用过程区分开来,用全部的训练数据训练模型,然后再再实际应用场景中进行预测,当预测结果不理想的时候重新回到学习过程,循环往复。
增量学习,将学习过程和应用过程统一起来,在应用的同时,使用新的数据不断地迭代训练,一边预测,一边训练。
6.3基于模型学习、基于实例的学习
基于模型的学习,根据样本数量建立输入和输出之间的数学关系。
基于实例的学习,根据以往的经验,寻找待预测与已输入样本之间的相似程度,预测结果。
7.机器学习实现的一般过程
8.机器学习的典型应用
9.机器学习的基本问题
9.1回归问题,根据已知的输入和输出找出最佳性能的模型,预测得到连续的输出,例如根据房屋的面积、年龄、地段预测房屋的价格。
9.2分类问题,根据已知的输入和输出找出最佳性能的模型,预测得到离散的输出,例如手写文字的识别,工业品的检测等。
9.3聚类问题,根据已知输入的相似度,将其划分为不同的群落,比如根据花蕊的长度划分品种。
9.4降维问题,在性能损失尽可能小的情况下,降低数据的复杂度,使得数据规模缩小的问题。
10.数据的预处理
目的,去除无效的数据,不规范的数据,错误的数据;补齐缺失值,对数据范围、量纲、格式、类型进行统一的处理。
数据预处理的方法:
标准化,也称为均值移除,让样本数据中每一列的数据均值为0,标准差为1,。
范围缩放,让数据更加规范,是的特征范围具有可比性,将样本矩阵中的每一列最小值和最大值设定为相同的空间,统一个特征值得范围。
归一化,使得数据限定在一定的范围内,从而消除奇异样本导致的不良影响。
二值化,有些情况下不需要分析详细数据,将特征使用0和1表示,二值化后数组中的元素非0即1,但需要注意这个过程是不可逆的,且过程中会有信息的损失。
独热编码,根据一个特征中值的个数来建立一个由1和若干个0组成的序列,用序列值对所有的特征值进行编码。
标签编码,根据字符串形式的特征值在特征序列中的位置,来为其确定一个数字标签、

[attach]710104[/attach]
作者: xujiahui    时间: 2022-4-21 14:43
机器学习概述
作者: 阿琪love锋    时间: 2022-4-24 13:12
不错 支持下




欢迎光临 智客公社 (http://bbs.cnaiplus.com/) Powered by Discuz! X3.4