找回密码
 立即注册
搜索

机器学习概述



1.什么是人工智能,是计算机科学的一个分支学科,主要研究用计算机模拟人的思考方式和行为方式,从而在某些领域代替人进行工作。
2.人工智能的学科体系


    • 机器学习,人工智能的一个子学科,研究人工智能领域的基本算法、原理、思想方法,机器学习研究在子学科都会应用。
    • 计算机视觉,研究计算机处理、识别、理解图像、视频的相关技术。
    • 自然语言处理,研究计算机理解人类语言的相关技术。
    • 语音处理,研究计算机理解、识别、合成语音的相关技术。

3.人工智能与传统软件的区别
传统软件,执行人的指令和算法,在执行之前人已经给出了解决方法,无法超越人的思想和认知范围。
人工智能,尝试突破人的思想和认知范畴,使得计算机拥有自主的的学习能力,尝试解决传统计算机无法解决的难题。
4.什么是机器学习,百度的定义如下:
“机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计 算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
它是人工智能核心,是使计算机具有智能的根本途径。”
4.1我们为什么需要机器学习。
实现程序的自我升级。
解决那些过于复杂的算法问题,甚至是没有已知算法的问题。
从机器学习中获得洞见,启发人类。
5.机器学习的形式
5.1建模问题,基本形式就是对已有数据进行统计、推理的方法,来寻找一个接受特定的输入X,并给出预期输出Y功能的函数。
5.2评估问题,针对已知的输入,函数给出输出与实际的目标值存在一定的误差,因此需要构建一个评估体系,根据误差得到大小判定模型的优劣。
5.3优化问题,学习的核心是改善性能,通过对数据和算法的反复训练,不断通过提升函数预测的准确性,直至获得满足实际需求的最优解,这个过程就是机器学习。
6.机器学习的分类
6.1有监督、无监督、半监督
有监督学习,在对已知数据标注的情况下对模型进行训练,根据输出进行调整和优化称为有监督学习。
无监督学习,没有已知输出的学习,仅仅根据数据输入的相关性进行类别的划分。
半监督,先通过无监督学习对类别进行划分,再通过人工标记的方式来实现预测输出。
强化学习,通过对不同决策成果得到奖励、惩罚、使用机器学习系统在经过足够长的训练时间后,越来越倾向于期望的结果输出。
6.2批量学习,增量学习
批量学习,将学习过程和应用过程区分开来,用全部的训练数据训练模型,然后再再实际应用场景中进行预测,当预测结果不理想的时候重新回到学习过程,循环往复。
增量学习,将学习过程和应用过程统一起来,在应用的同时,使用新的数据不断地迭代训练,一边预测,一边训练。
6.3基于模型学习、基于实例的学习
基于模型的学习,根据样本数量建立输入和输出之间的数学关系。
基于实例的学习,根据以往的经验,寻找待预测与已输入样本之间的相似程度,预测结果。
7.机器学习实现的一般过程

  • 数据收集,手工采集或者来源于数据库,公开资料或者爬虫等。
  • 数据清洗,数据规范、剔除误差较大和无意义数据。
  • 模型选择,分类、回归等。
  • 训练模型
  • 模型评估
  • 测试模型
  • 应用模型
  • 模型维护
8.机器学习的典型应用

  • 股票价格的预测
  • 推荐系统
  • 自然语言处理
  • 语音处理,语音识别、语音合成等
  • 图像是识别、人脸识别
9.机器学习的基本问题
9.1回归问题,根据已知的输入和输出找出最佳性能的模型,预测得到连续的输出,例如根据房屋的面积、年龄、地段预测房屋的价格。
9.2分类问题,根据已知的输入和输出找出最佳性能的模型,预测得到离散的输出,例如手写文字的识别,工业品的检测等。
9.3聚类问题,根据已知输入的相似度,将其划分为不同的群落,比如根据花蕊的长度划分品种。
9.4降维问题,在性能损失尽可能小的情况下,降低数据的复杂度,使得数据规模缩小的问题。
10.数据的预处理
目的,去除无效的数据,不规范的数据,错误的数据;补齐缺失值,对数据范围、量纲、格式、类型进行统一的处理。
数据预处理的方法:
标准化,也称为均值移除,让样本数据中每一列的数据均值为0,标准差为1,。
范围缩放,让数据更加规范,是的特征范围具有可比性,将样本矩阵中的每一列最小值和最大值设定为相同的空间,统一个特征值得范围。
归一化,使得数据限定在一定的范围内,从而消除奇异样本导致的不良影响。
二值化,有些情况下不需要分析详细数据,将特征使用0和1表示,二值化后数组中的元素非0即1,但需要注意这个过程是不可逆的,且过程中会有信息的损失。
独热编码,根据一个特征中值的个数来建立一个由1和若干个0组成的序列,用序列值对所有的特征值进行编码。
标签编码,根据字符串形式的特征值在特征序列中的位置,来为其确定一个数字标签、

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

大神点评2

xujiahui 2022-4-21 14:43:44 显示全部楼层
机器学习概述
回复

使用道具 举报

阿琪love锋 2022-4-24 13:12:10 显示全部楼层
不错 支持下
回复

使用道具 举报

高级模式
B Color Image Link Quote Code Smilies