门户
图库
科技
数据
VR
区块链
学院
论坛
百科
导航
登录
注册
帮助
公社首页
中国人工智能社区
公社版块
公社群组
Group
升级会员
用户名
Email
自动登录
找回密码
密码
登录
立即注册
登录后你可以:
登录
首次使用?
点我去注册
搜索
搜索
本版
帖子
公社群组
用户
道具
勋章
任务
设置
我的收藏
退出
首页
›
智能技术
›
机器学习
›
机器学习的方法
返回列表
机器学习的方法
[复制链接]
真的没掉牙
2022-7-11 16:46:07
显示全部楼层
|
阅读模式
最近在学习python机器学习和机器学习(西瓜书)将自己的学习过程总结与大家一起分享。
机器学习(machine learning)是一门多领域交叉学科,涉及了概率论、统计学、算法复杂度等多门学科。专门研究计算机怎样模拟或实现人的学习行为,它能够发现和挖掘数据所包含的潜在价值。机器学习已经成为了人工智能的一个分支,通过自学习算法,发现和挖掘数据潜在的规律,从而对未知的数据进行预测。机器学习已经广泛的运用在了,计算机科学研究、自然语言处理、机器视觉、语音、游戏等。机器学习的方法主要分为三种,监督学习(supervised learging)、无监督学习(unsupervised learning)、强化学习(reinforcement learning),下面将介绍这三种方法的本质区别以及它们的应用领域。
一、监督学习
训练过程
上图展示了监督学习训练模型的过程,在监督学习中的训练数据是带类标的。监督学习通过使用有类标的训练数据构建模型,我们可以通过训练得到的模型对未知的数据进行预测。比如,在对手写数字识别所使用的机器学习算法就属于监督学习,在训练模型之前,我们需要先定义那张图片表示的是数字几,以便计算机从数据中提取特征更好的像类标靠近。监督学习可以被分为分类和回归,像上面手写数字的识别就属于监督学习中的分类,像房间的预测就属于回归。
1、分类
分类是基于对于已知数据(带类标)的学习,实现对新样本类标的预测。类标是离散的、无序的值。像对于垃圾邮件的分类就属于二分类,其中五角星表示非垃圾邮件而原表示垃圾邮件,而我们所需要训练的模型就是图中的直线,能够将垃圾邮件和分垃圾邮件进行区分。我们可以将横轴和纵轴理解为对于区分邮件的两个特征,可以发现这些数据都是离散的。上面所提到的手写数字的识别属于多分类。
分类
2、回归
回归是针对连续型输出变量进行预测,我们通过从大量的数据中寻找自变量(输入)和相应连续的因变量(输出)之间的关系,通过学习这种关系来对未知的数据进行预测。如下图,通过自变量和因变量来拟合一条直线,使得训练数据与拟合直线之间的距离最短,最常用的距离是采用平均平方距离。通过对训练数据的分析我们可以获取到这条直线的斜率和截距,从而可以对于未知数据进行预测。
回归
二、强化学习
强化学习是通过构建一个系统(agent),在与环境(environment)交互的过程中提高系统的性能。环境的当前状态信息会包括一个反馈信号,我们可以通过这个反馈信号对当前的系统进行评价改善系统。通过与环境的交互,agent可以通过强化学习来得到一系列行为,通过对激励系统的设计使得正向反馈最大。强化学习经常被使用在游戏领域,比如围棋比赛,系统会根据当前棋盘上的局态来决定下一步的位置,通过游戏结束时的胜负来作为激励信号。
强化学习
三、无监督学习
无监督学习所处理的是无类标或者数据的总体趋势不明朗,通过无监督学习我们可以将这些不知道类标和输出标量以及没有反馈信号的情况下,来寻找数据中所潜在的规律。无监督学习可以分为聚类和降维。
1、聚类
聚类属于一种探索性的数据分析技术,在没有任何已知信息(类标、输出变量、反馈信号)的情况下,我们可以将数据划分为簇。在分析数据的时候,所划分的每一个簇中的数据都有一定的相似度,而不同簇之间具有较大的区别。
聚类
2、降维
在实际情况中所处理的数据都是高维的(成百上千),那么这将会导致我们每次所处理的数据量是非常的庞大,而存储空间通常都是有限的。无监督的降维技术经常被使用在数据特征的预处理中,通过降维技术我们可以去掉数据中的噪声,以及不同维度中所存在的相似特征,最大程度上在保留数据的重要信息情况下将数据压缩到一个低维的空间中,但同时也还是会降低算法的准确性。
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
回复
使用道具
举报
大神点评
3
kulelala
2022-7-11 22:00:12
来自手机
显示全部楼层
发发呆,回回帖,工作结束~
回复
使用道具
举报
过敏的家
2022-7-13 10:29:33
显示全部楼层
珍爱生命,果断回帖。
回复
使用道具
举报
linda80
2022-7-14 15:07:25
显示全部楼层
沙发???
回复
使用道具
举报
发表新帖
回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
本版积分规则
发表回复
回帖后跳转到最后一页
真的没掉牙
高级会员
0
关注
0
粉丝
99
帖子
Ta的主页
发布
加好友
最近发表
智能家居概念20日主力净流入16.09亿元,宜通世纪、和而泰居前
一架无人机坠毁在以北部居民楼内 暂无人员伤亡报告
“机器人之战”:俄乌冲突1000天激发AI军事化热潮
上海颁发首批无人驾驶车牌?系误读,识别标牌并非车牌
智能穿戴概念30日主力净流出14.08亿元,中兴通讯、大唐电信居前
青岛有屋科技取得一种安装组件及用于智能家居的集成控制装置专利
公社版块
版块推荐
更多版块
智能穿戴
智能家居
机器人
无人驾驶
无人机
反馈吐槽
闲聊灌水
大话智能
大数据
图像识别
自然语言
数据挖掘
大话智能
数据挖掘
北大讲座
清华讲座
网贷观察
股市评论
区块链
闲聊灌水
反馈吐槽
站务通知
关注我们