门户
图库
科技
数据
VR
区块链
学院
论坛
百科
导航
登录
注册
帮助
公社首页
中国人工智能社区
公社版块
公社群组
Group
升级会员
用户名
Email
自动登录
找回密码
密码
登录
立即注册
登录后你可以:
登录
首次使用?
点我去注册
搜索
搜索
本版
帖子
公社群组
用户
道具
勋章
任务
设置
我的收藏
退出
首页
›
智能技术
›
机器学习
›
什么是机器学习
返回列表
什么是机器学习
[复制链接]
康1126
2024-4-11 12:04:36
显示全部楼层
|
阅读模式
一、机器学习是怎么发展起来,成为热搜的?
机器学习在20世纪50、60年代就已被提出,并成为当时的热门,中间潮起潮落,很长一段时间沉寂,不温不火。
但近几年随着与其相关的人工智能频繁上热搜,主要有以下原因:
算力提升:云计算、GPU硬件的发展
算法发展:神经网络由于其浅层结构,容易过拟合以及参数训练速度慢等原因,长期难以发展,而2006年后,深度学习相关的多层神经网络算法取得关键突破
热点应用:Google阿法狗大胜人类围棋大师
imagenet社区:该社区为算法提供了大量数据养料,对推动算法精度的提升作出突出贡献
二、机器学习到底是个啥?
机器学习相对人类学习。
目的是让机器能够像人类一样具备学习能力,能够感知世界、认知世界和改造世界。
感知世界:即视觉、听觉、触觉等感知能力,当前机器学习在感知世界方面已经和人类水平持平甚至超过人类;
认知世界:能够理解、思考和具备意识,机器学习在这方面处在起步和发展阶段;
改造世界:愚蠢的人类,呵呵。
我们要先看看人类是怎样学习的?
人类通过观察、阅读、经历等获取信息,然后使用归纳、演绎等方法进行学习,最后得到知识和智慧;
图1:人类学习与机器学习
而机器学习是通过数据训练,使用算法挖掘事物背后隐藏的规律和本质,得到模型。
机器学习可以简单理解由三大核心要素组成:
数据+算法=模型
。机器学习模型其实是对现实世界规律和本质的数字化抽象。
机器(数据) => 人类学习(观察、阅读、经历)
机器(算法) => 人类学习(归纳、演绎)
机器(模型) => 人类学习(知识/智慧)
机器学习的关键是数据,算法是其次。一般来说:
大数据集+一般算法
优于
小数据集+好算法
。
数据决定了机器学习的上限,算法只是逼近这个上限而已。
另外,机器学习相关的一些领域包括人工智能、大数据、深度学习等,它们之间的关系如下图:
图2:机器学习与相关领域的关系
三、机器学习怎么学习?
机器学习运作机理大概如下图(当然详细过程还有数据预处理、特征选择等,在此不做说明):
图2:机器学习与相关领域的关系
训练数据集:从历史数据集中拿出一部分数据作训练集,用来训练模型;
算法选择:一般会根据业务场景和经验从多种算法中,选定一个适合该业务场景的算法
模型训练:通过算法+数据(训练集)进行训练,得到初步的模型;
模型评估:输入测试集,通过一些指标,如准确率,评估模型的好坏;如果模型好则使用该模型,如果模型评估结果不好,则通过调整训练集、调整算法参数甚至更换算法,不断调整模型;
模型使用:将需要预测的数据输入至模型,得到最终的预测结果
从学习方式来说,机器学习还可分为监督学习、非监督学习、半监督学习,学习过程和上图类似,主要区别在于训练数据集里告不告诉机器正确答案。
训练集给定了正确答案的叫监督学习,主要用于分类预测和回归预测
训练集未指定正确答案的为非监督学习,主要用于聚类
机器学习重要的几个算法。
决策树 :基于规则的一种分类算法
朴素贝叶斯 :基于概率的一种分类算法,主要用于文本的分类
SVM :主要用于非线性可分的分类算法
KNN :基于距离的一种分类算法
线性回归:主要用于预测目标结果为连续值的问题
逻辑回归:主要用于预测目标结果为离散值的问题
神经网络 :主要用于深度学习
机器学习常见的算法引擎
SparkML
R
sklearn
Caffe
pytorch
tensorflow
kera
mxnet
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
回复
使用道具
举报
大神点评
3
kongdong
2024-4-11 17:37:05
显示全部楼层
有点兴趣,要有详细介绍就好啦。
回复
使用道具
举报
朝花丶待夕拾
2024-4-11 22:53:52
显示全部楼层
鄙视楼下的顶帖没我快,哈哈
回复
使用道具
举报
木木阿姨最温油
2024-4-12 07:04:11
显示全部楼层
回个帖子,下班咯~
回复
使用道具
举报
发表新帖
回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
本版积分规则
发表回复
回帖后跳转到最后一页
康1126
金牌会员
0
关注
0
粉丝
95
帖子
Ta的主页
发布
加好友
最近发表
上海颁发首批无人驾驶车牌?系误读,识别标牌并非车牌
智能穿戴概念30日主力净流出14.08亿元,中兴通讯、大唐电信居前
青岛有屋科技取得一种安装组件及用于智能家居的集成控制装置专利
无人机和反无人机装备亮相中国航展
智能穿戴概念18日主力净流出74.39亿元,三六零、光启技术居前
“空中航母”来了!中国“九天”无人机亮相,机身这七个字不好惹
公社版块
版块推荐
更多版块
智能穿戴
智能家居
机器人
无人驾驶
无人机
反馈吐槽
闲聊灌水
大话智能
大数据
图像识别
自然语言
数据挖掘
大话智能
数据挖掘
北大讲座
清华讲座
网贷观察
股市评论
区块链
闲聊灌水
反馈吐槽
站务通知
关注我们