门户
图库
科技
数据
VR
区块链
学院
论坛
百科
导航
登录
注册
帮助
公社首页
中国人工智能社区
公社版块
公社群组
Group
升级会员
用户名
Email
自动登录
找回密码
密码
登录
立即注册
登录后你可以:
登录
首次使用?
点我去注册
搜索
搜索
本版
帖子
公社群组
用户
道具
勋章
任务
设置
我的收藏
退出
首页
›
智能技术
›
机器学习
›
什么是机器学习
返回列表
什么是机器学习
[复制链接]
康1126
2024-4-11 12:04:36
显示全部楼层
|
阅读模式
一、机器学习是怎么发展起来,成为热搜的?
机器学习在20世纪50、60年代就已被提出,并成为当时的热门,中间潮起潮落,很长一段时间沉寂,不温不火。
但近几年随着与其相关的人工智能频繁上热搜,主要有以下原因:
算力提升:云计算、GPU硬件的发展
算法发展:神经网络由于其浅层结构,容易过拟合以及参数训练速度慢等原因,长期难以发展,而2006年后,深度学习相关的多层神经网络算法取得关键突破
热点应用:Google阿法狗大胜人类围棋大师
imagenet社区:该社区为算法提供了大量数据养料,对推动算法精度的提升作出突出贡献
二、机器学习到底是个啥?
机器学习相对人类学习。
目的是让机器能够像人类一样具备学习能力,能够感知世界、认知世界和改造世界。
感知世界:即视觉、听觉、触觉等感知能力,当前机器学习在感知世界方面已经和人类水平持平甚至超过人类;
认知世界:能够理解、思考和具备意识,机器学习在这方面处在起步和发展阶段;
改造世界:愚蠢的人类,呵呵。
我们要先看看人类是怎样学习的?
人类通过观察、阅读、经历等获取信息,然后使用归纳、演绎等方法进行学习,最后得到知识和智慧;
图1:人类学习与机器学习
而机器学习是通过数据训练,使用算法挖掘事物背后隐藏的规律和本质,得到模型。
机器学习可以简单理解由三大核心要素组成:
数据+算法=模型
。机器学习模型其实是对现实世界规律和本质的数字化抽象。
机器(数据) => 人类学习(观察、阅读、经历)
机器(算法) => 人类学习(归纳、演绎)
机器(模型) => 人类学习(知识/智慧)
机器学习的关键是数据,算法是其次。一般来说:
大数据集+一般算法
优于
小数据集+好算法
。
数据决定了机器学习的上限,算法只是逼近这个上限而已。
另外,机器学习相关的一些领域包括人工智能、大数据、深度学习等,它们之间的关系如下图:
图2:机器学习与相关领域的关系
三、机器学习怎么学习?
机器学习运作机理大概如下图(当然详细过程还有数据预处理、特征选择等,在此不做说明):
图2:机器学习与相关领域的关系
训练数据集:从历史数据集中拿出一部分数据作训练集,用来训练模型;
算法选择:一般会根据业务场景和经验从多种算法中,选定一个适合该业务场景的算法
模型训练:通过算法+数据(训练集)进行训练,得到初步的模型;
模型评估:输入测试集,通过一些指标,如准确率,评估模型的好坏;如果模型好则使用该模型,如果模型评估结果不好,则通过调整训练集、调整算法参数甚至更换算法,不断调整模型;
模型使用:将需要预测的数据输入至模型,得到最终的预测结果
从学习方式来说,机器学习还可分为监督学习、非监督学习、半监督学习,学习过程和上图类似,主要区别在于训练数据集里告不告诉机器正确答案。
训练集给定了正确答案的叫监督学习,主要用于分类预测和回归预测
训练集未指定正确答案的为非监督学习,主要用于聚类
机器学习重要的几个算法。
决策树 :基于规则的一种分类算法
朴素贝叶斯 :基于概率的一种分类算法,主要用于文本的分类
SVM :主要用于非线性可分的分类算法
KNN :基于距离的一种分类算法
线性回归:主要用于预测目标结果为连续值的问题
逻辑回归:主要用于预测目标结果为离散值的问题
神经网络 :主要用于深度学习
机器学习常见的算法引擎
SparkML
R
sklearn
Caffe
pytorch
tensorflow
kera
mxnet
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
回复
使用道具
举报
大神点评
3
kongdong
2024-4-11 17:37:05
显示全部楼层
有点兴趣,要有详细介绍就好啦。
回复
使用道具
举报
朝花丶待夕拾
2024-4-11 22:53:52
显示全部楼层
鄙视楼下的顶帖没我快,哈哈
回复
使用道具
举报
木木阿姨最温油
2024-4-12 07:04:11
显示全部楼层
回个帖子,下班咯~
回复
使用道具
举报
发表新帖
回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
本版积分规则
发表回复
回帖后跳转到最后一页
康1126
金牌会员
0
关注
0
粉丝
95
帖子
Ta的主页
发布
加好友
最近发表
道明光学:生产的石墨烯散热膜可应用于手机、平板、电脑及智能穿
新加坡媒体:为妥善照顾公园鸟类,新加坡飞禽公园3款机器人明年
智能家居概念20日主力净流入16.09亿元,宜通世纪、和而泰居前
一架无人机坠毁在以北部居民楼内 暂无人员伤亡报告
“机器人之战”:俄乌冲突1000天激发AI军事化热潮
上海颁发首批无人驾驶车牌?系误读,识别标牌并非车牌
公社版块
版块推荐
更多版块
智能穿戴
智能家居
机器人
无人驾驶
无人机
反馈吐槽
闲聊灌水
大话智能
大数据
图像识别
自然语言
数据挖掘
大话智能
数据挖掘
北大讲座
清华讲座
网贷观察
股市评论
区块链
闲聊灌水
反馈吐槽
站务通知
关注我们