智客公社
标题:
什么是机器学习
[打印本页]
作者:
康1126
时间:
2024-4-11 12:04
标题:
什么是机器学习
一、机器学习是怎么发展起来,成为热搜的?
机器学习在20世纪50、60年代就已被提出,并成为当时的热门,中间潮起潮落,很长一段时间沉寂,不温不火。
但近几年随着与其相关的人工智能频繁上热搜,主要有以下原因:
算力提升:云计算、GPU硬件的发展
算法发展:神经网络由于其浅层结构,容易过拟合以及参数训练速度慢等原因,长期难以发展,而2006年后,深度学习相关的多层神经网络算法取得关键突破
热点应用:Google阿法狗大胜人类围棋大师
imagenet社区:该社区为算法提供了大量数据养料,对推动算法精度的提升作出突出贡献
二、机器学习到底是个啥?
机器学习相对人类学习。
目的是让机器能够像人类一样具备学习能力,能够感知世界、认知世界和改造世界。
感知世界:即视觉、听觉、触觉等感知能力,当前机器学习在感知世界方面已经和人类水平持平甚至超过人类;
认知世界:能够理解、思考和具备意识,机器学习在这方面处在起步和发展阶段;
改造世界:愚蠢的人类,呵呵。
我们要先看看人类是怎样学习的?
人类通过观察、阅读、经历等获取信息,然后使用归纳、演绎等方法进行学习,最后得到知识和智慧;
[attach]826722[/attach]
图1:人类学习与机器学习
而机器学习是通过数据训练,使用算法挖掘事物背后隐藏的规律和本质,得到模型。
机器学习可以简单理解由三大核心要素组成:
数据+算法=模型
。机器学习模型其实是对现实世界规律和本质的数字化抽象。
机器(数据) => 人类学习(观察、阅读、经历)
机器(算法) => 人类学习(归纳、演绎)
机器(模型) => 人类学习(知识/智慧)
机器学习的关键是数据,算法是其次。一般来说:
大数据集+一般算法
优于
小数据集+好算法
。
数据决定了机器学习的上限,算法只是逼近这个上限而已。
另外,机器学习相关的一些领域包括人工智能、大数据、深度学习等,它们之间的关系如下图:
[attach]826723[/attach]
图2:机器学习与相关领域的关系
三、机器学习怎么学习?
机器学习运作机理大概如下图(当然详细过程还有数据预处理、特征选择等,在此不做说明):
[attach]826724[/attach]
图2:机器学习与相关领域的关系
训练数据集:从历史数据集中拿出一部分数据作训练集,用来训练模型;
算法选择:一般会根据业务场景和经验从多种算法中,选定一个适合该业务场景的算法
模型训练:通过算法+数据(训练集)进行训练,得到初步的模型;
模型评估:输入测试集,通过一些指标,如准确率,评估模型的好坏;如果模型好则使用该模型,如果模型评估结果不好,则通过调整训练集、调整算法参数甚至更换算法,不断调整模型;
模型使用:将需要预测的数据输入至模型,得到最终的预测结果
从学习方式来说,机器学习还可分为监督学习、非监督学习、半监督学习,学习过程和上图类似,主要区别在于训练数据集里告不告诉机器正确答案。
训练集给定了正确答案的叫监督学习,主要用于分类预测和回归预测
训练集未指定正确答案的为非监督学习,主要用于聚类
机器学习重要的几个算法。
决策树 :基于规则的一种分类算法
朴素贝叶斯 :基于概率的一种分类算法,主要用于文本的分类
SVM :主要用于非线性可分的分类算法
KNN :基于距离的一种分类算法
线性回归:主要用于预测目标结果为连续值的问题
逻辑回归:主要用于预测目标结果为离散值的问题
神经网络 :主要用于深度学习
机器学习常见的算法引擎
SparkML
R
sklearn
Caffe
pytorch
tensorflow
kera
mxnet
作者:
kongdong
时间:
2024-4-11 17:37
有点兴趣,要有详细介绍就好啦。
作者:
朝花丶待夕拾
时间:
2024-4-11 22:53
鄙视楼下的顶帖没我快,哈哈
作者:
木木阿姨最温油
时间:
2024-4-12 07:04
回个帖子,下班咯~
欢迎光临 智客公社 (http://bbs.cnaiplus.com/)
Powered by Discuz! X3.4