请选择 进入手机版 | 继续访问电脑版
 找回密码
 立即注册
搜索

什么是机器学习

一、机器学习是怎么发展起来,成为热搜的?

机器学习在20世纪50、60年代就已被提出,并成为当时的热门,中间潮起潮落,很长一段时间沉寂,不温不火。
但近几年随着与其相关的人工智能频繁上热搜,主要有以下原因:

  • 算力提升:云计算、GPU硬件的发展
  • 算法发展:神经网络由于其浅层结构,容易过拟合以及参数训练速度慢等原因,长期难以发展,而2006年后,深度学习相关的多层神经网络算法取得关键突破
  • 热点应用:Google阿法狗大胜人类围棋大师
  • imagenet社区:该社区为算法提供了大量数据养料,对推动算法精度的提升作出突出贡献
二、机器学习到底是个啥?

机器学习相对人类学习。
目的是让机器能够像人类一样具备学习能力,能够感知世界、认知世界和改造世界。

  • 感知世界:即视觉、听觉、触觉等感知能力,当前机器学习在感知世界方面已经和人类水平持平甚至超过人类;
  • 认知世界:能够理解、思考和具备意识,机器学习在这方面处在起步和发展阶段;
  • 改造世界:愚蠢的人类,呵呵。
我们要先看看人类是怎样学习的?
人类通过观察、阅读、经历等获取信息,然后使用归纳、演绎等方法进行学习,最后得到知识和智慧;



图1:人类学习与机器学习
而机器学习是通过数据训练,使用算法挖掘事物背后隐藏的规律和本质,得到模型。
机器学习可以简单理解由三大核心要素组成:数据+算法=模型。机器学习模型其实是对现实世界规律和本质的数字化抽象。

  • 机器(数据) => 人类学习(观察、阅读、经历)
  • 机器(算法) => 人类学习(归纳、演绎)
  • 机器(模型) => 人类学习(知识/智慧)
机器学习的关键是数据,算法是其次。一般来说:
大数据集+一般算法 优于 小数据集+好算法
数据决定了机器学习的上限,算法只是逼近这个上限而已。
另外,机器学习相关的一些领域包括人工智能、大数据、深度学习等,它们之间的关系如下图:



图2:机器学习与相关领域的关系
三、机器学习怎么学习?
机器学习运作机理大概如下图(当然详细过程还有数据预处理、特征选择等,在此不做说明):



图2:机器学习与相关领域的关系

  • 训练数据集:从历史数据集中拿出一部分数据作训练集,用来训练模型;
  • 算法选择:一般会根据业务场景和经验从多种算法中,选定一个适合该业务场景的算法
  • 模型训练:通过算法+数据(训练集)进行训练,得到初步的模型;
  • 模型评估:输入测试集,通过一些指标,如准确率,评估模型的好坏;如果模型好则使用该模型,如果模型评估结果不好,则通过调整训练集、调整算法参数甚至更换算法,不断调整模型;
  • 模型使用:将需要预测的数据输入至模型,得到最终的预测结果
从学习方式来说,机器学习还可分为监督学习、非监督学习、半监督学习,学习过程和上图类似,主要区别在于训练数据集里告不告诉机器正确答案。

  • 训练集给定了正确答案的叫监督学习,主要用于分类预测和回归预测
  • 训练集未指定正确答案的为非监督学习,主要用于聚类
机器学习重要的几个算法。

  • 决策树 :基于规则的一种分类算法
  • 朴素贝叶斯 :基于概率的一种分类算法,主要用于文本的分类
  • SVM :主要用于非线性可分的分类算法
  • KNN :基于距离的一种分类算法
  • 线性回归:主要用于预测目标结果为连续值的问题
  • 逻辑回归:主要用于预测目标结果为离散值的问题
  • 神经网络 :主要用于深度学习
机器学习常见的算法引擎

  • SparkML
  • R
  • sklearn
  • Caffe
  • pytorch
  • tensorflow
  • kera
  • mxnet

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

大神点评3

kongdong 2024-4-11 17:37:05 显示全部楼层
有点兴趣,要有详细介绍就好啦。
回复

使用道具 举报

鄙视楼下的顶帖没我快,哈哈
回复

使用道具 举报

回个帖子,下班咯~
回复

使用道具 举报

高级模式
B Color Image Link Quote Code Smilies