什么是机器学习

康1126 · 2024-4-11 12:04:36

一、机器学习是怎么发展起来，成为热搜的？

机器学习在20世纪50、60年代就已被提出，并成为当时的热门，中间潮起潮落，很长一段时间沉寂，不温不火。
但近几年随着与其相关的人工智能频繁上热搜，主要有以下原因：

算力提升：云计算、GPU硬件的发展
算法发展：神经网络由于其浅层结构，容易过拟合以及参数训练速度慢等原因，长期难以发展，而2006年后，深度学习相关的多层神经网络算法取得关键突破
热点应用：Google阿法狗大胜人类围棋大师
imagenet社区：该社区为算法提供了大量数据养料，对推动算法精度的提升作出突出贡献

二、机器学习到底是个啥？

机器学习相对人类学习。
目的是让机器能够像人类一样具备学习能力，能够感知世界、认知世界和改造世界。

感知世界：即视觉、听觉、触觉等感知能力，当前机器学习在感知世界方面已经和人类水平持平甚至超过人类；
认知世界：能够理解、思考和具备意识，机器学习在这方面处在起步和发展阶段；
改造世界：愚蠢的人类，呵呵。

我们要先看看人类是怎样学习的？
人类通过观察、阅读、经历等获取信息，然后使用归纳、演绎等方法进行学习，最后得到知识和智慧；

图1:人类学习与机器学习
而机器学习是通过数据训练，使用算法挖掘事物背后隐藏的规律和本质，得到模型。
机器学习可以简单理解由三大核心要素组成：数据+算法=模型。机器学习模型其实是对现实世界规律和本质的数字化抽象。

机器（数据） => 人类学习（观察、阅读、经历）
机器（算法） => 人类学习（归纳、演绎）
机器（模型） => 人类学习（知识／智慧）

机器学习的关键是数据，算法是其次。一般来说：
大数据集+一般算法 优于 小数据集+好算法。
数据决定了机器学习的上限，算法只是逼近这个上限而已。
另外，机器学习相关的一些领域包括人工智能、大数据、深度学习等，它们之间的关系如下图：

图2:机器学习与相关领域的关系
三、机器学习怎么学习？
机器学习运作机理大概如下图（当然详细过程还有数据预处理、特征选择等，在此不做说明）：

图2:机器学习与相关领域的关系

训练数据集：从历史数据集中拿出一部分数据作训练集，用来训练模型；
算法选择：一般会根据业务场景和经验从多种算法中，选定一个适合该业务场景的算法
模型训练：通过算法+数据（训练集）进行训练，得到初步的模型；
模型评估：输入测试集，通过一些指标，如准确率，评估模型的好坏；如果模型好则使用该模型，如果模型评估结果不好，则通过调整训练集、调整算法参数甚至更换算法，不断调整模型；
模型使用：将需要预测的数据输入至模型，得到最终的预测结果

从学习方式来说，机器学习还可分为监督学习、非监督学习、半监督学习，学习过程和上图类似，主要区别在于训练数据集里告不告诉机器正确答案。

训练集给定了正确答案的叫监督学习，主要用于分类预测和回归预测
训练集未指定正确答案的为非监督学习，主要用于聚类

机器学习重要的几个算法。

决策树：基于规则的一种分类算法
朴素贝叶斯：基于概率的一种分类算法，主要用于文本的分类
SVM ：主要用于非线性可分的分类算法
KNN ：基于距离的一种分类算法
线性回归：主要用于预测目标结果为连续值的问题
逻辑回归：主要用于预测目标结果为离散值的问题
神经网络：主要用于深度学习

机器学习常见的算法引擎

SparkML
R
sklearn
Caffe
pytorch
tensorflow
kera
mxnet

kongdong · 2024-4-11 17:37:05

有点兴趣，要有详细介绍就好啦。

朝花丶待夕拾 · 2024-4-11 22:53:52

鄙视楼下的顶帖没我快，哈哈

木木阿姨最温油 · 2024-4-12 07:04:11

回个帖子，下班咯~

		自动登录	找回密码
密码			立即注册

什么是机器学习

本帖子中包含更多资源

大神点评3

最近发表

公社版块

关注我们