人工智能科普｜初学者如何规划机器学习的途径？

122122shu · 2019-2-20 11:46:20

书山有路勤为径，在学习进修的道路上，正确的途径比埋头勤劳要重要的多。

最近两年AI在线学习和教育呈喷涌式发展，机器学习的培训课程也是层出不穷，专业的教育和课程固然重要，但在这个过程中最关键的是如何规划出合理的入途径径，保证本人学习的课程、实操的项目都是符合本身的。

明天早晨我们就来讨论下初学者如何规划出近乎完美的机器学习途径。

机器学习基本概念

要规划出合理的学习途径，必须先对机器学习有个基本的了解。

机器学习是一种计算机程序，可以从现有的阅历中学习如何完成·某项义务，并随着阅历的添加，功能也会随着提升。

这里的阅历也就是所谓的数据，对于机器学习来说，数据库的大小对结果起决议性作用。

根据训练方法的不同，机器学习可分为：监督学习，无监督学习，半监督学习，强化学习。

在这里我们讲2种机器学习的常用方法：监督学习，无监督学习。

监督学习是从标记的训练数据来推断一个功能的机器学习义务，可分为“回归”和“分类”成绩。

定量输入称为回归，定性输入称为分类。比如根据房屋的地理地位、面积大小、以及房屋周边的配套设备等要素，来预测给定房屋的价格，这就是典型的回归成绩。
但是，假如我们预测一个给定面积的房屋的价格能否比一个特定的价格高或者低的时分，这就变成了一个分类成绩, 由于此时的输入是“高”或者“低”两个团圆的值。

无监督学习也被称为非监督学习，无监督学习和监督学习最大的不同在于，事前没有任何训练样本，而需求直接对数据停止建模。

无监督学习只能默默地读取数据，本人寻觅数据的模型和规律，比如聚类（把相似数据归为一组）和异常检测（寻觅出一组数据的不同一个），在无监督学习中给定的数据没有任何标签或者说只要同一种标签。

比如小时分我们还不看法钱币，看到一堆纸币和硬币，会很自然的把纸币和硬币分开，这就是最简单的聚类原理。

机器学习中的经典算法

机器学习中所触及到的算法有很多，比较典型的算法有决策树、回归、神经网络等。

决策树

决策树是机器学习中很经典的一种算法。它既是分类算法，也是回归算法，还可以用在随机森林中。

我们学计算机的同窗常常敲if 、else if、else其实就曾经在用到决策树的思想了。

决策树是一种简单常用的分类器，经过训练好的决策树可以完成对未知的数据停止高效分类。

举个例子，普通人去银行贷款的时分，银行会根据相应条件，来判别贷款人能否具有还贷才能。

贷款用户次要具有三个属性：房产、婚姻、平均月支出。

拥有房产或结过婚或月支出大于4000的贷款用户具有偿还才能。

判别偿还才能过程如图所示

例如：用户甲没有房产，没有结婚，月支出5K，经过上图的判别条件可以判别出用户甲具有偿还贷款才能。

这整个判别还贷才能的过程，就用到了决策树的思想。

回归
在统计学中，线性回归经过过拟合因变量和自变量之间的最佳线性关系来预测目的变量。

最佳拟合经过尽量减少预测的线性表达式和实践观察结果间的间隔总和来完成。没有其他地位比该外形生成的错误更少，从这个角度来看，该外形的“拟合”是最佳。

线性回归2个次要类型是简单线性回归和多元线性回顾。

简单线性回归运用一个自变量经过过拟合最佳线性关系来预测因变量的变化状况，多元线性回归就是运用多个自变量来预测因变量的变化状况。

支持向量机

支持向量机是一种分类方法，力图在样本中画出一道线，让线间隔两边样本的间隔最大。

它在文本分类、图像分类有较多运用。假如桌上有红豆和绿豆，我们可以把SVM想象成一个忍者，他画了一条线，把红豆和绿豆分开。

但有时分豆子掺和在一同，怎样办呢？我们可以针对红豆和绿豆的不同特性，把这些豆子经过核函数停止计算，把他们映射到高维空间去，这样豆子自然就分开了。

神经网络

神经网络也是一种分类器，它是由很多个虚拟的神经元组成的一个网络，我们可以把一个神经元看成一个分类器，那很多个神经元组成的网络就能对样本停止很多次分类。

朴素贝叶斯分类器

朴素贝叶斯分类器是一种统计学的分类方法，其基于朴素贝叶斯定理，给定一个样本观测点，预测其属于某一类的概率。

比如说，我们要辨认一封邮件是不是渣滓邮件。我们随机挑选出100封渣滓邮件，分析它的特征，我们发现“便宜”这个词出现的频率很高，100封邮件里有40封出现了这个词。

那我们就以结果为根据，得出结论：假如出现了“便宜”，那么该邮件有40%的概率是渣滓邮件。

这就是基本的朴素贝叶斯分类器算法。

机器学习入途径径规划

学习python编程，了解算法与数据结构

Python已成为AI和大数据时代的第一开发言语，无论同窗们如今处于哪个阶段，Python编程是一定要学习的首要技能，Python可以被很多第三方库支持，而且Python本身语法很简单，初学者也很容易上手。

掌握足够多的数理知识

数学对机器学习的重要性不言而喻，尤其是微积分、概率统计、矩阵、凸优化等基础数学知识，除了掌握好相应的数学知识之外，还需求了解数学在机器学习中的工业运用，实际知识和实际缺一不可。

逐渐学习并纯熟运用机器学习算法

触及到详细的机器学习算法，比如我们前文提到的决策树、回归、朴素贝叶斯等，这类算法不只仅需求掌握它们的实际知识，更需求在实践运用中了解它们的模型构建和模型优化。

机器学习实战运用

一切的学习都是以实践运用为导向的。

大家阅历了前三个步骤的学习积累，基本上该掌握的实际和算法都曾经掌握了，这一阶段该做的就是去实践做一些项目，将之前所学的知识融会贯通。

gpzl520 · 2019-2-20 11:48:07

分享了

易小帅0 · 2019-2-20 11:52:44

分享了

cgwpgbrg · 2019-2-20 11:59:28

分享了

郁闷的大叔1983 · 2019-2-20 12:09:52

分享了

欢乐英雄007 · 2019-2-20 12:13:12

分享了

ouyangyao · 2019-2-20 20:03:36

顶起顶起顶起

吸脂肪 · 2019-2-21 09:46:11

我了个去，顶了

		自动登录	找回密码
密码			立即注册

人工智能科普｜初学者如何规划机器学习的途径？

本帖子中包含更多资源

大神点评7

最近发表

公社版块

关注我们