机器学习
设计一个计算机程序来完成任务T,定义P来评估程序的性能,基于经验E不断进行学习,P会不断达到到我们的预期值,则称程序使用的算法为机器学习算法,可见机器学习是一个计算机程序,由于算法有别于传统的计算程序算法,程序所以叫做机器学习。比如设计一个程序来预测房价,预测房价这个任务T,过去已经发生样本信息是经验E,预测房价准确率是性能P。
机器学习分类
根据程序输入数据的类型(经验E)分类可分:监督学习 、强化学习
- 监督学习:根据已有样本数据或标签训练得到的模型算法,需要设计损失函数;
- 强化学习:程序运行需要即时的环境交互训练得到的模型算法,需要设计收益函数。
监督学习
根据程序输入的训练数据是否带标签组合形式可分:传统监督学习、非监督学习、半监督学习
- 传统监督学习,训练的数据都带有标签,主要算法有支持向量机 、人工神经网络 、深度神经网络 ;
- 非监督学习,训练数据不带有标签,主要算法有聚类 、EM算法 、主成份分析 ;
- 半监督学习,使用带标签与不带标签进行训练;
根据模型得到的标签固有属性,可将算法解决的问题分为:分类问题(离散值)、回归(连续值)。
强化学习
........ |