登录后你可以:
首次使用?点我去注册
不断提供学习数据给黑箱; 经过该黑箱处理后输出相应的结果; 通过比较黑箱输出结果与预期结果的差异来不断地调整黑箱中的参数,使黑箱的最终输出结果与预期的结果越来越接近,从而达到学习目的。
监督学习:给定带标签的数据,预测未来数据的标签。即使用预定义的训练数据集合来训练系统,通过调整系统内部参数,不断纠正其输出,系统一直被训练,直到达到所需要的准确度。
无监督学习:给定无标签的数据,寻找隐藏的模式。即给系统一堆无标签数据,需要由它自己检测数据中的模式或关系。
强化学习:给定数据,学习如何选择一系列的动作,使长期收益最大化。即是一个连续决策的过程,这个过程类似监督学习,只是标注数据不是预先准备好的,而是通过一定时间的过程奖励来调整,最终需要能给出当前的最佳动作。
您需要 登录 才可以下载或查看,没有帐号?立即注册
使用道具 举报
本版积分规则 发表回复 回帖后跳转到最后一页