强化学习模型根据在环境中执行的操作获得奖励或处罚来进行预测。强化学习系统会生成一项政策,用于定义获得最多奖励的最佳策略。
强化学习用于训练机器人执行任务,例如在房间内走动,以及训练 Go (指AlphaGo是第一个击败人类职业围棋棋手的计算机程序)游戏等软件程序。
生成式 AI
生成式 AI 是一种可基于用户输入创建内容的模型。例如,生成式 AI 可以创建新颖的图片、乐曲和笑话;它可以汇总文章、解释如何执行任务或编辑照片。
生成式 AI 可以接受各种输入并创建各种输出,例如文本、图像、音频和视频。此过程还可以创建和创建这些事件的组合。例如,模型可以将图片作为输入,并创建图片和文本作为输出,或者将图片和文本作为输入,并创建视频作为输出。
我们可以按输入和输出(通常写为“输入类型”到“输出类型”)来讨论生成模型。例如,下面列出了生成模型的部分输入和输出:
for number in numbers:# Check if the number is prime.is_prime = Truefor i in range(2, number): if number % i == 0: is_prime = False break# If the number is prime, print it.if is_prime: print(number)
图片转文字
火烈鸟的场景
生成式 AI 的工作原理是什么?概括来讲,生成模型会学习数据中的模式,以生成全新但类似的数据。生成模型如下所示:
为了生成独特且有创意的输出,生成模型最初是使用无监督方法进行训练的,其中,模型会学习模仿要训练的数据。有时,系统会通过监督或强化学习来学习与模型可能要求执行的任务相关的特定数据(例如,总结文章或修改照片)来进一步训练模型。
生成式 AI 是一项发展迅速的技术,经常有新的用例被发现。例如,生成模型通过自动移除分散注意力的背景或提高低分辨率图片的质量,帮助企业优化其电子商务产品图片。