请选择 进入手机版 | 继续访问电脑版
 找回密码
 立即注册
搜索

游戏中的生成人工智能的应用有哪些?

IDXAC 2022-11-25 07:45:16 显示全部楼层 阅读模式
生成 AI 是机器学习的一种,计算机可以根据用户的提示生成原创的新内容。今天,文本和图像是这项技术最成熟的应用,但几乎每个创意领域都在开展工作,从动画到音效,再到音乐,甚至创建具有完全充实个性的虚拟角色。

当然,人工智能在游戏中的应用并不是什么新鲜事。即使是早期的游戏,如 Atari 的 Pong,也有计算机控制的对手来挑战玩家。然而,这些虚拟敌人并没有像我们今天所知道的那样运行人工智能。它们只是游戏设计师编写的脚本程序。他们模拟了一个人工智能对手,但他们无法学习,他们只能和建造他们的程序员一样好。

由于更快的微处理器和云计算,现在的不同之处在于可用的计算能力。有了这种能力,就可以构建大型神经网络来识别高度复杂领域中的模式和表征。到目前,市场上有很多生成 AI应用的公司。当然,游戏领域的发展有经历过诸多时代和技术。

游戏中的生成人工智能的应用有哪些?-1.jpg

2D 图像

生成 2D 图像已经是生成人工智能应用最广泛的领域之一。Midjourney、Stable Diffusion 和 Dall-E 2 等工具可以从文本生成高质量的 2D 图像,并且已经在游戏生命周期的多个阶段进入游戏制作。

概念艺术

生成 AI 工具擅长“构思”或帮助非艺术家(如游戏设计师)快速探索概念和想法以生成概念图,这是制作过程的关键部分。例如,一个工作室(保持匿名)正在使用其中的几个工具来从根本上加快他们的概念艺术过程,只需要一天就可以创建一个图像,而以前需要长达 3 周的时间。
    首先,他们的游戏设计师使用 Midjourney 探索不同的想法并生成他们觉得鼓舞人心的图像。这些被移交给专业的概念艺术家,他们将它们组装在一起并在结果上绘画以创建一个单一的连贯图像——然后将其输入到 Stable Diffusion 中以创建一系列变化。他们讨论这些变化,选择一个,手动绘制一些编辑——然后重复这个过程,直到他们对结果满意为止。在那个阶段,最后一次将此图像传回 Stable Diffusion 以“升级”它以创建最终的艺术作品。

2D 制作艺术

一些工作室已经在尝试使用相同的工具来制作游戏中的艺术品。例如,这里有一篇来自 Albert Bozesan 的精彩教程,介绍如何使用 Stable Diffusion 创建游戏中的 2 D 资产。

3D 艺术品

3D 资产是所有现代游戏以及即将到来的元宇宙的基石。虚拟世界或游戏关卡本质上只是 3D 资产的集合,经过放置和修改以填充环境。然而,创建 3D 资产比创建 2D 图像更复杂,并且涉及多个步骤,包括创建 3D 模型和添加纹理和效果。对于动画角色,它还涉及创建内部“骨架”,然后在该骨架之上创建动画。

我们看到几家不同的初创公司在这个 3D 资产创建过程的每个阶段都在努力,包括模型创建、角色动画和关卡构建。然而,这还不是一个已解决的问题——还没有任何解决方案准备好完全集成到生产中。

3D 资产

试图解决 3 D 模型创建问题的初创公司包括 Kaedim、Mirage 和 Hypothetic。更大的公司也在关注这个问题,包括 Nvidia 的 Get3 D 和 Autodesk 的 ClipForge。Kaedim 和 Get3 d 专注于图像到 3 D(image-to-3 D);ClipForge 和 Mirage 专注于文本到 3 D(text-to-3 D),而 Hypothetic 对文本到 3 D(text-to-3 D)搜索以及图像到 3 D(image-to-3 D)都感兴趣。

3D 纹理

3D 模型的逼真度取决于应用于网格的纹理或材料。决定将哪种长满苔藓、风化的石头纹理应用于中世纪城堡模型可以完全改变场景的外观和感觉。纹理包含关于光如何对材料做出反应的元数据(即粗糙度、光泽度等)。允许艺术家根据文本或图像提示轻松生成纹理对于提高创作过程中的迭代速度非常有价值。几个团队正在寻求这个机会,包括 BariumAI、Ponzu 和 ArmorLab。

动画

创建出色的动画是游戏创建过程中最耗时、最昂贵且最需要技巧的部分之一。降低成本并创建更逼真的动画的一种方法是使用动作捕捉,您可以让演员或舞者穿上动作捕捉服,并记录他们在配备特殊仪器的动作捕捉舞台上的移动。

我们现在看到了可以直接从视频中捕捉动画的生成 AI 模型。这样效率更高,既因为它消除了对昂贵的动作捕捉装备的需求,也因为这意味着您可以从现有视频中捕捉动画。这些模型的另一个令人兴奋的方面是,它们还可以用于对现有动画应用过滤器,例如让它们看起来喝醉了、老了或开心了。进入这一领域的公司包括 Kinetix、DeepMotion、RADiCAL、Move Ai 和 Plask。

关卡设计和世界建设

游戏创作中最耗时的一个方面是构建游戏世界,生成 AI 应该非常适合这项任务。Minecraft、No Man's Sky 和 Diablo 等游戏已经以使用程序技术生成关卡而闻名,其中关卡是随机创建的,每次都不同,但遵循关卡设计师制定的规则。新的 Unreal 5 游戏引擎的一大卖点是其用于开放世界设计的程序工具集,例如植被放置。

我们已经看到该领域的一些举措,例如 Promethean、MLXAR 或 Meta 的 Builder Bot,并且认为生成技术在很大程度上取代程序技术只是时间问题。该领域的学术研究已经有一段时间了,包括 Minecraft 的生成技术或 Doom 的关卡设计。

期待用于关卡设计的生成式 AI 工具的另一个令人信服的理由是能够创建不同风格的关卡和世界。你可以想象在 1920 年的纽约拍板时代要求工具生成一个世界,对比反乌托邦的银翼杀手式未来,对比托尔金式的幻想世界。

音频

声音和音乐是游戏体验的重要组成部分。我们开始看到公司使用 Generative AI 来生成音频,以补充图形方面已经发生的工作。

声音特效

音效是 AI 极具吸引力的开放领域。已有学术论文探索使用 AI 在电影中生成“foley”(例如脚步声)的想法,但游戏中的商业产品还很少。

我们认为这只是时间问题,因为游戏的交互性使其成为生成 AI 的明显应用,既可以在制作过程中创建静态音效(“激光枪声,星球大战风格”),又在运行时创建实时交互式音效。

考虑为玩家角色生成脚步声这样简单的事情。大多数游戏通过包含少量预先录制的脚步声来解决这个问题:在草地上行走、在砾石上行走、在草地上奔跑、在砾石上奔跑等。生成和管理这些声音很乏味,并且在运行时听起来重复且不真实。

更好的方法是实时生成拟音效果的 AI 模型,它可以动态生成适当的音效,每次都略有不同,对游戏中的参数(如地面、角色体重、步态、鞋类等

音乐

音乐一直是游戏的挑战。这很重要,因为它可以像在电影或电视中一样帮助设定情感基调,但由于游戏可以持续数百甚至数千小时,它很快就会变得重复或烦人。此外,由于游戏的互动性,音乐可能很难在任何给定时间精确匹配屏幕上发生的事情。

二十多年来,自适应音乐一直是游戏音频领域的一个话题,一直追溯到微软用于创建互动音乐的“DirectMusic”系统。DirectMusic 从未被广泛采用,主要是因为以这种格式进行创作很困难。只有少数游戏,如 Monolith 的 No One Lives Forever,创造了真正的互动配乐。

现在我们看到许多公司正在尝试创建 AI 生成的音乐,例如 Soundful、Musico、Harmonai、Infinite Album 和 Aiva。虽然今天的一些工具,如 Open AI 的 Jukebox,计算密集度很高,不能实时运行,但大多数都可以在初始模型构建后实时运行。

语音和对话

有大量公司试图为游戏中的角色创造逼真的声音。考虑到尝试通过语音合成为计算机提供声音的悠久历史,这并不奇怪。这些公司包括 Sonantic、Coqui、Replica Studios、Resemble.ai、Readspeaker.ai 等等。

使用生成 AI 进行语音有多种优势,这在一定程度上解释了为什么这个领域如此拥挤。

即时生成对话。通常游戏中的语音是由配音演员预先录制的,但这些仅限于预先录制的录音语音。通过生成 AI 对话,角色可以说任何话——这意味着他们可以对玩家的行为做出充分的反应。结合用于 NPC 的更智能的 AI 模型(不在本博客的范围内,但现在是一个同样令人兴奋的创新领域),对玩家完全反应的游戏的承诺即将到来。
    角色扮演。许多玩家想扮演与他们在现实世界中的身份几乎没有相似之处的奇幻角色。然而,一旦玩家用自己的声音说话,这种幻想就会破灭。使用与玩家头像相匹配的生成声音可以保持这种错觉。控制。生成语音时,您可以控制声音的细微差别,如音色、音调变化、情感共鸣、音素长度、重音等。本土化。允许将对话翻译成任何语言并以相同的声音说出来。像 Deepdub 这样的公司专门专注于这个利基市场。

NPC 或玩家角色

许多初创公司正在考虑使用生成式 AI 来创建可以与之互动的可信角色,部分原因是这是一个在游戏之外具有如此广泛适用性的市场,例如虚拟助理或接待员。

创造可信角色的努力可以追溯到 AI 研究的开端。事实上,经典的人工智能“图灵测试”的定义是,人类应该无法区分与人工智能和人类的聊天对话。

目前,有数百家公司在构建通用聊天机器人,其中许多由类似 GPT-3 的语言模型提供支持。少数人专门尝试构建以娱乐为目的的聊天机器人,例如试图构建虚拟朋友的 Replika 和 Anima。正如电影《她》中探讨的那样,与虚拟女友约会的概念可能比您想象的更接近。

我们现在看到了这些聊天机器人平台的下一次迭代,例如 Charisma.ai、Convai.com 或 Inworld.ai,旨在为完全渲染的 3 D 角色提供动力、情感和代理,并提供工具让创作者提供这些人物目标。如果他们要融入游戏或在推进情节中有一个叙事位置,而不是纯粹的门面装饰,这一点很重要。

多合一平台

Runwayml.com 是最成功的生成 AI 工具之一,因为它在一个软件包中汇集了广泛的创作者工具套件。目前还没有这样的视频游戏平台,我们认为这是一个被忽视的机会。我们很乐意投资具有以下特点的解决方案:
    涵盖整个生产过程的全套人工智能生成工具。(代码、资产生成、纹理、音频、描述等)与 Unreal 和 Unity 等流行游戏引擎紧密集成。旨在适应典型的游戏制作流程。
回复

使用道具 举报

大神点评1

hezf2006 2022-11-25 07:45:26 显示全部楼层
转发了
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册