“生成式人工智能在 2023 年席卷全球。它的未来以及我们的未来将取决于我们下一步的行动。”
麻省理工科技评论的人工智能高级编辑Will Douglas Heaven近日发布文章《These six questions will dictate the future of generative AI》,介绍了生成型人工智能(generative AI)在2023年的发展和影响,以及未来面临的六个关键问题。这篇文章是一篇很有价值的科技评论,它对生成型人工智能的现状和未来进行了全面和深入的探讨,提出了一些重要的问题和建议。
生成人工智能(generative AI)是能够自动创造出新的内容和产品的人工智能技术,它利用了深度学习、神经网络、自然语言处理等先进的算法和模型,能够模仿和超越人类的创造力和智慧。生成人工智能已经在各个领域展现了惊人的能力和潜力,比如音乐、艺术、文学、设计、游戏、医疗、教育、商业等,它为人们提供了更多的便利和乐趣,也为社会带来了更多的价值和创新。
生成人工智能面临着许多的挑战和问题,比如数据的质量和来源,模型的可靠性和可解释性,以及伦理和法律的约束和保护。这些问题不仅影响着生成人工智能的发展和应用,也关系到人类的利益和未来。因此,我们需要对生成人工智能有一个全面和深入的了解,探讨它的优势和劣势,分析它的机遇和风险,制定合理的规则和标准,以确保它的负责任使用和可持续发展。 01 我们会让生成人工智能减轻偏见的问题吗?
文章首先指出,生成人工智能中的偏见是由于使用了反映了社会歧视的真实数据来训练模型,导致模型在生成内容时也会重现和加剧这些歧视,比如在聊天机器人、图像生成器、面部识别、招聘算法等方面。要从根本上解决偏见问题,需要新的数据集或新的训练方法,但这些都需要很长的时间和工作。文章介绍了一些目前的研究方向,比如使用人类反馈的强化学习、使用合成数据集、使用多样化和跨领域的数据等,来减少生成人工智能中的偏见。
偏见已经成了人工智能带来的伤害的代名词,这是有道理的。现实中的数据,特别是从网上抓取的文本和图片,都充满了偏见,从性别刻板印象到种族歧视。用这些数据训练的模型就会学习这些偏见,然后在使用的时候又会加强这些偏见。
聊天机器人和图像生成器往往把工程师描绘成白人男性,护士描绘成白人女性。黑人有被警察部门的面部识别程序误认的风险,导致被错误逮捕。招聘算法偏向于男性而不是女性,使得原本想要解决的偏见更加深入。
如果没有新的数据集或新的训练方法(这两者都需要很多年的工作),偏见问题的根源就会一直存在。但这并没有阻止它成为研究的热门话题。OpenAI就试图用一些技术,比如人类反馈的强化学习(RLHF),来让它的大型语言模型变得更少偏见。这样就可以让模型的输出更接近人类测试者喜欢的文本。
其他的技术涉及到使用合成数据集。比如Runway,一个为视频制作提供生成模型的创业公司,就用一些合成数据,比如人工生成的不同种族、性别、职业、年龄的人的图片,来训练一个受欢迎的图像生成模型Stable Diffusion的一个版本。这家公司报告说,用这个数据集训练的模型可以生成更多的深肤色的人和女性的图片。如果请求一个商人的图片,输出就会包括戴头巾的女性;如果请求一个医生的图片,输出就会包括肤色和性别多样的人。
批评者认为这些解决方案只是在破损的基础模型上贴上创可贴,掩盖而不是修复问题。但是Geoff Schaefer,Smith在Booz Allen Hamilton的同事,也是这家公司的人工智能责任主管,认为这样的算法偏见可以以一种有益的方式暴露社会偏见。
举个例子,他指出,即使从数据集中删除了关于种族的明确信息,种族偏见仍然可以影响数据驱动的决策,因为种族可以从人们的地址推断出来,揭示了隔离和住房歧视的模式。“我们把一堆数据放在一起,这种相关性就变得非常明显,”他说。
Schaefer认为这一代的人工智能也会发生类似的事情:“这些社会上的偏见都会显现出来。”他说,这将导致更有针对性的政策制定。
但是很多人会对这种乐观态度感到不满。问题暴露出来并不意味着它一定会得到解决。政策制定者仍然在努力解决多年前就暴露出来的社会偏见,比如在住房、招聘、贷款、警察等方面。与此同时,个人还要承受后果。
偏见将继续是大多数生成人工智能模型的固有特征。但是通过一些变通方法和提高意识,可以帮助政策制定者解决最明显的例子。 02 人工智能将如何改变我们应用版权的方式?
AI将如何改变我们对版权的运用?许多艺术家和作家(还有编程人员)不满科技公司未经同意就从他们的作品中获利,于是对OpenAI、微软等公司提起集体诉讼,指控他们侵犯版权。Getty也起诉了Stability AI,这是一家制作图像的公司,它的产品叫Stable Diffusion。
莎拉·西尔弗曼和乔治·R.R.马丁等名人的诉讼引起了媒体的关注。这些案件将重新定义在美国,什么算是对他人作品的合理使用,什么不算。但是别急着看结果。专门从事知识产权许可的律师事务所Gunderson Dettmer的合伙人凯蒂·加德纳说,法院要做出最终判决还需要几年时间。她说到那时,“这项技术已经在经济中根深蒂固,无法逆转。”
与此同时,科技行业正以惊人的速度利用这些涉嫌侵权的技术。加德纳说:“我不认为公司会等着看。”“虽然有一些法律风险,但是如果不跟上,风险会更大。”
一些公司已经采取措施,限制侵权的可能性。OpenAI和Meta声称已经推出了一种让创作者从未来的数据集中删除他们的作品的方法。OpenAI现在禁止DALL-E的用户请求以活着的艺术家的风格生成图像。但是,加德纳说,“这些都是为了支持他们在诉讼中的论点。”
谷歌、微软和OpenAI现在提供保护他们的模型用户免受潜在法律诉讼的服务。微软的GitHub Copilot生成式编程助手,就是因为使用了一些软件开发者的代码而被起诉的,它的赔偿政策原则上会保护那些在法院审理期间使用它的人。“我们会承担这个负担,让我们的产品用户不用担心,”微软CEO萨提亚·纳德拉告诉《麻省理工科技评论》。
与此同时,新的许可协议也在出现。Shutterstock和OpenAI签订了一份为期六年的协议,允许后者使用其图像。Adobe也声称,它自己的图像生成模型Firefly,只使用了经过许可的图像,或者来自其Adobe Stock数据集的图像,或者已经不受版权保护的图像。但是,一些Adobe Stock的贡献者说,他们没有被征求意见,对此很不满。
怨气很大。现在艺术家们用自己的技术反击。有一种工具叫Nightshade,它可以让用户以一种人类无法察觉的方式改变图像,但是对机器学习模型却是致命的,让它们在训练过程中错误地分类图像。预计在线分享和重用媒体的规范会发生很大的调整。高调的诉讼仍将引起关注,但这不太可能阻止公司继续开发生成式模型。围绕道德数据集的新市场将出现,公司和创作者之间的猫鼠游戏也将展开。 03 它将如何改变我们的工作?
生成人工智能正在威胁我们的工作,不仅是蓝领,也包括白领,比如数据分析师、医生、律师和记者。生成人工智能可以通过大型语言模型来完成一些需要高水平的考试、总结、写作等任务。但这并不意味着生成人工智能真的很聪明,也不意味着它们可以取代所有的专业角色。
Will Douglas Heaven在文章中介绍了一些使用生成人工智能的案例,比如波士顿咨询集团的顾问实验,Air Street Capital 的分析报告,以及Runway 的视频制作。文章展示了生成人工智能可以帮助工作人员提高效率、质量、创新和满意度。文章也提到了一些使用生成人工智能的注意事项,比如要避免过度依赖、要检查错误、要尊重版权等。
生成人工智能对办公桌工作以外的影响,比如图像和视频制作模型可以在不需要人类参与的情况下制作大量的图片和电影。文章指出,这将引发一些版权、道德和社会的问题,比如2023年的美国作家和演员的罢工。
生成人工智能对工作的总体影响,生成人工智能不是取代工人,而是赋予工人权力。技术变革会带来新的就业机会,而不是造成大规模失业,技术变革会带来一些痛苦和不平等,需要我们思考我们想要的工作的意义和价值。
生成人工智能会影响哪些类型的工作,取决于工作的性质和特点,以及生成人工智能的能力和局限。一般来说,生成人工智能会影响那些需要大量的重复和规范的工作,比如数据的收集、处理、分析、可视化等,因为这些工作可以很容易地被生成人工智能的算法和模型所实现和优化,而且生成人工智能可以比人类更快、更准、更全地完成这些工作。生成人工智能也会影响那些需要高度的创造力和智慧的工作,比如音乐、艺术、文学、设计、游戏、医疗、教育、商业等,因为这些工作可以很好地利用生成人工智能的生成能力和生成潜力,而且生成人工智能可以比人类更多、更新、更好地创造出这些内容和产品。生成人工智能还会影响那些需要跨领域和跨媒介的工作,比如从文本生成图像,从图像生成音频,从音频生成视频等,因为这些工作可以很方便地使用生成人工智能的生成技术和生成工具,而且生成人工智能可以比人类更灵活、更自由、更精确地生成出这些内容和产品。 04 AI造假的风险有多大?
2023年,生成式AI引起了广泛的关注和担忧。一些用AI制造的假照片在网上疯传,有些甚至涉及教皇、特朗普和五角大楼等敏感人物和地点。这些虚假信息不仅难以辨别,而且可能影响选举结果。OpenAI自己也承认,它的技术可能被用于制造有害的宣传。为了应对这些问题,拜登政府和欧盟都出台了相关的规定和措施,要求AI生成内容加上标识和水印,并保护用户免受聊天机器人的欺骗。同时,美国还将对可能危及国家安全的AI进行审计。但是,这些措施是否有效,是否及时,是否合理,还有待观察。一些AI专家和企业家对AI的未来和风险有不同的看法,有些担心AI会导致人类灭绝,有些认为这是荒谬的,有些认为应该放慢AI的发展,有些认为应该加快AI的创新。他们之间的争论还没有结束,而生成式AI的使用和滥用也还在继续。