具身人工智能简史及其未来展望

媒博会 · 2024-6-2 10:08:32

具身人工智能（EAI）将人工智能集成到机器人等物理实体中，赋予它们感知、学习和动态交互环境的能力。这篇文章简要回顾了EAI的历史，其当前发展，并讨论了其未来前景。
1. EAI的早期基础

1991年，Rodney Brooks在研究论文《没有表征的智能》[1]中首次广泛探讨了EAI的概念，该论文提出了一个激进的观点，即智能行为可以直接来自自主机器与其环境的简单物理交互，而不需要复杂的算法或内部表征。
1999年，罗尔夫·菲弗（Rolf Pfeifer）和克里斯蒂安·谢尔（Christian Scheier）撰写了《理解智能》（Understanding Intelligence）一文，认为智能并不局限于大脑或某些算法，而是智能体整个身体结构和功能的综合表现[2]。根据这种观点，作者反对传统的以大脑或计算为中心的智力理解，强调身体对智力形成的根本影响。
琳达·史密斯（Linda Smith）从认知科学出发，于2005年提出了“具身假说”，强调身体与环境的相互作用在认知过程中的核心作用[3]。根据具身假说，我们的思维、感知和能力是通过我们的身体和物理环境之间的持续相互作用而形成的。特别是，具身假说强调环境的基本作用，认为它不仅提供感官输入，而且还参与形成身体行为和认知结构。
这些基础研究强调了开发EAI系统的三个原则。首先，EAI 系统不能依赖预定义的复杂逻辑来管理特定场景。其次，EAI系统必须纳入进化学习机制，使其能够不断适应其操作环境。最后，环境不仅在塑造身体行为方面起着举足轻重的作用，而且在塑造认知结构方面也起着举足轻重的作用。
2. EAI的最新发展

大型语言模型（LLM）、视觉语言模型（VLM）等基础模型的最新进展，以及ChatGPT等技术在人形机器人中的应用[4]，导致了一种普遍但不正确的信念，即EAI只是让这些基础模型在机器人中执行推理任务，以增强机器人的认知能力。
GPT-4、BERT、CLIP 和 DALL-E 等基础模型增强了机器人解释视觉和文本信息的能力，从而显著改善了它们的感知能力。这些模型允许机器人通过理解更类似于人类交互的上下文、对象和指令来执行复杂的任务[5]。此外，这些基础模型确实满足 EAI 系统设计的原则一，因此这些基础模型的推理不依赖于预定义的逻辑来管理特定场景。
但是，仅靠这些基础模型并不能概括 EAI 系统的全部要求。这些模型必须与进化学习框架集成，才能从它们与开放环境的物理交互中有效地学习。此外，我们需要开发一个虚拟环境来有效地与EAI系统进行交互，因为获取真实世界的交互数据非常昂贵且效率低下[6]。
原则二的一个示范是开发深度进化强化学习（DERL）框架[7]，该框架允许探索和测试各种智能体形态以应对环境挑战，显著增强智能体的形态和行为适应性。此外，随着新形态的出现，新的数据也随之而来，以提高基础模型适应新环境的能力。因此，除了利用基础模型进行推理之外，建立有效的反馈循环也至关重要，该反馈循环有助于持续增强，使机器人能够动态地适应其操作环境。
有了扩展机器人认知能力的基础模型，以及适应新环境的进化学习框架，一个能够有效模拟现实世界并与EAI系统交互的虚拟环境是满足原则三的必要条件。最近的一个例子是 Habitat 平台 [8]，它通过提供高效、逼真的 3D 模拟环境来训练虚拟机器人，从而促进了 EAI 的开发。Habitat 已在改进 EAI 系统方面得到证明，特别是在点目标导航等任务中，该平台提供大规模、可扩展的培训环境的能力可以显着提高传统方法的学习成果。
3. 未来展望

通过整合上述三个原则，我们可以构建一个功能齐全的EAI系统，能够动态适应不同的操作环境。自然而然的下一步是教机器人理解物理世界，例如重力的概念。我们相信，通过数据向机器人传授物理定律是机器人在我们日常生活中广泛采用的直接障碍。
尽管人工智能和机器人技术取得了重大进展，但目前的机器人系统仍然缺乏对物理世界的深刻、直观的理解。研究表明，虽然机器人可以执行某些任务或模仿人类行为的某些方面，但它们并不具有真正的类人理解[9]。这个问题可以通过生成与虚拟环境的精确物理交互数据来解决，并通过进化学习机制改进这些交互数据的基础模型。
已经探索了几种方法来向机器人传授物理定律。解决这个问题的一种方法是柏拉图，它被提议通过观看模拟视频来学习物理，这些视频描绘了物体根据物理定律相互作用[10]。该系统可以区分现实和荒谬的场景，例如物体消失或以不可能的方式执行。通过用视频训练PLATO对象遵循可预测的物理定律，人工智能学会了预测和理解基本的物理概念，从而增强了其对物理世界的一般推理。
第二种方法探索生成神经网络如何学习物理概念，并将这些学习轨迹与儿童的学习轨迹进行比较[11]。该研究评估了关于发育过程的两个假设：随机优化和复杂性增加。研究发现，虽然神经网络可以获得广泛的物理概念，但它们学习这些概念的顺序与在儿童中观察到的发展轨迹不一致。这种差异表明，尽管这些模型很复杂，但并不能完全捕捉到人类发展物理理解的微妙方式。
4. 结论

这篇文章追溯了 EAI 从其概念基础到现代应用和未来挑战的演变。特别是，我们强调了开发EAI系统的三个原则。首先，EAI 系统不得应用预定义的复杂逻辑来管理特定场景。其次，EAI系统需要结合进化的学习机制，以持续提供反馈。第三，交互数据生成需要与 EAI 系统交互的虚拟环境。最近的研究进展已经分别满足了这三个原则，但我们还没有看到一个包含所有三个原则的完全商业运作的系统。当这样的系统准备就绪时，一个迫在眉睫的挑战是教EAI系统理解物理定律，以便它们在物理世界中顺利运行。
参考文献

Brooks, R.A., 1991. Intelligence without representation. Artificial intelligence, 47(1-3), pp.139-159.
Pfeifer, R. and Scheier, C., 2001. Understanding intelligence. MIT press.
Smith, L.B., 2005. Cognition as a dynamic system: Principles from embodiment. Developmental Review, 25(3-4), pp.278-298.
OpenAI and Figure AI develop humanoid robot, BBC News, https://www.youtube.com/watch?v=cjVMQl9pVB0, accessed 4/23/2024
Hu, Y., Xie, Q., Jain, V., Francis, J., Patrikar, J., Keetha, N., Kim, S., Xie, Y., Zhang, T., Zhao, Z. and Chong, Y.Q., 2023. Toward general-purpose robots via foundation models: A survey and meta-analysis. arXiv preprint arXiv:2312.08782
Liu, S, The Value of Data in Embodied Artificial Intelligence, Communications, https://cacm.acm.org/blogcacm/the-value-of-data-in-embodied-artificial-intelligence/
Gupta, A., Savarese, S., Ganguli, S. and Fei-Fei, L., 2021. Embodied intelligence via learning and evolution. Nature Communications, 12(1), p.5721.
Savva, M., Kadian, A., Maksymets, O., Zhao, Y., Wijmans, E., Jain, B., Straub, J., Liu, J., Koltun, V., Malik, J. and Parikh, D., 2019. Habitat: A platform for embodied ai research. In Proceedings of the IEEE/CVF international conference on computer vision (pp. 9339-9347).
Torresen, J., 2018. A review of future and ethical perspectives of robotics and AI. Frontiers in Robotics and AI, 4, p.75.
Piloto, L.S., Weinstein, A., Battaglia, P. and Botvinick, M., 2022. Intuitive physics learning in a deep-learning model inspired by developmental psychology. Nature human behaviour, 6(9), pp.1257-1267.
Buschoff, L.M.S., Schulz, E. and Binz, M., 2023, July. The acquisition of physical knowledge in generative neural networks. In International Conference on Machine Learning (pp. 30321-30341). PMLR.

		自动登录	找回密码
密码			立即注册

具身人工智能简史及其未来展望

本帖子中包含更多资源

最近发表

公社版块

关注我们