在这个背景下,研究如何让 AI 系统真正理解人类的价值需求与意图,并获得人类的信任,是一个巨大的挑战。近几年的研究进展表明:人机协作是否成功不仅依赖于团队成员对现状和目标的一致认知,还有赖于团队是否持有相同的价值取向。而只有通过人类与机器的双向沟通,才能在团队中高效建立价值共识,从而使得团队成员采取受信任的行为决策来实现最终目标。
本篇论文的多个审稿人对该研究的重大意义均给予了高度肯定。一位审稿人认为,这项研究相当重要并且有趣,有力地阐明了关于人类和人工智能之间利用双向通信来进行价值对齐的意义所在。另一位专家则评价道:这篇论文通过让人类与几个特定智能体一起参与游戏,成功证明了人和智能体之间的双向协作是可能的,将人机团队合作领域的 AI 研究向前推进了一大步,提高了最先进的技术水平,而且其他学者将极大地从这项研究中学习并受到启发。
关于此项工作的下一步计划,郑子隆研究员表示,价值对齐是走向通用人机协作的第一步。他们未来将寻求在更多的任务和 AI 智能体上面应用该框架,探索在多个任务中的人机价值对齐,例如实现单个机器人的多任务能力,而不仅仅关注单项任务的环境。此外,他们认为在人类和机器人之间研究心理模型的其他因素,如信念、欲望、意图等,也是一个有前景的方向,这都是“为机器立心”的过程。
“我们相信未来人类能构建一个人机和谐共存的智能社会。”郑子隆研究员说。
支持:陈大鑫
参考资料:
1.L. Yuan, X. Gao, Z. Zheng, M. Edmonds, Y. Wu, F. Rossano, H. Lu, Y. Zhu and S.-C. Zhu, In situ bidirectional human-robot value alignment. Science Robotics 7, eabm4183 (2022). DOI: 10.1126/scirobotics.abm4183.