如何在经济和社会系统中重新分配资源?例如,一群人决定集中资金进行投资,获得回报后该如何分配收益?简单的平均分配看起来不太公平,但按照每个人的初始投资规模按比例分配,就真的公平吗?近日,DeepMind公司开发了名为 Democratic AI 的系统来探索解决这个机制设计问题。Democratic AI 可以直接学习最大化一群人的偏好,融合人类思想家和专家之前为解决再分配问题而提出的各种想法,从而设计出更受欢迎的分配策略。该方法解决了 AI 研究中的一个关键挑战——如何训练符合人类价值观的人工智能系统。
集智俱乐部组织的「计算社会科学读书会」第二季已经启动报名,将聚焦讨论Graph、Embedding、NLP、Modeling、Data collection等方法及其与社会科学问题的结合,并针对性讨论预测性与解释性、新冠疫情研究等课题。读书会6月18日开始,持续10-12周,详情见文末。
研究领域:人工智能,社会机制设计
文章创建了一个包含四名玩家的简单游戏。游戏的每个实例都进行了10轮以上。在每一轮中,每个玩家都被分配了资金,捐赠的大小因玩家而异。每个玩家都做出了选择:他们可以为自己保留这些资金,也可以将它们投资于一个共同的资金池中。投资的资金保证会增长,但存在风险,因为玩家不知道收益将如何分配。相反,他们被告知前10轮有一名裁判(A)做出重新分配决定,而后10轮则由另一名裁判(B)接管。比赛结束时,他们投票给A或B,并与这位裁判进行了另一场比赛。游戏的人类玩家被允许保留最后一场游戏的收益,因此他们被激励准确地报告他们的偏好。
在10轮的每一轮中,每个参与者i都向公共投资基金贡献整数ci的硬币,捐赠数额为ei,剩余的总和(ei-ci)留在私人账户中(捐赠基金可能会因参与者的不同而有所不同,有一个参与者得到的比其他人多)。k=4个玩家的累计贡献以 r = 1.6 的增长因子(投资的正回报);这相当于边际资本收益(marginal per capita return ,MPCR=0.4)。公共基金通过再分配机制返还给玩家,该机制规定了返还给每个玩家的公共投资总额的比例,取决于他们的贡献和捐赠。这种博弈承认存在一种连续的再分配机制,这种再分配机制通常与政治光谱中对立的两端有关,在这种机制中,回报在不同程度上取决于自己和他人的贡献。