独立同分布(independent and identically distributed,简称 i.i.d.)数据是机器学习中常常运用的术语。它假设成绩空间中的随机观测之间不互相依赖,而且发生频率是恒定的。举个最简单的例子,掷硬币或掷骰子。每一次抛掷的结果都与后面的抛掷没有关系,而且每种结果的发生概率保持不变。
为了处理这些成绩,研讨人员所做出的努力次要还是在更多示例中训练机器学习模型。但是随着环境变得越来越复杂,经过添加更多训练数据的方法来覆盖整个分布是根本不能够的。在 AI 智能体必须与世界交互的范畴(例如机器人和自动驾驶汽车)尤其如此。由于缺乏对因果管理的了解,机器学习算法很难做出预测,并应对新状况。这就是为什么即便无人驾驶汽车经过了数百万英里的训练,照旧会出现一些奇异的错误。
AI 研讨人员表示:“为了准确地概括独立同分布,机器学习算法不只需求学习变量之间的统计关系,而且还需求学习潜在的因果模型。”