模型

世界模型

AI 系统对环境动态学到的内部表征,用于预测未来状态并规划行动,无需在真实世界中反复试错。

世界模型world model)是一种机器学习系统,它为某个环境构建内部表征,并预测该环境如何随时间、随行动而变化。智能体不必只依赖真实世界的尝试,而可以在模型内部”想象”未来状态,从而在行动之前进行规划。

与处理文本词元的大型语言模型不同,世界模型通常处理传感输入(像素、深度、激光雷达),并学习物理、碰撞与因果等动态规律。常见方法包括基于模型的强化学习、潜在空间预测架构(JEPA),以及如 DeepMind 的 Genie 3 这类可实时生成交互环境的视频生成模型。

在 2025—2026 年,世界模型被视为通向具身与智能体 AI及机器人技术的关键一步,也是通往 AGI 的可能路径,因为它们能让智能体在近乎无限的丰富模拟环境中接受训练。

来源

另见