模型
世界模型
AI 系统对环境动态学到的内部表征,用于预测未来状态并规划行动,无需在真实世界中反复试错。
世界模型(world model)是一种机器学习系统,它为某个环境构建内部表征,并预测该环境如何随时间、随行动而变化。智能体不必只依赖真实世界的尝试,而可以在模型内部”想象”未来状态,从而在行动之前进行规划。
与处理文本词元的大型语言模型不同,世界模型通常处理传感输入(像素、深度、激光雷达),并学习物理、碰撞与因果等动态规律。常见方法包括基于模型的强化学习、潜在空间预测架构(JEPA),以及如 DeepMind 的 Genie 3 这类可实时生成交互环境的视频生成模型。
在 2025—2026 年,世界模型被视为通向具身与智能体 AI及机器人技术的关键一步,也是通往 AGI 的可能路径,因为它们能让智能体在近乎无限的丰富模拟环境中接受训练。