Waypoint-1.5:AI在普通RTX 3090上生成交互式720p世界
为什么重要
Overworld发布了Waypoint-1.5,这是一款实时视频世界模型,可在RTX 3090和Apple Silicon Mac等消费级GPU上以720p/60fps分辨率生成交互式虚拟环境。该模型的训练数据比前代多出约100倍,并在HuggingFace上开源可用。
Overworld于4月9日发布了Waypoint-1.5,这是其实时视频世界模型的新一代产品——一款可实时创建虚拟世界的生成式AI系统,用户可在其中探索和互动。与前代产品相比的主要区别在于其专注于消费级硬件的可及性,而非昂贵的数据中心GPU。
技术规格
该模型有两种版本:Waypoint-1.5-1B(10亿参数,面向高端PC的720p分辨率)和面向更广泛硬件覆盖的360P版本。性能表现:在RTX 3090-5090、游戏笔记本以及即将支持的Apple Silicon Mac设备上可实现720p @ 60 fps。相比之前需要数据中心算力才能实现类似能力的版本,这是一次重大突破。
训练方面:使用的数据量约为Waypoint-1的100倍,这大幅提升了帧间连贯性和运动一致性。团队还开发了更高效的视频建模技术,减少相邻帧之间的冗余计算。
如何使用
该模型在Hugging Face上可用(Overworld/Waypoint-1.5-1B和Waypoint-1.5-1B-360P)。本地运行可使用GitHub上的开源桌面客户端Overworld Biome,还有World Engine——其核心推理库,围绕它已诞生了十余个第三方客户端。对于不想安装的用户,也可以通过overworld.stream即时访问浏览器版本。
这改变了什么
生成式世界模型迄今为止大多是学术好奇或大型实验室的专属。Waypoint-1.5将最低规格要求降至普通游戏PC的水平,为交互式娱乐、创意工具、模拟和AI原生研究环境打开了大门。开放许可及其周围社区工具的存在表明,这可能会为3D世界模型带来Stable Diffusion对2D图像生成所产生的同等影响。