AI 初创公司 Decart 推出新一代世界模型 Oasis 3,主打自动驾驶场景仿真。公司希望先服务需要大规模测试罕见路况的自动驾驶企业,再扩展到机器人和其他物理 AI 应用,同时从上线之初就开放 API,吸引开发者围绕世界模型构建产品。
面向自动驾驶与开发者开放
Decart 联合创始人兼首席执行官 Dean Leitersdorf 表示,公司希望把 Oasis 3 做成可编程的世界模型平台,而不只是演示性质的研究项目。按照公司的说法,现有用户已超过 10 万名开发者,其中不少人此前已基于其实时视频模型 Lucy 开发电商和直播相关产品。
Oasis 3 建立在这一基础模型之上,代表 Decart 向物理 AI 进一步推进。公司称,产品按秒计费,标准价格为每秒 0.02 美元,企业客户价格则根据具体用途确定。

主打长时生成与拟真画面
Decart 认为,Oasis 3 的主要卖点在于画面拟真度和持续生成能力。该模型可生成多摄像头驾驶环境,包括前向和两侧视角,用于训练和测试自动驾驶系统。与只提供有限演示的同类产品不同,Oasis 3 允许开发者持续生成场景,以覆盖更多边缘案例。
公司将这一能力归因于其底层软件栈 DOS。Decart 称,这套优化软件可让模型更高效地运行在 Nvidia、亚马逊和谷歌的硬件上,从而降低推理成本。Leitersdorf 表示,凭借软硬件一体化优化,公司的运行成本可比行业其他玩家低一个数量级以上。
竞争升温,融资后加快落地
世界模型赛道近一年明显升温。此前,谷歌发布了 Genie 3 研究预览版,李飞飞创办的 World Labs 推出面向商业场景的 Marble,Luma 和 Runway 等视频生成公司也在把具备物理感知能力的视频模型延伸到世界模型方向。
Oasis 3 发布前数周,成立两年的 Decart 刚完成 3 亿美元融资,估值接近 40 亿美元。公司称,这轮融资来自电商、直播和物理 AI 相关需求快速增长。丰田、Adobe、eBay 以及既有投资方 Nvidia 参与了本轮投资,这些企业也可能成为其潜在客户。
长时间运行后仍会失真

不过,Oasis 3 目前仍有明显局限。根据 TechCrunch 的实际测试,模型可以较好生成与提示词相符的初始场景,但随着用户在环境中持续移动,场景主题会逐步变弱。比如最初生成的是纽约街景,继续行驶后,环境会逐渐变成更普通的西方城市道路。
测试还显示,模型在空间连续性上表现不稳。用户掉头返回原先路口时,原场景可能已经消失,被新的环境替代。车辆控制响应也不够稳定,行驶方向有时会偏离用户操作。
物理一致性仍是难点
另一个问题是碰撞物理。测试中,车辆有时会直接穿过其他车辆,说明模型尚未稳定模拟真实物理关系。Leitersdorf 将其称为当前的重要研究难题,并表示训练数据中“正常驾驶”远多于事故场景,也是原因之一。
他解释称,Oasis 3 采用自回归方式逐帧生成内容,每一帧都要参考此前结果来决定下一帧,这对算力和上下文长度要求很高。按他的说法,每帧大约对应 8000 个 token,在每秒数十帧的生成速度下,上下文窗口会很快被占满。公司目前正研究更长上下文和更高效的记忆压缩方法。
Leitersdorf 预计,下一版本可能会部分改善一致性问题。届时,用户将可以基于环境视频而非单张图片来生成世界。

