互联网 频道

灵光App上线“图生世界”功能,背后是蚂蚁灵波开源世界模型LingBot-World-Fast

  4 月 27 日,蚂蚁集团旗下全模态 AI 助手灵光 App 上线“体验世界模型”功能。用户上传一张图片,即可在手机端生成一个 60s 的 3D 世界,以第一人称视角进入其中,像玩游戏一样在 AI 实时生成的场景中漫游。无需本地部署,无需复杂配置,打开 App 即可体验。这是世界模型首次以移动端产品的形态,面向普通用户开放。

  支撑这一体验的核心,是蚂蚁灵波科技开源的世界模型 LingBot-World-Fast。该模型在 480P 分辨率下可实现 16 fps 实时生成,端到端交互延迟控制在 1 秒以内,兼具通用性、长时序一致性与⾼动态场景表现能力。

  除了面向普通用户的灵光 App 体验,开发者与研究者也可以基于开源的 LingBot-World-Fast 进行本地部署和二次开发。本地环境下,模型支持无缝的持续生成,用户可以通过键盘、鼠标实时操控视角与移动,也可以通过文本提示(Prompt)随时改变环境状态或触发局部事件,比如调整天气、切换画面风格等。

  为了实现实时交互,蚂蚁灵波 LingBot-World-Fast 提出了专门的后训练优化方案,模型在生成过程中只聚焦新增画面内容,不再重复计算已稳定的部分,从而显著提升实时生成效率,同时尽可能确保画面质量、时序连贯性与场景一致性。

  实时世界模型提供了一个可以进入、操作和即时响应的环境,每一次交互都能即时看到结果,而非等待离线渲染。对于具身智能研发而言,LingBot-World-Fast 可提供多样化的虚拟训练环境,帮助机器人在数字世界中进行场景理解、动作学习和任务演练。对于游戏开发和内容创作而言,它有望降低交互式内容原型制作门槛,提升从创意到体验的转化效率。

  今年 1 月,蚂蚁灵波曾开源 LingBot-World-Base 版本,凭借高保真画质、10 分钟超长视频生成和出色的物理一致性,在世界模型方向上引发广泛关注。

  目前,LingBot-World-Fast 模型与代码已在 Hugging Face和 Model Scope面向社区完整开放。普通用户可通过灵光 App 直接体验相关能力,开发者和研究者也可基于开源模型进行本地部署与进一步探索。

特别提醒:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。
0
相关文章