感觉是李飞飞那个图转世界的开源青春版🥹 WorldExplorer: Towards Generating Fully Navigable 3D Scenes 🧐 这是慕尼黑工业大学团队在 SIGGRAPH Asia 2025 提出的 WorldExplorer,一种通过 相机引导的视频扩散模型 + 3D 高斯点渲染,实现从文本生成可完全自由探索的 3D 场景的方法,首次突破了现有方法中“只能在中心或全景视角下保持质量”的限制。 ➡️链接:mschneider456.github.io ✨重点
● 🏗️ 核心目标:从自然语言 Prompt 自动生成高质量、可自由导航的 3D 场景,支持真实感视角移动。
● 🎥 三阶段生成流程: 初始 Scaffold:用 T2I 模型生成 4 张环绕中心的全景图,再补齐深度与修复生成 8 张初始图像; 视频轨迹扩展:基于相机引导的视频扩散模型,迭代生成多段短视频帧,模拟相机围绕物体移动; 3D 优化重建:将所有图像融合,利用 3D Gaussian Splatting (3DGS) 优化为可实时渲染的完整场景。