aibase发布于AI新闻资讯2025年9月2号 15:071分钟

腾讯AI研究团队Hunyuan近期动作频频,其最新开源项目HunyuanWorld-Voyager引发了全球AI与3D技术领域的热烈讨论。作为一款具备原生3D重建能力的超长程世界模型,HunyuanWorld-Voyager在WorldScore排行榜上荣登榜首,凭借卓越的相机控制、内容对齐和3D一致性表现,超越了Gen-3等竞品。这款模型为3D重建、深度估计及图生3D等应用场景带来了革命性突破。

QQ20250902-144324.jpg

 原生3D重建,单张图像生成点云  

HunyuanWorld-Voyager的最大亮点在于其原生3D重建能力。仅需一张输入图像,模型即可生成与世界一致性的3D点云,省去了传统3D建模复杂的前处理步骤。得益于腾讯在多模态生成领域的深厚积累,该模型能够高效捕捉图像中的几何信息和语义细节,为虚拟场景的快速构建提供了可能。这一特性使其在游戏开发、虚拟现实(VR)和数字内容创作等领域具有广泛应用潜力。

 卓越相机控制,探索无界3D世界  

与传统3D生成模型相比,HunyuanWorld-Voyager在相机控制方面表现出色。用户可自定义相机路径,模型能够根据轨迹生成几何一致的3D场景,保持长期的空间连贯性。无论是360°全景漫游还是特定视角的细节探索,该模型都能提供流畅的交互体验。此外,模型支持实时生成精确对齐的深度信息和RGB视频,无需额外后处理即可用于高质量3D重建,极大提升了开发效率。

 WorldScore榜首,性能全面领先  

根据最新数据,HunyuanWorld-Voyager在WorldScore排行榜上名列第一,相机控制、内容对齐和3D一致性等关键指标全面超越Gen-3等现有模型。其独特的多阶段架构结合了全景图像生成、语义分层和层次化3D重建技术,确保了生成世界的视觉质量和几何一致性。腾讯通过开源完整代码、模型权重和文档,进一步降低了开发者使用门槛,助力全球AI社区的协作创新。

 多场景应用,赋能产业升级  

HunyuanWorld-Voyager的应用场景极为广泛。在游戏开发中,开发者可利用其快速生成可交互的3D世界,大幅缩短开发周期;在VR领域,模型支持生成沉浸式全景环境,为用户提供逼真的虚拟体验;此外,其在3D重建和深度估计中的出色表现,还可应用于机器人导航、自动驾驶和增强现实(AR)等前沿领域。腾讯表示,该模型的开源将推动3D内容创作的民主化,为中小型开发者和独立创作者提供媲美顶级工作室的工具。

 开源战略,腾讯加速AI生态布局  

腾讯Hunyuan团队此次开源HunyuanWorld-Voyager,是其2025年开源计划的重要一环。此前,腾讯已陆续开源了Hunyuan3D-2.0、Hunyuan3D-2.1等多款3D生成模型,涵盖从高分辨率资产生成到游戏场景优化的多种技术。HunyuanWorld-Voyager的发布进一步巩固了腾讯在全球AI竞赛中的领先地位,其开放的社区驱动模式也与Stable Diffusion等项目形成呼应,对抗西方封闭生态的垄断趋势。

腾讯HunyuanWorld-Voyager的开源标志着3D世界生成技术的又一次飞跃。其原生3D重建、卓越的相机控制和广泛的应用场景,不仅为开发者提供了强大工具,也为AI驱动的虚拟世界探索开辟了新可能。

项目地址:https://3d-models.hunyuan.tencent.com/world/

0个人收藏 收藏

评论交流