1. WHAMM模型是什么?

微软的WHAMM(World and Human Action MaskGIT Model)是一个创新的人工智能模型,能够完全在AI模型内部生成并运行经典游戏,如《雷神之锤II》,并实时呈现可供玩家操作的游戏版本。该模型是微软“Muse”模型家族的一部分,专注于为游戏开发提供生成式AI工具。WHAMM通过学习大量人类游戏玩家的真实行为数据,能够生成多样化且具有一致性的3D游戏环境,并预测游戏环境的时空结构及玩家的动作[^1^^2^]。

2. WHAMM模型发展到什么阶段?

WHAMM模型的发展已经取得了显著进展。目前,WHAMM能够以每秒超过十帧的画面生成速度支持模型内部的实时互动,这比之前的版本WHAM-1.6B(每秒约一帧)有了巨大的飞跃。然而,WHAMM仍处于早期研究阶段,存在一些局限性。例如,模型生成的环境是近似的,敌方角色看起来较为模糊,战斗缺乏真实感,且生命值指示不可靠。此外,输入延迟仍然较高,玩家的操作和系统响应之间存在明显的延迟。 https://www.yumiok.com/wp-content/uploads/2025/04/1744019062-WHAMM.mp4

0个人收藏 收藏

评论交流