• 常用
  • 百度
  • google
  • 站内搜索

AI资讯

Muse – 微软研究院推出的生成式AI模型

  • 发布时间: 2025-3-14

Muse是什么

Muse是微软推出的首个用在游戏创意生成的生成式AI模型,基于“World and Human Action Model”(WHAM)。Muse能生成游戏视觉效果和控制器操作,基于学习人类玩家的游戏数据(如图像和操作指令)模拟真实的游戏玩法序列。核心能力包括生成连贯一致的游戏画面、展现多样化的游戏路径以及将用户修改融入生成内容中。Muse基于WHAM Demonstrator提供交互界面,支持创意探索和迭代。微软已开源Muse的权重和样本数据,推动游戏创意生成的研究和创新,为未来的AI驱动游戏开发提供支持。

Muse的主要功能

生成连贯的游戏视觉和玩法:根据初始的游戏画面和控制器操作,生成长达数分钟的连贯游戏玩法序列,模拟真实的游戏动态。支持多样化的游戏路径:在相同的初始提示下,生成多种不同的游戏玩法和视觉效果,展现丰富的行为和视觉多样性。持久化用户修改:将用户对游戏画面的修改(如添加角色)融入生成的内容中,生成合理的后续玩法。创意迭代支持:基于WHAM Demonstrator界面,用户能加载初始画面、调整生成内容,并基于控制器操作引导角色,实现创意的快速迭代。

Muse的技术原理

VQ-GAN:用在将游戏视觉(如游戏画面)编码为离散的表示形式。VQ-GAN基于量化的方式将图像转换为离散的标记(tokens),便于模型处理。Transformer架构:作为模型的主干网络,用于预测下一步的标记。Transformer能处理离散的视觉和操作序列,捕捉它们之间的复杂关系。自回归生成:模型基于给定的初始提示(如初始游戏画面或控制器操作),逐步生成后续的视觉和操作序列。每一步的输出都依赖于前面的上下文,确保生成的序列具有连贯性和一致性。训练数据:Muse基于《Bleeding Edge》游戏的玩家操作和视觉数据进行训练。数据包括玩家的控制器操作和对应的游戏画面,模型基于学习这些数据生成新的游戏序列。

Muse的项目地址

项目官网:https://www.microsoft.com/en-us/research/blog/introducing-museHuggingFace模型库:https://huggingface.co/microsoft/wham技术论文:https://www.nature.com/articles/s41586-025-08600-3

Muse的应用场景

游戏创意探索:快速生成游戏玩法和关卡设计,帮助开发者验证新创意。自动化游戏测试:生成多样化的测试序列,检测游戏漏洞和优化体验。内容生成:自动生成新的关卡、地图或角色动作,丰富游戏内容。玩家行为预测:模拟玩家操作,分析行为模式,优化游戏设计。AI驱动体验:开发动态剧情和AI对手,提升游戏的个性化和沉浸感。