据小易智创xiaoyizc.com(不可错过的AI创业项目)观察:GameGen-O 是腾讯推出的一款颠覆性的游戏视频生成模型,基于创新的 Transformer 架构,专门为开放世界视频游戏量身定制。该模型能够模拟多种游戏引擎功能,创造出令人惊叹的游戏角色、动态变化的环境以及复杂多样的动作,甚至支持用户通过文本、操作信号和视频提示来操控游戏内容。
在技术层面上,GameGen-O 实现了开放域生成,意味着它可以生成各类游戏元素,包括角色、环境、动作和事件,极大地扩展了游戏的可能性。同时,模型的交互式可控性让玩家能够通过 InstructNet 分支来实时掌控角色行为、环境布局和事件进程。
为了训练这个强大的模型,研究团队创造了首个开放世界电子游戏数据集 OGameData,涵盖了来自150多个游戏的4000多个小时的视频片段,囊括了丰富多彩的游戏类型与风格。GameGen-O 的训练过程采取了两阶段策略:首先是基础模型预训练以学习生成高质量游戏视频,其次是指令微调,使得模型具备了根据用户指令生成和控制内容的能力。
在技术创新方面,GameGen-O 采用了前沿技术,如2+1D VAE视频压缩、混合训练策略和掩码注意力机制,确保了模型在生成质量和稳定性上的卓越表现。数据集的构建过程极为严谨,从互联网上收集32,000个原始视频,经过专业筛选与标注后形成了高质量的训练数据。
总之,GameGen-O 的发布将对游戏开发行业带来深远影响,帮助开发者大幅降低成本与时间,同时为玩家打开无限创作自由的大门。未来,谁能想象一个玩家只需轻松输入几句话,就能看到自己构建的游戏世界呢?
© 版权声明
文章版权归作者所有,未经允许请勿转载。