游戏生成不该是一次性的Prompt抽卡,而应该是一场有记忆、有计划、可验证的机制进化。
让大模型写一个小游戏,已经不新鲜了。它可以很快生成一个 Flappy Bird、一个塔防游戏、一个物理解谜页面,甚至还能补上按钮、分数和简单动画。但真正的问题是:这些游戏到底有没有新的玩法?它们是在创造,亦或只是把已有游戏换了一层皮?如果你让GPT写一个小游戏,它大概率能在几分钟内吐出一堆像模像样的游戏代码。但如果你要求它在此基础上再改一版、再改一版,改到第四代时,事情就开始变得诡异——它可能忘了第一代的核心玩法是什么,可能把好不容易调通的物理引擎又改崩了,也可能只是在视觉层面换了一层皮,却声称自己创造了"全新的游戏体验"。更深层的问题在于评分。当你让AI给自己的作品打分时,它往往会客气地给出7分或8分,无论实际质量如何。这种"打分通胀"让迭代优化失去了方向,对“Creativity”的把控正是当下大模型所普遍缺乏的的能力,以至于也很难给出高屋建瓴的评价和建议。
CreativeGame 关注的正是这个问题。它不是让 AI 一次性生成一个看起来像游戏的页面,而是让 AI 围绕“机制”持续迭代:保留原始游戏最容易理解的核心循环,同时逐步引入新的规则、新的目标和新的玩家行为意义。来自布里斯托大学、上海交通大学和Sreal AI的研究团队最近公开了一项名为CreativeGame的技术报告,试图从根本上打破这种僵局。他们的思路很清晰:游戏生成不该是一次性的Prompt抽卡,而应该是一场有记忆、有计划、可验证的机制进化。
01
机制优先:先写"设计文档",再写代码
类似于传统的游戏开发流程,策划会优先制定一个游戏的核心玩法,再逐步构建游戏其他的数值系统等分支。CreativeGame,强制AI在动手写代码之前,先完成一份结构化的设计文档——明确这一轮要保留什么核心机制、新增什么规则、移除什么旧设计、以及如何重组已有元素。这种做法彻底改变了AI与游戏的关系。在传统的生成流程中,机制往往只是事后的描述标签,AI根据Prompt自由发挥,生成完了再贴几个标签总结自己做了什么。而CreativeGame把机制提到了规划的最前端:检索全局游戏机制档案,然后输出一份明确的机制合约。这份合约会像合同一样被附加到后续的Skeleton、Feature、Visual、Refinement四个代码生成阶段,确保代码是在履行设计意图,而不是漫无目的地堆砌。
例如下面这个案例,我们希望Agent能自动给出一个有趣的塔防游戏,它会从经典的策略塔防游戏:例如Zombie vs Plants中提取设计灵感,并包含了Bloom(向日葵,Energy生产者),Shooter(豌豆射手,75 Energy消耗,可以对入侵的丧尸发射子弹,消灭敌人)等基本元素:
策略塔防游戏:建造开销、塔防防御规划、生存建造抵御入侵,经典的类植物大战僵尸玩法。
然而,一个完整好玩的游戏,并不是只有简单的核心玩法,还包括 关卡设计、植物图鉴、各植物之间的配合等。于是CreativeGame 进行了一定的机制改进和设计,引入了waves(也就是关卡),路线弯曲(减缓丧尸移速),豌豆可以给向日葵进行充能,使之成为可以发射阳光大炮的高级武器。
策略塔防游戏(进化版):丰富了waves(关卡)设计,创新式引入了路线弯曲机制,以及Shooter可以给Gen(Energy生产者)进行充能,这里Energy延伸为“炮台充能”。
02
创意激发:真正让模型具备创意生成的能力,而不是模仿
当前的大模型在文本、图像、音乐等领域展现出了惊人的生成能力,但一个核心问题始终存在:它们究竟是在“创造”,还是仅仅在对训练数据中的模式进行高维度的重新排列?从表面上看,模型能够写出前所未见的故事、设计独特的视觉风格,甚至提出看似新颖的概念组合,这似乎已经接近人类意义上的创造力。然而,深入分析会发现,大模型的生成过程本质上仍然高度依赖于海量已有数据中的统计规律。它并不像人类那样拥有真实的体验、动机、情感冲突和价值判断,也缺乏“为什么要创造”的内在驱动力。
因此,创意激发的关键,不是单纯扩大模型参数规模或训练数据量,而是思考如何让模型拥有更接近“原创性”的机制。例如,引入目标驱动的探索能力、长期记忆与反思机制,以及与真实环境持续交互所产生的反馈闭环。只有当模型能够主动发现问题、形成偏好、修正自身认知,它才可能从“高级模仿者”走向真正意义上的“创造者”。诚然,这种激发需要良性的反馈,甚至人类的参与。当你让GPT给游戏创意打分时,它往往慷慨给出7分或8分——不是因为真的新颖,而是因为熟悉感偏见:LLM天然倾向给"看起来像那么回事"的内容高分。如果优化目标完全依赖这种主观判断,系统很快就会学会一种危险的生存策略:用华丽的视觉描述和复杂的叙事框架,包裹一个换皮的Pong。这不是创造,是高概率模仿。评分虚高是AI生成领域的顽疾。研究团队观察到,GPT类模型在评估创造力时存在严重的分数膨胀,动辄给出7分或8分,无论输入质量如何。更危险的是,如果优化目标完全依赖LLM判断,系统会倾向于生成"听起来很有创意但玩起来空洞"的内容。
CreativeGame的应对策略是CreativeProxyReward——一套以确定性代码编译为主的代理奖励系统,包括:结构机制变化、计划机制的视线程度、相对全局专家机制库的新颖性、运行时鲁棒性,并辅助性伴随着LLM的主观创造力评价。这套系统还设有两道硬门槛。如果生成的游戏跑不起来,奖励直接腰斩;如果静态分析发现游戏循环没被调用、Canvas上下文没获取、括号不匹配等基础错误,分数也会被打到骨折。这意味着,一个"创意十足"但运行就崩的游戏,在CreativeGame的价值观里拿不到高分。基于完备的代码环境,创意不再是修辞学的把戏,而是可被验证的结构事实。
以下是一些创意式机制设计的案例:
Game 1 Demo: Fireboy & Watergirl 原本是一个双角色平台解谜游戏。Fireboy 可以通过火,但不能碰水;Watergirl 可以通过水,但不能碰火。玩家需要控制两个角色,按下机关、穿越平台,并让他们分别到达对应出口。这个游戏的核心,是双角色合作、元素限制、机关触发和平台跳跃。
CreativeGame 没有简单复制“双人合作”这个形式,而是把它重新解释成“自己和自己的过去合作”。在 Memory Relay 中,一个角色可以被停放在光环中,为桥梁或机关供能。也就是说,即使角色当前没有被玩家控制,它仍然是关卡逻辑的一部分。当玩家切换角色时,系统会记录刚才的移动路径。这条路径会变成 replay ghost,在场景里重新跑一遍。如果角色在记录过程中碰过重力符文,这段幽灵轨迹还会被重力规则重新解释,从而触发不同位置的机关。最终,玩家需要协调当前角色、停放的身体和过去的移动轨迹,让它们共同完成中继解谜。
Creativity:
Memory Relay 的合作发生在当前操作、停放身体和历史记忆之间,而不是单纯发生在两个角色之间。
Game 2 Demo: Flappy Bird 的原始玩法非常简单。玩家点击屏幕,小鸟向上飞一下;如果不点击,小鸟会因为重力下坠。玩家需要控制小鸟穿过一对对管道之间的空隙,碰到管道就失败。这个游戏的核心,是单按钮控制、点击时机、躲避障碍和不断追求更高分。
CreativeGame 让飞行拥有节奏、记忆和未来影响。画面中加入了节拍圆环。玩家如果踩着节拍点击,就会触发 Sync,为小鸟充能;如果没有踩准节拍,则会损失一点能量。能量充满后,小鸟会进入 Phase 状态,短暂变成白色,并获得穿越特殊膜门的能力。于是,节奏不再只是视觉反馈,而变成了解锁能力的条件。游戏还加入了 Perfect Pass 机制。如果玩家精确从门的中心穿过,系统会自动改写后续一道门的位置和缝隙宽度,让未来路线变得更有利。更特别的是死亡回声机制。玩家失败前的一段飞行轨迹,会在下一局变成一个白色光球重新出现。当这个回声经过某道门时,会撑大门的缝隙,帮助玩家继续前进。
Creativity:
不再是一个简单的反应式生存游戏,而是被改造成了一个结合节奏、记忆和路线编辑的关卡。玩家当前的精确操作,会改变未来的关卡结构;玩家过去的失败,也会回来帮助下一次尝试。
Game 3 Demo: Happy Glass 的原始玩法,是让玩家画线引导水流进入杯子。玩家通常需要画出斜坡、挡板或支撑结构,改变水滴运动路径,让杯子成功装满。这个游戏的核心,是画线、重力、水滴物理和空间路径设计。
在 CreativeGame 生成的 Ritual Ink Cup 中,玩家仍然通过画线影响水滴,但线条不再只是普通物理形状。这里的线条变成了 programmable ink。Solid ink 像普通挡板一样改变水滴方向。Absorb ink 可以吸收水滴,把它们暂时存起来。被吸收的水滴会在延迟后释放出来,而释放方向和重力方向可以成为策略的一部分。游戏还加入了 ritual charge。水滴如果先经过仪式区域再进入杯子,会获得额外价值。于是,目标不再只是“把水送进杯子”,而是设计一条带有状态变化的水流过程。
Creativity:
线条从物理挡板变成了有状态、有记忆、有释放逻辑的可编程材料。
Game 4 Demo: Plants vs Zombies 是经典的横向车道塔防游戏。敌人从右侧沿着不同车道进攻,玩家在格子上放置植物防守。植物会自动攻击,玩家需要管理资源、选择位置,并抵御一波又一波敌人。这个游戏的核心,是资源管理、单位放置、车道防守和波次压力。
在 Resonance Garden 中,基础玩法仍然是放置单位防守车道,但游戏把“友方子弹”重新定义成了可以管理的资源。Shooter 会像普通防御塔一样向前发射子弹。Generator 会生产能量,但它也会挡住友方子弹。在传统塔防里,挡住自己的攻击通常意味着布局错误。但在这个版本中,被 Generator 挡住的子弹不会浪费,而是被储存为 charge。当 charge 积累到一定程度后,Generator 可以释放更强的攻击。游戏还加入了 lane bend。玩家可以在一波敌人中弯曲某条车道,让释放出的能量沿着新的路径产生折射攻击。这样,玩家要思考的不只是“怎么打中敌人”,还要思考“什么时候故意拦住自己的攻击,把它变成未来的爆发”。
Creativity:
Resonance Garden 把攻击、阻挡、储能和释放变成了一个资源循环。
03
自我进化:让子代游戏共享同一份"家谱记忆"
单点生成的另一个致命伤是遗忘。第一代版本里的巧妙设计,有时候到了第四代被洗得一干二净。CreativeGame为此设计了一套Lineage-Aware Memory架构,把游戏版本组织成谱系树,同一条进化线上的所有节点共享一个记忆池。这个设计借鉴了MemRL的思想,但做了关键改良:记忆在谱系内共享,在谱系间隔离。当策划Agent准备生成新版本时,它不仅会查询全局机制库,还会读取这条谱系积累下来的成功经验与失败教训。反思Agent会在每一轮结束后,将机制级的差异写入记忆,而非仅仅保存一段版本摘要。
举个例子,我们常见的策略塔防游戏——植物大战僵尸,初始版本设定了“阳光生产者、豌豆射手攻击者、以及抵御僵尸入侵”的核心玩法;进化后的第二代版本,在此基础上加入"弯道"能力,可花费资源改变敌人进攻路线;到了第三代,被阻挡的豌豆不再浪费,而是为向日葵储存为"过载充能",释放为全 lane 爆发......如果没有这种谱系记忆方式,进化的过程中则有可能丢失或改变核心玩法,使进化失效。
四类游戏的进化图谱,游戏的进化保留着核心玩法,同时引入创意的新游戏机制以及调整游戏的平衡性。
04
AI Creativity正在不断自我进化
CreativeGame的探索意义,或许不在于它生成的某一款游戏有多么惊艳,而在于它提出了一种可解释、可追踪、可迭代的创作范式。当大多数系统还在让LLM"凭感觉生成"时,CreativeGame已经在让AI去探索和创作,在结构化、可编译的机制设计层面,AI在不断进行进化,试图涌现出真正的Creativity。
这预示着AI内容生成领域一个潜在的范式转向:从追求单次输出的"惊艳感",转向追求不断自我进化的"结构深度"与"一致性"。毕竟,真正的游戏设计从来都不是拍脑袋一蹴而就的,而是不断抽丝剥茧地去思考关于"保留什么、改变什么、为何改变"的连续决策。而当AI学会把这些决策显式化、可衡量、可继承时,它离"设计师"这个角色,或许就真的近了一步。
Arxiv链接:https://arxiv.org/abs/2604.19926
未经「AI科技评论」授权,严禁以任何方式在网页、论坛、社区进行转载!
公众号转载请先在「AI科技评论」后台留言取得授权,转载时需标注来源并插入本公众号名片。

