GLM-5.1 在「滚球平衡迷宫」的评测结果
这是该 AI 模型在此测试用例上的详细评测结果。
基本信息
- 模型名称:GLM-5.1
- 用例名称:滚球平衡迷宫
- 测试类型:网页生成
- 评测维度:游戏开发
系统提示词(System Prompt)
这是给 AI 模型的背景设定和角色指令:
你是一名资深 Web 前端开发专家,擅长使用 HTML5 Canvas 和原生 JavaScript 实现 2D 游戏逻辑。 回答要求: 1. 所有代码(HTML、CSS、JavaScript)必须合并在单个 HTML 文件中,可直接在浏览器运行,无需任何外部依赖。 2. 游戏核心逻辑必须完整可运行:包括键盘事件监听、平台倾斜角度计算、基于倾斜角的球体加速度模拟、圆形与矩形的碰撞检测,以及胜负判定。 3. 禁止使用外部图片、音频文件或第三方库链接;所有视觉元素须通过 Canvas 绘图或 CSS 实现。 4. 代码需具备健壮性:碰撞检测不得出现穿模现象,球体不能穿越迷宫墙壁。 5. 界面需向用户明确展示操作说明(方向键或 WASD 控制)。 6. 优先保证逻辑正确性与代码可读性,视觉效果以清晰为主,不追求复杂特效。
用户提示词(User Prompt)
这是用户给 AI 模型的具体任务要求:
# 滚球平衡迷宫(基础版) ## 任务描述 使用单个 HTML 文件(内嵌 CSS 和 JavaScript),基于 HTML5 Canvas 实现一个可交互的 2D 滚球平衡迷宫游戏。 ## 功能要求 ### 1. 迷宫与平台 - 使用 Canvas 绘制一个固定布局的 2D 迷宫,包含若干横向和纵向墙壁。 - 迷宫中需明确标注起点(绿色区域)和终点(红色/金色区域)。 - 平台可在 X 轴和 Y 轴方向倾斜,倾斜角度范围限制在 ±15° 以内。 ### 2. 球体物理 - 球体初始放置于起点位置。 - 根据平台当前倾斜角度,对球体施加对应方向的加速度(模拟重力分量)。 - 球体需具备基础的速度衰减(摩擦力),防止无限加速。 ### 3. 控制方式 - 按下方向键(↑↓←→)或 WASD 键时,平台向对应方向倾斜。 - 松开按键后,平台逐渐回正(角度归零)。 ### 4. 碰撞检测 - 实现球体(圆形)与迷宫墙壁(矩形)之间的碰撞检测。 - 碰撞后球体速度在碰撞法线方向上反转或清零,不得穿模。 ### 5. 胜负判定 - 球体中心进入终点区域时,在画布上显示「恭喜通关!」提示,并停止游戏循环。 - 提供「重新开始」按钮,点击后重置球体位置和平台角度。 ### 6. 界面说明 - 页面顶部或底部需显示操作说明文字,例如:「使用方向键或 WASD 控制平台倾斜」。
任务要求
AI 模型需要满足以下要求:
- 平台倾斜与球体加速度的物理关联正确:倾斜角度能驱动球体向对应方向加速滚动,且存在摩擦力衰减,球体不会无限加速。
- 碰撞检测完整且无穿模:球体与所有迷宫墙壁均发生有效碰撞,碰撞后球体被正确阻挡,不穿越墙体。
- 迷宫布局合理可玩:起点与终点位置清晰可辨,迷宫存在至少一条可通行路径,玩家能够通过操作将球从起点引导至终点。
- 胜利判定与重置功能正常:球体到达终点后正确触发胜利提示并停止游戏,重新开始按钮能完整重置游戏状态。
- 键盘控制响应正确:方向键/WASD 按下时平台倾斜,松开后平台回正,控制逻辑无冲突或卡键问题。
- 代码自包含性:整个游戏在单一 HTML 文件中运行,无外部资源依赖,可直接在浏览器打开使用。
评测结果
综合得分
该模型在此用例的得分为:90.0 分(满分 100 分),已通过
基础难度评测结果
- 得分:90.0 分
- 通过状态:已通过
模型生成产物
以下是该模型针对此任务的实际生成内容:
下面是完整的单文件 HTML 滚球平衡迷宫游戏实现。包含了物理模拟、碰撞检测、键盘控制以及胜负判定等所有要求的功能。 ```html 滚球平衡迷宫 body { margin: 0; padding: 0; background-color: #2c3e50; font-family: 'Segoe UI', Tahoma, Geneva, Verdana, sans-serif; color: #ecf0f1; display: flex; flex-direction: column; align-items: center; justify-content: center; min-height: 100vh; } h1 { margin: 10px 0; text-shadow: 2px 2px 4px rgba(0,0,0,0.5); } .instructions { margin: 10px 0; padding: 8px 16px; background-color: #34495e; border-radius: 5px; font-size: 16px; letter-spacing: 1px; } .game-container { position: relative; border: 4px solid #bdc3c7; border-radius: 8px; box-shadow: 0 0 20px rgba(0,0,0,0.5); background-color: #95a5a6; } canvas { display: block; } #message { position: absolute; top: 50%; left: 50%; transform: translate(-50%, -50%); font-size: 36px; font-weight: bold; color: #f1c40f; text-shadow: 2px 2px 0 #d35400, -2px -2px 0 #d35400, 2px -2px 0 #d35400, -2px 2px 0 #d35400; pointer-events: none; opacity: 0; transition: opacity 0.3s; } #message.show { opacity: 1; } .controls { margin-top: 15px; } button { padding: 10px 20px; font-size: 16px; font-weight: bold; color: #2c3e50; background-color: #e74c3c; border: none; border-radius: 5px; cursor: pointer; box-shadow: 0 4px #c0392b; transition: all 0.1s; } button:active { transform: translateY(4px); box-shadow: 0 0 #c0392b; } button:hover { background-color: #c0392b; color: #ecf0f1; } 滚球平衡迷宫 使用 方向键(↑↓←→)或 WASD 控制平台倾斜 恭喜通关! 重新开始 const canvas = document.getElementById('gameCanvas'); const ctx = canvas.getContext('2d'); const messageEl = document.getElementById('message'); const W = canvas.width; const H = canvas.height; // --- 物理常量 --- const GRAVITY = 0.4; // 重力加速度缩放值 const MAX_ANGLE = 15 * Math.PI / 180; // 最大倾斜角度 15度 const ANGLE_SPEED = 0.03; // 按键时倾斜角速度 const ANGLE_DECAY = 0.85; // 松开按键后角度回正衰减系数 const FRICTION = 0.97; // 速度摩擦系数 const BALL_RADIUS = 12; // 球体半径 const MAX_SPEED = 8; // 最大速度限制,防止穿模 // --- 游戏状态 --- let ball = { x: 0, y: 0, vx: 0, vy: 0 }; let angleX = 0; //...
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】这是一个完成度很高的滚球平衡迷宫游戏实现。代码在物理模拟、碰撞检测、控制响应等核心功能上表现优秀,特别是针对穿模问题的双重处理机制(常规碰撞+极端情况强制推出)体现了开发者对健壮性的重视。游戏机制完整,自包含性强,可直接运行无需任何外部依赖。视觉设计清晰美观,倾斜指示器等细节设计提升了用户体验。主要改进空间在于:迷宫难度可适当提升(增加更复杂的路径或障碍),胜利判定可更精确(考虑球体半径),以及可添加任务描述中提到的宝石收集等额外玩法元素。整体而言,该实现充分满足了基础版滚球迷宫的所有核心要求,是一个高质量的单文件游戏作品。 【GEMINI】这是一个非常高质量的实现。代码结构清晰,物理引擎逻辑严密,尤其是碰撞处理部分考虑到了极端情况。除了遗漏了任务描述中简要提及的‘宝石收集’功能外,其余所有功能要求均以高标准完成,且在视觉反馈(倾斜指示器)方面超出了基本预期。 【KIMI】该实现代码质量较高,物理引擎和碰撞检测算法设计严谨,单文件自包含无外部依赖,视觉呈现专业。但核心缺陷在于迷宫布局的连通性设计存在错误,经坐标分析发现从起点到终点缺乏有效可通行路径,内部墙壁的排列形成了多处死胡同和不可逾越的障碍,终点区域甚至被完全封锁。这导致游戏虽然机制完整、代码正确,但实际可玩性严重受损,玩家无法正常通关。建议重新设计墙壁坐标,确保至少存在一条宽度不小于40像素的连续通道连接起点和终点。
进阶难度评测结果
- 得分:92.3 分
- 通过状态:已通过
模型生成产物
以下是该模型针对此任务的实际生成内容:
```html 滚球平衡迷宫 *{margin:0;padding:0;box-sizing:border-box} :root{--bg:#0d1117;--fg:#e6edf3;--muted:#8b949e;--accent:#00d4aa;--card:#161b22;--border:#30363d;--gold:#ffd700;--danger:#ff4757;--success:#3fb950} body{background:var(--bg);color:var(--fg);font-family:'Segoe UI',system-ui,sans-serif;display:flex;justify-content:center;align-items:center;min-height:100vh;overflow:hidden;user-select:none} #gameContainer{position:relative;display:flex;flex-direction:column;align-items:center} canvas{border-radius:12px;box-shadow:0 0 60px rgba(0,212,170,0.08),0 4px 24px rgba(0,0,0,0.5);image-rendering:auto} #hud{position:absolute;top:8px;left:8px;right:8px;display:none;justify-content:space-between;align-items:center;pointer-events:none;z-index:10;gap:6px} .hud-item{background:rgba(13,17,23,0.88);padding:5px 14px;border-radius:18px;font-size:13px;font-weight:600;backdrop-filter:blur(8px);border:1px solid rgba(48,54,61,0.5);display:flex;align-items:center;gap:5px;white-space:nowrap} .hud-icon{font-size:14px} .overlay{position:absolute;inset:0;display:flex;flex-direction:column;justify-content:center;align-items:center;background:rgba(13,17,23,0.93);backdrop-filter:blur(14px);z-index:100;border-radius:12px;transition:opacity 0.35s} .overlay.hidden{opacity:0;pointer-events:none} .overlay h1{font-size:clamp(28px,5vw,42px);font-weight:900;margin-bottom:6px;background:linear-gradient(135deg,var(--accent),#00ff88);-webkit-background-clip:text;-webkit-text-fill-color:transparent;background-clip:text;letter-spacing:-1px} .overlay h2{font-size:clamp(20px,3vw,28px);font-weight:700;margin-bottom:12px;color:var(--fg)} .overlay p{color:var(--muted);margin-bottom:6px;font-size:13px;text-align:center;max-width:360px;line-height:1.5} .level-grid{display:flex;gap:14px;margin:20px 0;flex-wrap:wrap;justify-content:center} .level-card{background:var(--card);border:2px solid var(--border);border-radius:14px;padding:18px 22px;cursor:pointer;transition:all 0.25s;text-align:center;min-width:130px}...
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】这是一个完成度极高的滚球平衡迷宫游戏实现。物理引擎使用原生 JavaScript 正确模拟加速度、惯性和摩擦力,碰撞检测算法稳定可靠。三关卡设计合理,计时与最佳记录系统完整,陷阱和星星收集机制运作正常。视觉呈现专业「球体金属质感、粒子特效、发光效果」,音效使用 Web Audio API 合成符合要求。控制手感流畅,界面信息完备,操作引导清晰。代码结构清晰,注释充分,单文件实现无外部依赖。主要改进空间在于增强陷阱区域的视觉辨识度、优化粒子系统的视觉层次、丰富墙壁和地板的细节表现。整体达到了专业 Web 游戏开发的水准。 【GEMINI】这是一个高质量的单文件游戏实现。开发者展现了深厚的 HTML5 Canvas 游戏开发功底,不仅完美履行了所有物理和逻辑要求,还在视觉特效(如屏幕震动、粒子扩散、发光效果)和音效合成上提供了极高的完成度。代码结构清晰且具备良好的扩展性,是 AI 生成游戏代码的典范。 【KIMI】该实现是一个高质量的完整滚球平衡迷宫游戏,在单个HTML文件中实现了所有要求功能。物理系统采用原生JavaScript实现了加速度、摩擦力、惯性、弹性碰撞等核心机制,碰撞检测稳定可靠。三关卡设计难度递进合理,陷阱和星星布局有策略性。视觉方面采用现代暗色UI设计,粒子特效、屏幕震动、发光效果增强了游戏反馈。Web Audio API音效合成符合要求且音色区分度明显。整体代码结构清晰,无明显bug,可直接在浏览器运行。主要改进空间在于物理参数的真实感调优(增加滚动感而非滑动感)和更丰富的通关庆祝反馈。
困难难度评测结果
- 得分:91.0 分
- 通过状态:已通过
模型生成产物
以下是该模型针对此任务的实际生成内容:
```html 3D 滚球平衡迷宫 :root { --bg: #080c14; --panel: #0d1219; --card: #111822; --border: #1a2a3a; --accent: #00e5ff; --accent2: #ff6b35; --fg: #e0e8f0; --muted: #5a6a7a; --success: #00ff88; --danger: #ff1744; --portal: #b388ff; --bounce: #ff4081; --moving: #448aff; --star-color: #ffd700; } * { margin:0; padding:0; box-sizing:border-box; } body { background: var(--bg); color: var(--fg); font-family: 'Segoe UI', 'SF Pro Display', system-ui, sans-serif; overflow: hidden; height: 100vh; width: 100vw; user-select: none; -webkit-user-select: none; } .screen { display:none; position:absolute; inset:0; flex-direction:column; align-items:center; justify-content:center; } .screen.active { display:flex; } /* 主菜单 */ #menu-screen { background: radial-gradient(ellipse at 50% 30%, #0f1a2a 0%, var(--bg) 70%); } .menu-title { font-size: clamp(28px, 6vw, 56px); font-weight: 900; letter-spacing: 4px; color: var(--accent); text-shadow: 0 0 30px rgba(0,229,255,0.4), 0 0 60px rgba(0,229,255,0.15); margin-bottom: 8px; } .menu-subtitle { font-size: clamp(12px, 2vw, 16px); color: var(--muted); letter-spacing: 6px; text-transform: uppercase; margin-bottom: 40px; } .level-grid { display: grid; grid-template-columns: repeat(auto-fit, minmax(140px, 1fr)); gap: 12px; max-width: 520px; width: 90%; margin-bottom: 24px; } .level-card { background: var(--card); border: 1px solid var(--border); border-radius: 10px; padding: 16px 12px; text-align: center; cursor: pointer; transition: all 0.25s; position: relative; overflow: hidden; } .level-card::before { content: ''; position: absolute; inset: 0; background: linear-gradient(135deg, rgba(0,229,255,0.05), transparent); opacity: 0; transition: opacity 0.25s; } .level-card:hover::before { opacity:1; } .level-card:hover { border-color: var(--accent); transform: translateY(-2px); } .level-card.locked { opacity: 0.4; cursor: not-allowed; } .level-card.locked:hover { border-color: var(--border); transform: none; } .level-num { font-size: 24px; font-weight:...
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】这是一个完成度极高的3D滚球平衡迷宫游戏实现。代码架构清晰,物理层、渲染层、游戏逻辑层分离良好,关键函数均有注释。物理引擎实现专业,碰撞检测严谨,分步检测有效防止穿模。5个关卡设计各具特色,机制覆盖完整(移动平台、旋转障碍、弹跳板、传送门、陷阱),且逻辑全部正确可交互。游戏系统功能齐全,计时、星星收集、成就系统、进度持久化均完整实现。CSS 3D透视效果明显,球体阴影动态偏移,墙壁具有立体感。粒子系统和Web Audio API音效为游戏增色不少。多端控制适配完善,键盘平滑插值、虚拟摇杆、陀螺仪支持均已实现。整体用户体验流畅,视觉风格统一,完全满足专业级游戏开发要求。唯一可优化空间在于墙壁3D效果可进一步增强透视投影复杂度,但这不影响其作为优秀作品的整体评价。 【GEMINI】这是一个高水准的 AI 生成游戏示例。代码架构清晰,模块化程度高(物理、渲染、逻辑分离)。开发者不仅准确实现了所有复杂的功能性要求(如 Web Audio 合成、原生 3D 物理、多端适配),还在细节上表现卓越,如分步碰撞检测和伪 3D 墙壁渲染。游戏平衡性良好,视觉与音效的统一性极高,是一个可以直接投入运行的专业级 Web 游戏。 【KIMI】该实现是一个功能完整、视觉出色的3D滚球平衡迷宫游戏,代码架构清晰(物理/渲染/逻辑分层),所有核心要求均已满足。5个关卡机制多样,localStorage持久化和成就系统工作正常。主要扣分点在于:陀螺仪和虚拟摇杆的控制映射存在方向逻辑问题,物理引擎缺少持续滚动音效和更稳健的CCD防穿模机制,以及部分UX细节(粒子混合模式、界面过渡动画)有待优化。整体达到可发布水准,但移动端操控体验需要额外调试。
相关链接
您可以通过以下链接查看更多相关内容: