本章目标
跑通一个智能体最基础的闭环
状态输入 → 模型决策 → 执行动作 → 新状态反馈
玩家可控
起点、宝箱、墙体、提示词
你不是直接控制角色,而是在训练一个猎人。
动作空间
UP / DOWN / LEFT / RIGHT / FINISH
固定格式:{"action":"UP","reason":"简短原因"}
迷宫实验区
地图与目标
正在计算可达性...
猎人
起点
宝箱
墙
走过 1 次
走过 2 次
走过 3 次以上
提示词控制台
提示词与控制台
待启动
模型配置 默认额度有限,建议使用自己的 API Key
接口设置
仅支持 OpenAI 兼容接口。
填写你自己的 API Key 后,请求会直接发送到你配置的模型接口,不经过本站服务器。