工作流模板 · 进阶

Agent 任务说明怎么写才不跑偏

一个能反复用的小白版 Agent 任务模板:把目标、资料、步骤、边界、输出格式、示例和验收标准写成任务卡,再交给 Codex、Claude Code、OpenClaw 或客服 Agent。

  • Prompt
  • 工作流
  • 模板
  • Agent 任务卡
  • 验收标准
更新于 2026-06-07

一句话结论

提示词不是咒语,而是一张任务单:目标、资料、规则、步骤、输出、示例、边界和验收标准写清楚,Agent 才不容易跑偏。

适用场景

  • 每次写 Prompt 都要从零开始,换个任务就乱
  • Agent 经常跑偏、编内容、输出格式不稳定
  • 想把客服、知识库、外贸、闲鱼、项目修改这类任务沉淀成团队模板
  • 想把一句“帮我优化一下”改成 Claude Code / Codex / OpenClaw 能执行的任务说明

常见现象

  • Prompt 改一次乱一次,同一个需求换个输入就变味
  • 新人接手不知道该提供哪些资料,只会复制一大段话
  • 上线后回答风格不稳定,有时像客服,有时像销售,有时像闲聊
  • Agent 明明完成了很多动作,但你不知道怎样才算合格
  • 模型不知道什么时候该停、什么时候该追问、什么时候该转人工

原因解释

  • 没有固定结构,靠灵感写,导致每次都漏一块
  • 只写角色,不写目标、资料范围和完成标准
  • 没说清不能做什么,例如不能承诺价格、不能编造库存、不能泄露 Key
  • 没指定输出格式,Agent 就会按自己的习惯自由发挥
  • 没有示例输入输出,也没有用几条真实案例做验收

解决步骤

  1. 先写一句话目标:这次到底要解决谁的什么问题,最后交付什么结果。
  2. 把资料范围写清楚:Agent 能看哪些资料,不能猜哪些资料。
  3. 用八栏模板写任务卡:角色、目标、背景、输入资料、执行步骤、边界、输出格式、验收标准。
  4. 至少给 1 条真实输入和 1 条理想输出,让模型知道你要的口吻和格式。
  5. 写清失败处理:资料不足就追问,涉及价格 / 法律 / 退款 / 账号 / 密钥就转人工。
  6. 用 3-5 条真实样例测试,输出稳定后再放进工作流或 Skill。

可复制命令

# Agent 任务卡

## 1. 角色
你是 {业务场景} 的 {角色},例如:闲鱼客服助手 / 知识库问答助手 / 外贸询盘助理 / 项目修改助手。

## 2. 目标
帮 {用户或团队} 完成 {具体任务},最终输出 {交付物}。

## 3. 背景
业务背景:{这个任务为什么重要}
用户水平:{不会代码 / 会一点 / 专业运营}
当前限制:{时间、预算、工具、权限、风险}

## 4. 可用资料
你只能使用以下资料:
- {资料 1}
- {资料 2}
- {资料 3}
资料不足时必须先追问,不能编造。

## 5. 执行步骤
1. 先判断资料是否足够。
2. 再按 {分类 / 检索 / 分析 / 生成 / 检查} 顺序处理。
3. 输出前检查边界和格式。

## 6. 边界
- 不能泄露 API Key、密码、后台链接、客户隐私。
- 不能编造价格、库存、认证、法律结论、医疗建议。
- 遇到 {高风险情况} 时标记“需人工确认”。

## 7. 输出格式
请按下面格式输出:
- 结论:一句话
- 处理结果:分点列出
- 需确认:列出不确定信息
- 下一步:告诉我该复制、点击或检查什么

## 8. 验收标准
同类输入测试 3 条,输出格式一致;资料不足会追问;高风险内容会转人工;没有编造来源。

仍然不行怎么办

  • 团队对模板有分歧就先用最小版本,跑两周再加字段,不要一开始做成超长说明书。
  • 模型不稳定时先加示例输入输出,再加边界,不要只堆更多形容词。
  • 模型不接受 JSON 输出就降级到 Markdown 表格;先稳定,再自动化。
  • 如果任务每天都变、资料不固定、结果没人验收,就先别做 Agent,先把流程写清楚。
  • 如果涉及钱、法律、医疗、账号、安全、客户承诺,必须加人工确认。

小白先准备什么

  1. 先写 3 条真实输入和 3 条理想输出,别只写抽象目标。例子越真实,Agent 越容易学会你的口吻。
  2. 把 Agent 不能做的事情写出来,例如不能承诺退款、不能编造库存、不能泄露内部价格。
  3. 确定输出格式:普通文本、表格、JSON、飞书消息、客服话术。
  4. 准备一个失败处理句式,让 Agent 不确定时知道怎么问用户或转人工。
  5. 确定验收人:谁来判断输出能不能用,是你、客服、运营、老板还是客户。

坏提示词改成好提示词

小白最常见的问题是只写愿望,不写任务。下面这个改写方式适合任何 Agent:先把“帮我做”改成“你能看什么、怎么做、不能做什么、输出成什么”。

坏提示词:
帮我做一个闲鱼客服 Agent,回复买家问题,要专业一点。

改成可执行任务卡:
你是闲鱼二手数码客服助手。
目标:根据商品资料和买家问题,生成一条可以直接复制给买家的回复。
可用资料:商品标题、成色、价格、发货地、保修情况、历史 FAQ。
步骤:
1. 判断买家问题属于价格、成色、发货、售后还是其他。
2. 先基于资料回答,不确定的地方写“这个需要我再确认”。
3. 回复语气自然,不要像机器人。
边界:不能承诺最低价,不能承诺平台外交易,不能编造库存和保修。
输出格式:
- 分类:
- 建议回复:
- 需人工确认:
验收标准:连续测试 5 个买家问题,分类准确,回复不编造,格式一致。

三类高频可复制模板

如果不知道从哪里开始,先按场景选一个模板。不要把客服、知识库、项目修改混在同一段 Prompt 里,它们的边界完全不同。

  • 客服类:重点写资料范围、禁用承诺、转人工条件和回复语气。
  • 知识库类:重点写只能引用资料、找不到就说找不到、必须标注来源。
  • 项目修改类:重点写项目路径、允许修改文件、禁止触碰区域、验收命令和部署目标。

模板一:客服 Agent

你是 {平台/业务} 客服助手。

目标:根据客户消息和资料库,输出一条可直接发送的回复。

可用资料:
- 商品/服务资料:{粘贴或说明}
- 常见问题:{粘贴 FAQ}
- 售后规则:{粘贴规则}

处理步骤:
1. 判断客户意图:售前 / 售后 / 价格 / 发货 / 投诉 / 技术问题。
2. 只基于资料回答;资料不足先追问。
3. 回复要简短、礼貌、像真人。
4. 涉及退款、赔偿、价格、库存、法律责任时标记需人工确认。

输出格式:
分类:
建议回复:
需人工确认:
内部备注:

禁止:不要编造承诺,不要引导站外交易,不要泄露内部信息。

模板二:知识库问答 Agent

你是知识库问答助手。

目标:根据给定资料回答用户问题,并标注来源。

可用资料:
{粘贴文档片段、网页摘要、FAQ 或检索结果}

规则:
1. 只能使用资料里的信息回答。
2. 找不到答案时,说“资料里没有明确说明”,并列出需要补充的资料。
3. 每个关键结论后标注来源,例如 [文件名 / 章节]。
4. 不要把猜测写成事实。

输出格式:
一句话答案:
详细说明:
引用来源:
还需要补充:

验收:用 5 个真实问题测试,至少 4 个能正确引用资料;找不到的问题不能编。

模板三:让 Codex / Claude Code 改项目

你现在负责修改一个本地项目。

项目路径:{绝对路径}
目标用户:{谁会用这个项目}
本轮目标:{要新增/修复/优化什么}

请按顺序做:
1. 先检查项目结构、技术栈、路由、数据源和构建脚本。
2. 找到最小改动位置,不要重构无关文件。
3. 修改前说明要改哪些文件。
4. 修改后运行:{npm run build / npm test / 其他命令}。
5. 验证目标页面或功能真的可用。

禁止触碰:
- {不准改的目录或服务}
- {不要部署的项目}
- 不要打印 token、API Key、密码。

完成后输出:
- 改了哪些文件
- 新增/修改了哪些路由或功能
- build/test 是否通过
- 还有哪些风险或后续补充

验收标准

  • 同一类任务换 5 个不同输入,输出格式仍然稳定。
  • 遇到资料不足时会追问或转人工,而不是编答案。
  • 团队成员能看懂模板的每一栏,不需要懂代码。
  • 模板可以被复制到 Claude Code、Codex、OpenClaw、Cursor 等不同工具里微调使用。
  • 高风险字段有保护:价格、库存、认证、账号、密钥、隐私、法律和医疗建议不能自动承诺。
  • 每次修改模板后保留旧版本,避免越改越乱。

5 条测试样例怎么做

OpenAI 和 Anthropic 的文档都强调:提示词要配合示例和评估。小白不需要复杂平台,先用表格测试就够了。

| 编号 | 测试输入 | 理想输出 | 是否通过 | 问题 |
| --- | --- | --- | --- | --- |
| 1 | 正常问题 | 格式正确,能回答 | 通过/失败 |  |
| 2 | 资料缺失 | 会追问,不编造 | 通过/失败 |  |
| 3 | 高风险请求 | 标记需人工确认 | 通过/失败 |  |
| 4 | 用户语气很差 | 保持礼貌,不吵架 | 通过/失败 |  |
| 5 | 超长输入 | 先总结再处理 | 通过/失败 |  |

不同工具里怎么写

  • 普通 ChatGPT / Claude 对话:把任务卡直接粘贴进去,适合一次性处理。
  • Codex:适合改代码和长任务,把项目路径、禁止触碰区域、验收命令写清楚。
  • Claude Code:适合项目理解、文案和代码协作,把完成条件写进提示词或 CLAUDE.md,并用 /help 确认可用命令。
  • OpenClaw:适合把提示词变成工作流节点,输入、输出和失败处理要比普通聊天更固定。
  • Skill.md:适合长期复用的能力说明,把触发条件、步骤、工具、安全边界写成文件。

Reddit 实战复盘提炼

我翻了 ClaudeAI、ClaudeCode、ChatGPTCoding 里多篇真实工作流复盘,里面最有用的不是某一句神奇提示词,而是过程纪律:先计划、分步做、每步验证、结束复盘、把经验沉淀到记忆或 Skill。

  • 复杂任务先进入计划模式:先让 Agent 解释要怎么做、会改哪些文件、怎么验收,再允许执行。
  • 一次只让它做第一步:不要直接说“实现整个功能”,而是“先完成第 1 步,完成后停下让我检查”。
  • 每一阶段都要预览或验证:网页要打开看,代码要跑 build/test,客服话术要用真实问题试。
  • 不要盲信 Agent 的完成声明:它说“已经修好”不算数,必须有命令输出、页面截图、线上 HTTP 状态或人工检查。
  • 长项目要有外部记忆:CLAUDE.md、AGENTS.md、MEMORY.md、ADR、worklog 或 Obsidian 都可以,关键是下次能接上。
  • 每次结束做 retro:问它这次学到了什么、哪里犯错、下次哪些规则应该写进模板或 Skill。
  • 如果连续两次重复同一个错误,就不要继续硬聊:保存当前状态,重开会话,用更干净的任务卡重新开始。

小白可照抄的 6 步过程

这套流程适合写文章、做 Demo、改静态站、搭 Agent、排错。它把 Reddit 上反复提到的 plan、step、verify、retro 变成小白可执行步骤。

  1. 交代背景:项目路径、目标用户、当前问题、不能触碰的地方。
  2. 让 Agent 先出计划:文件范围、步骤、风险、验收命令,不要立刻改。
  3. 只批准第一步:让它完成一个小块,完成后停下汇报。
  4. 人工或命令验证:看页面、跑 build/test、检查日志、用真实输入测试。
  5. 再批准下一步:每一步都保留可回退的边界,不要一次性大改。
  6. 结束复盘:让 Agent 写本次学到的规则、踩坑点、下次提示词改法。

会话结束复盘提示词

把这段放在每次做完之后,尤其适合 Claude Code、Codex、OpenClaw 工作流。复盘不是写总结给自己看,而是为了让下一次提示词更短、更稳。

请对本次会话做一次复盘,不要继续改文件。

请按下面格式输出:

## 1. 本次真正完成了什么
- 列出已完成事项,附上文件、路由、命令或验证方式。

## 2. 哪些地方差点跑偏
- 哪些需求理解不清?
- 哪些地方你做了假设?
- 哪些操作如果没有人工检查可能出问题?

## 3. 下次提示词应该怎么改
- 给我 3-5 条更稳的提示词规则。
- 哪些规则应该写进 AGENTS.md / CLAUDE.md / Skill.md?

## 4. 可复用经验
- 哪些命令、路径、流程、排错方法下次还会用?
- 哪些信息应该保存到记忆或项目文档?

## 5. 下次第一步
- 如果继续做,下一轮只建议一个最小可执行步骤。

防止 Agent 自信胡说的检查清单

  • 让它引用证据:文件路径、行号、命令输出、页面链接、HTTP 状态、构建结果。
  • 让它区分“已验证”和“推测”:没跑过的测试不能写成通过。
  • 让它先读现状:不要让 Agent 只靠记忆猜项目结构。
  • 让它列出不确定项:资料缺失、权限不足、外链读不到都要明说。
  • 重要改动前先问范围:哪些文件会改,哪些服务不会碰。
  • 上线前至少查 3 件事:build 结果、目标路由 HTML、线上页面关键词。
  • 涉及钱、账号、法律、医疗、客户承诺时,默认转人工。

什么时候该重开会话

Reddit 复盘里有个很实用的提醒:上下文污染后,继续追问可能越修越乱。小白可以按下面信号判断是否该停。

  • Agent 连续两次用相同办法修同一个问题,但都失败。
  • 它开始频繁道歉,却没有新的证据或新排查路径。
  • 它把旧需求和新需求混在一起,开始改错页面或错项目。
  • 它已经忘了禁止触碰区域、部署目标或核心模型名。
  • 上下文太长,回答开始变慢、变泛、重复总结不行动。
  • 这时做法:保存当前状态、写 5 行现状摘要、重开会话并只给下一步。

把帖子经验变成自己的 SOP

如果你在 Reddit、X、GitHub 看到一个好工作流,不要只收藏链接。让 Agent 把它变成你的项目规则、检查清单和可复制模板。

请把下面这篇经验帖整理成我自己的 Agent 工作流 SOP。

原帖链接:{粘贴 Reddit / X / GitHub 链接}
我的场景:{静态站更新 / 客服 Agent / 知识库 / 外贸工作流 / 代码项目}
我的工具:{Codex / Claude Code / OpenClaw / Cursor / OpenCode}

请输出:
1. 原帖真正有用的过程,不要摘抄废话。
2. 适合我场景的 5 条规则。
3. 一段可直接复制给 Agent 的任务卡。
4. 一段会话结束复盘提示词。
5. 哪些规则应该写进 Skill.md、AGENTS.md、CLAUDE.md 或 Obsidian。

模板怎么长期维护

  1. 给模板起版本号,例如 customer-service-agent-v1。
  2. 每次只改一个问题:格式不稳就改输出格式,编造就改资料和边界,不要全部重写。
  3. 保留 5 条测试样例,修改后重新跑一遍。
  4. 记录修改原因,例如“新增退款转人工规则”。
  5. 稳定后再沉淀为 Skill、OpenClaw 节点或团队 SOP。

模型差异提醒

  • GPT 类模型通常更吃明确规则:资料、逻辑、格式、禁止项写清楚会更稳。
  • 推理模型不一定需要“请一步步思考”这种话,直接给目标、约束和验收条件更干净。
  • Claude 更适合用清晰上下文、示例和结构标签控制输出;想要某种格式,就把格式本身写得像最终输出。
  • 不管用哪个模型,真正稳定的办法都是:示例 + 边界 + 验收,而不是堆形容词。

模板优化提示词

下面是我的 Agent 任务说明,请帮我做一次 Prompt 体检。

【角色】___
【目标】___
【背景】___
【可用资料】___
【执行步骤】___
【边界】___
【输出格式】___
【示例输入输出】___
【验收标准】___

请你输出:
1. 最容易让 Agent 跑偏的 5 个点。
2. 哪些边界没写清楚。
3. 输出格式是否适合自动化。
4. 是否缺少示例输入输出。
5. 是否有安全风险,例如 Key、隐私、价格、法律承诺。
6. 给我一版更稳的小白可复制版本。

常见误区和不适合场景

  • 误区一:只写“你是专家”,不写具体目标和输出格式。
  • 误区二:不给示例。示例比长篇规则更能稳定风格。
  • 误区三:不写边界。客服、报价、法务、财务类 Agent 尤其要写禁止事项。
  • 误区四:把所有任务塞进一个万能 Prompt,最后每个场景都不稳定。
  • 误区五:只看一次回答好不好,不用多条真实样例测试。
  • 不适合:需求每天变、没有固定输入输出、也没有人愿意验收的任务。

相关问题

还卡着?

可以把截图、日志、需求单或当前页面链接发到 zhemuy@gmail.com。