工作流模板 · 进阶

Agent 任务说明怎么写才不跑偏

一个能反复用的小白版 Agent 任务模板：把目标、资料、步骤、边界、输出格式、示例和验收标准写成任务卡，再交给 Codex、Claude Code、OpenClaw 或客服 Agent。

Prompt
工作流
模板
Agent 任务卡
验收标准

更新于 2026-06-07

一句话结论

提示词不是咒语，而是一张任务单：目标、资料、规则、步骤、输出、示例、边界和验收标准写清楚，Agent 才不容易跑偏。

适用场景

每次写 Prompt 都要从零开始，换个任务就乱
Agent 经常跑偏、编内容、输出格式不稳定
想把客服、知识库、外贸、闲鱼、项目修改这类任务沉淀成团队模板
想把一句“帮我优化一下”改成 Claude Code / Codex / OpenClaw 能执行的任务说明

常见现象

Prompt 改一次乱一次，同一个需求换个输入就变味
新人接手不知道该提供哪些资料，只会复制一大段话
上线后回答风格不稳定，有时像客服，有时像销售，有时像闲聊
Agent 明明完成了很多动作，但你不知道怎样才算合格
模型不知道什么时候该停、什么时候该追问、什么时候该转人工

原因解释

没有固定结构，靠灵感写，导致每次都漏一块
只写角色，不写目标、资料范围和完成标准
没说清不能做什么，例如不能承诺价格、不能编造库存、不能泄露 Key
没指定输出格式，Agent 就会按自己的习惯自由发挥
没有示例输入输出，也没有用几条真实案例做验收

解决步骤

先写一句话目标：这次到底要解决谁的什么问题，最后交付什么结果。
把资料范围写清楚：Agent 能看哪些资料，不能猜哪些资料。
用八栏模板写任务卡：角色、目标、背景、输入资料、执行步骤、边界、输出格式、验收标准。
至少给 1 条真实输入和 1 条理想输出，让模型知道你要的口吻和格式。
写清失败处理：资料不足就追问，涉及价格 / 法律 / 退款 / 账号 / 密钥就转人工。
用 3-5 条真实样例测试，输出稳定后再放进工作流或 Skill。

可复制命令

# Agent 任务卡

## 1. 角色
你是 {业务场景} 的 {角色}，例如：闲鱼客服助手 / 知识库问答助手 / 外贸询盘助理 / 项目修改助手。

## 2. 目标
帮 {用户或团队} 完成 {具体任务}，最终输出 {交付物}。

## 3. 背景
业务背景：{这个任务为什么重要}
用户水平：{不会代码 / 会一点 / 专业运营}
当前限制：{时间、预算、工具、权限、风险}

## 4. 可用资料
你只能使用以下资料：
- {资料 1}
- {资料 2}
- {资料 3}
资料不足时必须先追问，不能编造。

## 5. 执行步骤
1. 先判断资料是否足够。
2. 再按 {分类 / 检索 / 分析 / 生成 / 检查} 顺序处理。
3. 输出前检查边界和格式。

## 6. 边界
- 不能泄露 API Key、密码、后台链接、客户隐私。
- 不能编造价格、库存、认证、法律结论、医疗建议。
- 遇到 {高风险情况} 时标记“需人工确认”。

## 7. 输出格式
请按下面格式输出：
- 结论：一句话
- 处理结果：分点列出
- 需确认：列出不确定信息
- 下一步：告诉我该复制、点击或检查什么

## 8. 验收标准
同类输入测试 3 条，输出格式一致；资料不足会追问；高风险内容会转人工；没有编造来源。

仍然不行怎么办

团队对模板有分歧就先用最小版本，跑两周再加字段，不要一开始做成超长说明书。
模型不稳定时先加示例输入输出，再加边界，不要只堆更多形容词。
模型不接受 JSON 输出就降级到 Markdown 表格；先稳定，再自动化。
如果任务每天都变、资料不固定、结果没人验收，就先别做 Agent，先把流程写清楚。
如果涉及钱、法律、医疗、账号、安全、客户承诺，必须加人工确认。

小白先准备什么

先写 3 条真实输入和 3 条理想输出，别只写抽象目标。例子越真实，Agent 越容易学会你的口吻。
把 Agent 不能做的事情写出来，例如不能承诺退款、不能编造库存、不能泄露内部价格。
确定输出格式：普通文本、表格、JSON、飞书消息、客服话术。
准备一个失败处理句式，让 Agent 不确定时知道怎么问用户或转人工。
确定验收人：谁来判断输出能不能用，是你、客服、运营、老板还是客户。

坏提示词改成好提示词

小白最常见的问题是只写愿望，不写任务。下面这个改写方式适合任何 Agent：先把“帮我做”改成“你能看什么、怎么做、不能做什么、输出成什么”。

坏提示词：
帮我做一个闲鱼客服 Agent，回复买家问题，要专业一点。

改成可执行任务卡：
你是闲鱼二手数码客服助手。
目标：根据商品资料和买家问题，生成一条可以直接复制给买家的回复。
可用资料：商品标题、成色、价格、发货地、保修情况、历史 FAQ。
步骤：
1. 判断买家问题属于价格、成色、发货、售后还是其他。
2. 先基于资料回答，不确定的地方写“这个需要我再确认”。
3. 回复语气自然，不要像机器人。
边界：不能承诺最低价，不能承诺平台外交易，不能编造库存和保修。
输出格式：
- 分类：
- 建议回复：
- 需人工确认：
验收标准：连续测试 5 个买家问题，分类准确，回复不编造，格式一致。

三类高频可复制模板

如果不知道从哪里开始，先按场景选一个模板。不要把客服、知识库、项目修改混在同一段 Prompt 里，它们的边界完全不同。

客服类：重点写资料范围、禁用承诺、转人工条件和回复语气。
知识库类：重点写只能引用资料、找不到就说找不到、必须标注来源。
项目修改类：重点写项目路径、允许修改文件、禁止触碰区域、验收命令和部署目标。

模板一：客服 Agent

你是 {平台/业务} 客服助手。

目标：根据客户消息和资料库，输出一条可直接发送的回复。

可用资料：
- 商品/服务资料：{粘贴或说明}
- 常见问题：{粘贴 FAQ}
- 售后规则：{粘贴规则}

处理步骤：
1. 判断客户意图：售前 / 售后 / 价格 / 发货 / 投诉 / 技术问题。
2. 只基于资料回答；资料不足先追问。
3. 回复要简短、礼貌、像真人。
4. 涉及退款、赔偿、价格、库存、法律责任时标记需人工确认。

输出格式：
分类：
建议回复：
需人工确认：
内部备注：

禁止：不要编造承诺，不要引导站外交易，不要泄露内部信息。

模板二：知识库问答 Agent

你是知识库问答助手。

目标：根据给定资料回答用户问题，并标注来源。

可用资料：
{粘贴文档片段、网页摘要、FAQ 或检索结果}

规则：
1. 只能使用资料里的信息回答。
2. 找不到答案时，说“资料里没有明确说明”，并列出需要补充的资料。
3. 每个关键结论后标注来源，例如 [文件名 / 章节]。
4. 不要把猜测写成事实。

输出格式：
一句话答案：
详细说明：
引用来源：
还需要补充：

验收：用 5 个真实问题测试，至少 4 个能正确引用资料；找不到的问题不能编。

模板三：让 Codex / Claude Code 改项目

你现在负责修改一个本地项目。

项目路径：{绝对路径}
目标用户：{谁会用这个项目}
本轮目标：{要新增/修复/优化什么}

请按顺序做：
1. 先检查项目结构、技术栈、路由、数据源和构建脚本。
2. 找到最小改动位置，不要重构无关文件。
3. 修改前说明要改哪些文件。
4. 修改后运行：{npm run build / npm test / 其他命令}。
5. 验证目标页面或功能真的可用。

禁止触碰：
- {不准改的目录或服务}
- {不要部署的项目}
- 不要打印 token、API Key、密码。

完成后输出：
- 改了哪些文件
- 新增/修改了哪些路由或功能
- build/test 是否通过
- 还有哪些风险或后续补充

验收标准

同一类任务换 5 个不同输入，输出格式仍然稳定。
遇到资料不足时会追问或转人工，而不是编答案。
团队成员能看懂模板的每一栏，不需要懂代码。
模板可以被复制到 Claude Code、Codex、OpenClaw、Cursor 等不同工具里微调使用。
高风险字段有保护：价格、库存、认证、账号、密钥、隐私、法律和医疗建议不能自动承诺。
每次修改模板后保留旧版本，避免越改越乱。

5 条测试样例怎么做

OpenAI 和 Anthropic 的文档都强调：提示词要配合示例和评估。小白不需要复杂平台，先用表格测试就够了。

| 编号 | 测试输入 | 理想输出 | 是否通过 | 问题 |
| --- | --- | --- | --- | --- |
| 1 | 正常问题 | 格式正确，能回答 | 通过/失败 |  |
| 2 | 资料缺失 | 会追问，不编造 | 通过/失败 |  |
| 3 | 高风险请求 | 标记需人工确认 | 通过/失败 |  |
| 4 | 用户语气很差 | 保持礼貌，不吵架 | 通过/失败 |  |
| 5 | 超长输入 | 先总结再处理 | 通过/失败 |  |

不同工具里怎么写

普通 ChatGPT / Claude 对话：把任务卡直接粘贴进去，适合一次性处理。
Codex：适合改代码和长任务，把项目路径、禁止触碰区域、验收命令写清楚。
Claude Code：适合项目理解、文案和代码协作，把完成条件写进提示词或 CLAUDE.md，并用 /help 确认可用命令。
OpenClaw：适合把提示词变成工作流节点，输入、输出和失败处理要比普通聊天更固定。
Skill.md：适合长期复用的能力说明，把触发条件、步骤、工具、安全边界写成文件。

Reddit 实战复盘提炼

我翻了 ClaudeAI、ClaudeCode、ChatGPTCoding 里多篇真实工作流复盘，里面最有用的不是某一句神奇提示词，而是过程纪律：先计划、分步做、每步验证、结束复盘、把经验沉淀到记忆或 Skill。

复杂任务先进入计划模式：先让 Agent 解释要怎么做、会改哪些文件、怎么验收，再允许执行。
一次只让它做第一步：不要直接说“实现整个功能”，而是“先完成第 1 步，完成后停下让我检查”。
每一阶段都要预览或验证：网页要打开看，代码要跑 build/test，客服话术要用真实问题试。
不要盲信 Agent 的完成声明：它说“已经修好”不算数，必须有命令输出、页面截图、线上 HTTP 状态或人工检查。
长项目要有外部记忆：CLAUDE.md、AGENTS.md、MEMORY.md、ADR、worklog 或 Obsidian 都可以，关键是下次能接上。
每次结束做 retro：问它这次学到了什么、哪里犯错、下次哪些规则应该写进模板或 Skill。
如果连续两次重复同一个错误，就不要继续硬聊：保存当前状态，重开会话，用更干净的任务卡重新开始。

小白可照抄的 6 步过程

这套流程适合写文章、做 Demo、改静态站、搭 Agent、排错。它把 Reddit 上反复提到的 plan、step、verify、retro 变成小白可执行步骤。

交代背景：项目路径、目标用户、当前问题、不能触碰的地方。
让 Agent 先出计划：文件范围、步骤、风险、验收命令，不要立刻改。
只批准第一步：让它完成一个小块，完成后停下汇报。
人工或命令验证：看页面、跑 build/test、检查日志、用真实输入测试。
再批准下一步：每一步都保留可回退的边界，不要一次性大改。
结束复盘：让 Agent 写本次学到的规则、踩坑点、下次提示词改法。

会话结束复盘提示词

把这段放在每次做完之后，尤其适合 Claude Code、Codex、OpenClaw 工作流。复盘不是写总结给自己看，而是为了让下一次提示词更短、更稳。

请对本次会话做一次复盘，不要继续改文件。

请按下面格式输出：

## 1. 本次真正完成了什么
- 列出已完成事项，附上文件、路由、命令或验证方式。

## 2. 哪些地方差点跑偏
- 哪些需求理解不清？
- 哪些地方你做了假设？
- 哪些操作如果没有人工检查可能出问题？

## 3. 下次提示词应该怎么改
- 给我 3-5 条更稳的提示词规则。
- 哪些规则应该写进 AGENTS.md / CLAUDE.md / Skill.md？

## 4. 可复用经验
- 哪些命令、路径、流程、排错方法下次还会用？
- 哪些信息应该保存到记忆或项目文档？

## 5. 下次第一步
- 如果继续做，下一轮只建议一个最小可执行步骤。

防止 Agent 自信胡说的检查清单

让它引用证据：文件路径、行号、命令输出、页面链接、HTTP 状态、构建结果。
让它区分“已验证”和“推测”：没跑过的测试不能写成通过。
让它先读现状：不要让 Agent 只靠记忆猜项目结构。
让它列出不确定项：资料缺失、权限不足、外链读不到都要明说。
重要改动前先问范围：哪些文件会改，哪些服务不会碰。
上线前至少查 3 件事：build 结果、目标路由 HTML、线上页面关键词。
涉及钱、账号、法律、医疗、客户承诺时，默认转人工。

什么时候该重开会话

Reddit 复盘里有个很实用的提醒：上下文污染后，继续追问可能越修越乱。小白可以按下面信号判断是否该停。

Agent 连续两次用相同办法修同一个问题，但都失败。
它开始频繁道歉，却没有新的证据或新排查路径。
它把旧需求和新需求混在一起，开始改错页面或错项目。
它已经忘了禁止触碰区域、部署目标或核心模型名。
上下文太长，回答开始变慢、变泛、重复总结不行动。
这时做法：保存当前状态、写 5 行现状摘要、重开会话并只给下一步。

把帖子经验变成自己的 SOP

如果你在 Reddit、X、GitHub 看到一个好工作流，不要只收藏链接。让 Agent 把它变成你的项目规则、检查清单和可复制模板。

请把下面这篇经验帖整理成我自己的 Agent 工作流 SOP。

原帖链接：{粘贴 Reddit / X / GitHub 链接}
我的场景：{静态站更新 / 客服 Agent / 知识库 / 外贸工作流 / 代码项目}
我的工具：{Codex / Claude Code / OpenClaw / Cursor / OpenCode}

请输出：
1. 原帖真正有用的过程，不要摘抄废话。
2. 适合我场景的 5 条规则。
3. 一段可直接复制给 Agent 的任务卡。
4. 一段会话结束复盘提示词。
5. 哪些规则应该写进 Skill.md、AGENTS.md、CLAUDE.md 或 Obsidian。

模板怎么长期维护

给模板起版本号，例如 customer-service-agent-v1。
每次只改一个问题：格式不稳就改输出格式，编造就改资料和边界，不要全部重写。
保留 5 条测试样例，修改后重新跑一遍。
记录修改原因，例如“新增退款转人工规则”。
稳定后再沉淀为 Skill、OpenClaw 节点或团队 SOP。

模型差异提醒

GPT 类模型通常更吃明确规则：资料、逻辑、格式、禁止项写清楚会更稳。
推理模型不一定需要“请一步步思考”这种话，直接给目标、约束和验收条件更干净。
Claude 更适合用清晰上下文、示例和结构标签控制输出；想要某种格式，就把格式本身写得像最终输出。
不管用哪个模型，真正稳定的办法都是：示例 + 边界 + 验收，而不是堆形容词。

模板优化提示词

下面是我的 Agent 任务说明，请帮我做一次 Prompt 体检。

【角色】___
【目标】___
【背景】___
【可用资料】___
【执行步骤】___
【边界】___
【输出格式】___
【示例输入输出】___
【验收标准】___

请你输出：
1. 最容易让 Agent 跑偏的 5 个点。
2. 哪些边界没写清楚。
3. 输出格式是否适合自动化。
4. 是否缺少示例输入输出。
5. 是否有安全风险，例如 Key、隐私、价格、法律承诺。
6. 给我一版更稳的小白可复制版本。

常见误区和不适合场景

误区一：只写“你是专家”，不写具体目标和输出格式。
误区二：不给示例。示例比长篇规则更能稳定风格。
误区三：不写边界。客服、报价、法务、财务类 Agent 尤其要写禁止事项。
误区四：把所有任务塞进一个万能 Prompt，最后每个场景都不稳定。
误区五：只看一次回答好不好，不用多条真实样例测试。
不适合：需求每天变、没有固定输入输出、也没有人愿意验收的任务。

参考链接

OpenAI Prompt engineering：https://developers.openai.com/api/docs/guides/prompt-engineering
OpenAI Prompting / prompt 管理：https://developers.openai.com/api/docs/guides/prompting
OpenAI reasoning best practices：https://developers.openai.com/api/docs/guides/reasoning-best-practices
Anthropic Claude 提示工程最佳实践：https://platform.claude.com/docs/zh-CN/build-with-claude/prompt-engineering/claude-prompting-best-practices
Reddit：Claude Code workflow tips after 6 months of daily use：https://www.reddit.com/r/ClaudeAI/comments/1sn27yu/claude_code_workflow_tips_after_6_months_of_daily/
Reddit：How I prompt for big projects：https://www.reddit.com/r/ClaudeAI/comments/1s25l72/how_i_prompt_for_big_projects/
Reddit：Self-improvement Loop / wrap-up skill：https://www.reddit.com/r/ClaudeCode/comments/1r89084/selfimprovement_loop_my_favorite_claude_code_skill/
Reddit：Claude Code lying and verification lessons：https://www.reddit.com/r/ClaudeAI/comments/1mzuva7/some_lessons_learned_about_claude_code_and_other/
Reddit：Landing page with Claude Code process：https://www.reddit.com/r/ChatGPTCoding/comments/1mk0b87/i_spent_a_week_building_a_landing_page_with/
Reddit：Full Claude Code setup after daily use：https://www.reddit.com/r/claude/comments/1spef7j/my_full_claude_code_setup_after_months_of_daily/

还卡着？

可以把截图、日志、需求单或当前页面链接发到 zhemuy@gmail.com。