OpenClaw 教程 · 进阶

OpenClaw 知识库怎么挂载和切片

知识库不是越多文件越好,资料分类、切片、覆盖测试三步缺一不可。

  • OpenClaw
  • 知识库
  • RAG
更新于 2026-05-17

一句话结论

把资料按主题切到 800-1500 字,再用 10 个真实问答验证检索率,再放量。

适用场景

  • 想用 OpenClaw 做客服或内训问答
  • 已经上传了文件但回答经常驴唇不对马嘴
  • 想搞清楚到底要切多大、切多少层

常见现象

  • Agent 回答时引用了无关段落
  • 把同一份资料反复检索,回答仍然空泛
  • 命中率忽高忽低、像撞运气

原因解释

  • 切片粒度太大,模型吞不下完整段落
  • 没有按主题分目录,检索把不相关段落混进来
  • Prompt 没要求引用原文,模型自由发挥

解决步骤

  1. 把资料按业务主题分目录:商品 / FAQ / 政策 / 技术
  2. 每段切到 800-1500 字,标题、章节、正文分开写
  3. 上传后做 10 个真实问答测试,看引用是否来源正确
  4. Prompt 里加上必须引用 [文件名 · 章节] 的要求
  5. 上线前再补 5 个反例(资料里没有的内容),看是否会编造

仍然不行怎么办

  • 命中率始终偏低就缩小检索范围 / 提高 top-k,或者改用更大向量模型
  • 回答会编造就在 Prompt 里强制 fallback:不知道就说不知道

小白先准备什么

  1. 先选 10-30 份最常被问到的资料,不要一上来把整个硬盘都塞进去。
  2. 把 PDF、Word、网页内容尽量转成可复制文字,文件名写清楚版本和日期。
  3. 准备 10 个真实问题,用来测试知识库能不能答到点上。
  4. 提前决定回答格式:是否必须引用来源、是否允许猜测、不会时怎么转人工。

验收标准

  • 用 10 个真实问题测试,至少 8 个回答能命中正确资料。
  • 回答里能说出信息来自哪份资料,而不是只给一句泛泛总结。
  • 问资料里没有的问题时,Agent 会明确说资料里没有,而不是编答案。
  • 新增或替换资料后,有固定的更新流程和回归测试清单。

可复制提示词

你是知识库问答助手。只允许根据我提供的资料回答。

回答规则:
1. 先给一句话结论。
2. 再列 3-5 条步骤或依据。
3. 每条关键结论后标注来自哪份资料。
4. 如果资料里没有答案,直接说“资料里没有找到”,并告诉用户还需要补充什么资料。
5. 不要编造价格、链接、政策、时间。

常见误区和不适合场景

  • 误区一:资料越多越好。小白项目优先用高频、干净、最新版资料。
  • 误区二:只测能答的问题。必须测试资料里没有的问题,防止胡编。
  • 误区三:所有资料混在一个库里。产品说明、客服话术、内部流程最好分库或分标签。
  • 不适合:资料本身还没定稿、经常当天改当天用,又没有版本管理的场景。

相关问题

还卡着?

可以把截图、日志、需求单或当前页面链接发到 zhemuy@gmail.com。