OpenClaw 教程 · 进阶

OpenClaw 知识库怎么挂载和切片

知识库不是越多文件越好，资料分类、切片、覆盖测试三步缺一不可。

OpenClaw
知识库
RAG

更新于 2026-05-17

一句话结论

把资料按主题切到 800-1500 字，再用 10 个真实问答验证检索率，再放量。

适用场景

想用 OpenClaw 做客服或内训问答
已经上传了文件但回答经常驴唇不对马嘴
想搞清楚到底要切多大、切多少层

常见现象

Agent 回答时引用了无关段落
把同一份资料反复检索，回答仍然空泛
命中率忽高忽低、像撞运气

原因解释

切片粒度太大，模型吞不下完整段落
没有按主题分目录，检索把不相关段落混进来
Prompt 没要求引用原文，模型自由发挥

解决步骤

把资料按业务主题分目录：商品 / FAQ / 政策 / 技术
每段切到 800-1500 字，标题、章节、正文分开写
上传后做 10 个真实问答测试，看引用是否来源正确
Prompt 里加上必须引用 [文件名 · 章节] 的要求
上线前再补 5 个反例（资料里没有的内容），看是否会编造

仍然不行怎么办

命中率始终偏低就缩小检索范围 / 提高 top-k，或者改用更大向量模型
回答会编造就在 Prompt 里强制 fallback：不知道就说不知道

小白先准备什么

先选 10-30 份最常被问到的资料，不要一上来把整个硬盘都塞进去。
把 PDF、Word、网页内容尽量转成可复制文字，文件名写清楚版本和日期。
准备 10 个真实问题，用来测试知识库能不能答到点上。
提前决定回答格式：是否必须引用来源、是否允许猜测、不会时怎么转人工。

验收标准

用 10 个真实问题测试，至少 8 个回答能命中正确资料。
回答里能说出信息来自哪份资料，而不是只给一句泛泛总结。
问资料里没有的问题时，Agent 会明确说资料里没有，而不是编答案。
新增或替换资料后，有固定的更新流程和回归测试清单。

可复制提示词

你是知识库问答助手。只允许根据我提供的资料回答。

回答规则：
1. 先给一句话结论。
2. 再列 3-5 条步骤或依据。
3. 每条关键结论后标注来自哪份资料。
4. 如果资料里没有答案，直接说“资料里没有找到”，并告诉用户还需要补充什么资料。
5. 不要编造价格、链接、政策、时间。

常见误区和不适合场景

误区一：资料越多越好。小白项目优先用高频、干净、最新版资料。
误区二：只测能答的问题。必须测试资料里没有的问题，防止胡编。
误区三：所有资料混在一个库里。产品说明、客服话术、内部流程最好分库或分标签。
不适合：资料本身还没定稿、经常当天改当天用，又没有版本管理的场景。

相关问题

还卡着？

可以把截图、日志、需求单或当前页面链接发到 zhemuy@gmail.com。