项目二 · RAG / 内部知识服务

企业级智慧问答系统——从传统人工答疑,升级为可持续演进的智能知识服务体系

围绕财务、合规等中后台高频咨询场景,基于 RAG 与大模型能力重构企业内部知识服务:从“搜索不到、答不完整、依赖专家人工回复”出发,逐步建设自然语言问答、多模态检索、专家反馈闭环,并进一步向可执行业务 Agent 演进。

项目背景判断

👉 财务、合规部门每天要处理大量重复咨询,例如报销标准、制度口径、流程材料、合规要求等。问题本身不一定复杂,但制度文档分散、规则细节多,员工很难快速找到准确答案。
👉 传统关键词检索在金融机构内部制度场景下效果有限:文档篇幅长、逻辑链复杂,还包含大量 表格、截图、流程说明,容易只命中局部内容,无法形成完整答案。
👉 因此需要把企业知识服务从“人工答疑 + 被动搜索”,升级为 自然语言问答 + 知识沉淀 + 业务流程执行 结合的智能服务体系。

我的核心职责

产品策略设计
三阶段迭代规划
RAG 能力建设
多模态检索
V2 方案设计
反馈闭环优化

1. 背景与痛点:传统搜索无法解决长文档、复杂规则与专家负担问题

项目最核心的问题,不是“有没有知识”,而是“员工无法高效、准确地获得知识”。

高频咨询 + 文档复杂 + 人工负担重

业务侧痛点

财务和合规部门每天需要处理大量重复咨询,专家时间被标准问题持续占用,内部服务响应效率受限。

传统检索局限

内部制度文档篇幅长、逻辑链复杂,且包含表格、截图和流程说明,关键词检索容易只命中局部,答案不完整。

建设机会

通过 RAG 与大模型,把“搜索文档”升级为“自然语言问答 + 结构化知识服务 + 业务流程引导”的新形态。

2. 建设目标:重构内部知识服务,而不是只做一个问答工具

系统建设目标并不止于“回答问题”,而是逐步形成可持续沉淀、可持续优化、可延展到业务执行的企业级知识服务体系。

问答效率 + 知识沉淀 + 业务执行

验证可行性

先用基础 RAG 架构打通“文档解析—检索召回—LLM 回答”的完整闭环。

提升效果与效率

通过“小模型召回 + 大模型推理”的协同方式,解决长文档和复杂逻辑问题,兼顾准确率与成本。

形成持续优化机制

沉淀错题集与人工修正结果,把高频未命中问题转化为高质量知识,不断优化系统表现。

向业务 Agent 演进

后续进一步打通业务系统接口,让系统从“规则查询”延伸到“流程引导与任务执行”。

3. 三阶段迭代路径:从问答闭环,到复杂推理,再到业务 Agent

我在产品策略上设计了清晰的三阶段演进路线,保证项目既能快速落地,又能持续升级。

V1 → V2 → V3

阶段一:V1

目标:快速打通问答闭环,验证项目可行性。

  • 选择财务和合规高频文档作为试点。
  • 实现文档解析、向量检索、知识召回和大模型生成回答。
  • 先验证“能不能答、有没有价值”。
目标:验证可行性

阶段二:V2

目标:解决长文档与复杂逻辑,提高效果并降低推理成本。

  • 设计“小模型召回 + 大模型推理”的协同方案。
  • 先用检索模型进行高效召回和初筛,再由大模型综合多个知识片段给出结构化回答。
  • 在标准化场景中,推理成本和响应时间约下降 50%
目标:提升效果与效率

阶段三:V3

目标:从问答工具升级为业务 Agent。

  • 用户最终并不只是想“知道规则”,而是希望“完成任务”。
  • 规划打通财务系统接口,让系统从信息查询延展到流程引导和任务执行。
  • 例如查询报销规则后,可直接进入报销流程发起。
目标:可执行的业务服务

4. 核心能力建设:多模态检索 + 专家反馈闭环

为了让系统不仅“能回答”,而且“答得更完整、更稳定、更贴近实际工作”,我重点推进了两类能力建设。

效果提升的关键抓手

1)多模态检索能力

  • 针对制度文档中大量表格、截图、流程图和操作说明,设计图文关联检索策略。
  • 系统不仅可以回答“规则是什么”,还能返回“操作路径 + 相关截图”。
  • 相比纯文本检索,更适合金融机构内部制度类知识服务场景。

2)专家反馈闭环

  • 建立“错题集 + 人工修正”机制,对错误答案和高频未命中问题进行沉淀。
  • 把专家修正结果持续回灌为高质量知识,更新知识库与错题集。
  • 使系统不只是一次性上线,而是具备持续学习和优化能力。

文档解析

支持长文档、规则条款、制度附件、表格与截图等复杂文档结构。

知识召回

面向内部制度知识库进行语义检索、候选文档回溯与多轮筛选。

结构化回答

基于多个知识片段做整合回答,并输出更适合内部服务使用的结构化结果。

持续优化

通过错题集、高频未命中问题、人工反馈修正,持续提升系统准确率。

5. V2 具体实现逻辑:先高效召回,再精细筛选,最后按上下文容量组织回答

V2 是这个项目中最关键的一次升级。它本质上解决的是:候选知识太多、文档太长、上下文有限、但答案又必须完整准确的问题。

小模型召回 + 大模型推理
1

错题集优先召回

用户提问后,先在错题集向量数据库中检索最相关的 Top 1 结果。

  • 若检索到有效答案,则直接由 LLM 输出答案。
  • 优先利用历史纠错成果,提高常见问题命中率。
价值:优先复用高质量已修正知识,减少重复推理。
2

知识库粗筛与文档获取

若错题集未命中,则进入财务知识库向量数据库,检索 Top 10 相关文本片段。

  • 根据片段回溯定位原始文档。
  • 形成第一轮候选文档集。
价值:先粗筛,再回溯原文,兼顾召回效率与文档完整性。
3

文档相关度精筛

使用 LLM(14B)对候选文档集进行相关度判断和评分。

  • 按文档维度排序,而不是只看零散 chunk。
  • 筛选出第二轮高相关候选文档集。
价值:从“片段级命中”升级为“文档级判断”,减少答案断裂。
4

上下文容量判断

检查第二轮候选文档集总长度,判断是否超过目标 LLM(72B)的 32K 上下文窗口限制。

  • 若 ≤ 32K,则直接把候选文档输入 72B 模型生成答案。
  • 若超限,则进入下一步做上下文裁剪与分块注入。
价值:把“能不能塞下”纳入明确决策逻辑,避免粗暴截断。
5

上下文超限处理

当文档总长超过 32K 时,按“全文区 + 片段区”进行分块注入。

  • 优先按得分从高到低注入完整高分文档。
  • 对剩余文档,用 14B 模型抽取与问题最相关片段。
  • 最终将全文区 + 片段区组合后交给 72B 模型生成答案。
价值:在有限上下文中尽量保留完整逻辑链,提高复杂问题回答质量。

6. 企业级智慧问答系统流程图:把背景、迭代路径、能力建设、V2 逻辑和业务结果串成完整闭环

这张图适合在汇报时作为总览图使用,既能讲清楚为什么做、怎么做,也能清晰展示 V2 的具体实现逻辑与业务效果。

项目总览流程图

🧭 企业级智慧问答系统流程图

图中从业务背景与目标、三阶段迭代路线、核心能力建设、V2 具体实现逻辑,到业务效果做了完整串联,非常适合作为项目汇报时的主图使用。

总览 + 实现逻辑 + 结果
提示:图片支持横向滚动查看;点击图片可在新标签页打开高清大图,适合在汇报中放大展示。
展示重点 可重点讲解四块内容:为什么传统检索不够用、V1/V2/V3 如何演进、多模态与反馈闭环如何提升效果、以及 V2 具体逻辑如何在有限上下文内组织回答。
项目价值 这张图能够很好说明:该项目不是简单的“问答机器人”,而是围绕企业知识服务效率、知识沉淀机制和业务执行延展能力建设的智能服务体系。

7. 业务成效:准确率、覆盖范围和使用规模都实现了明确提升

系统已经在真实业务场景中落地,开始替代部分重复人工答疑工作,并提升了内部知识服务效率。

结果可量化
85%+
问答准确率
27
覆盖分支机构数量
总部
总部及核心部门覆盖
1400+
月活用户
≈30%
重复答疑工作量下降

服务效率提升

重复标准问题可由系统直接处理,减少专家在低复杂度咨询上的时间消耗,让人力更多投入高价值问题。

知识服务升级

从“被动搜索”升级为“自然语言问答”,并通过反馈闭环把专家经验持续沉淀为组织知识资产。

后续扩展空间

系统已经具备向流程引导和业务执行扩展的基础,为后续 V3 业务 Agent 形态提供了明确路径。

8. 项目价值与我的贡献:从智能问答,到企业知识服务体系升级

我认为这个项目的价值,不只是把“搜索”换成“问答”,而是把企业知识服务体系从被动、分散、依赖专家,升级为可持续沉淀和可持续优化的智能服务体系。

价值总结 + 个人贡献

项目价值总结

该项目把企业知识服务从传统人工答疑和被动检索,升级为自然语言问答、专家知识沉淀和业务流程执行相结合的智能服务体系。它既提升了内部服务效率,也让高质量制度知识开始以更可复用的方式沉淀下来。

我重点负责的内容

  • 主导项目策略设计,明确以财务、合规高频咨询为突破口。
  • 设计 V1 / V2 / V3 三阶段迭代路径,保证项目从验证可行性到持续升级有清晰路线。
  • 重点推进 V2 方案,设计“小模型召回 + 大模型推理”的协同机制与上下文分块注入逻辑。
  • 推动多模态检索与专家反馈闭环能力建设,提升制度类复杂文档场景下的回答质量。
  • 围绕问答准确率、覆盖范围、月活与人工替代效果建立业务效果衡量指标。

我认为最值得强调的能力

  • 不是只会做一个 RAG Demo,而是能根据实际场景设计清晰的产品演进路径。
  • 能把模型能力、检索策略、上下文组织方式和专家反馈机制结合起来,形成真正可落地的方案。
  • 能从“知识问答”继续延展到“业务 Agent”,把产品价值从回答问题进一步扩展到支撑任务执行。