项目二 · RAG / 内部知识服务

企业级智慧问答系统——从传统人工答疑，升级为可持续演进的智能知识服务体系

围绕财务、合规等中后台高频咨询场景，基于 RAG 与大模型能力重构企业内部知识服务：从“搜索不到、答不完整、依赖专家人工回复”出发，逐步建设自然语言问答、多模态检索、专家反馈闭环，并进一步向可执行业务 Agent 演进。

项目背景判断

👉 财务、合规部门每天要处理大量重复咨询，例如报销标准、制度口径、流程材料、合规要求等。问题本身不一定复杂，但制度文档分散、规则细节多，员工很难快速找到准确答案。

👉 传统关键词检索在金融机构内部制度场景下效果有限：文档篇幅长、逻辑链复杂，还包含大量 表格、截图、流程说明，容易只命中局部内容，无法形成完整答案。

👉 因此需要把企业知识服务从“人工答疑 + 被动搜索”，升级为 自然语言问答 + 知识沉淀 + 业务流程执行 结合的智能服务体系。

我的核心职责

产品策略设计

三阶段迭代规划

RAG 能力建设

多模态检索

V2 方案设计

反馈闭环优化

1. 背景与痛点：传统搜索无法解决长文档、复杂规则与专家负担问题

项目最核心的问题，不是“有没有知识”，而是“员工无法高效、准确地获得知识”。

高频咨询 + 文档复杂 + 人工负担重

业务侧痛点

财务和合规部门每天需要处理大量重复咨询，专家时间被标准问题持续占用，内部服务响应效率受限。

→

传统检索局限

内部制度文档篇幅长、逻辑链复杂，且包含表格、截图和流程说明，关键词检索容易只命中局部，答案不完整。

→

建设机会

通过 RAG 与大模型，把“搜索文档”升级为“自然语言问答 + 结构化知识服务 + 业务流程引导”的新形态。

2. 建设目标：重构内部知识服务，而不是只做一个问答工具

系统建设目标并不止于“回答问题”，而是逐步形成可持续沉淀、可持续优化、可延展到业务执行的企业级知识服务体系。

问答效率 + 知识沉淀 + 业务执行

验证可行性

先用基础 RAG 架构打通“文档解析—检索召回—LLM 回答”的完整闭环。

提升效果与效率

通过“小模型召回 + 大模型推理”的协同方式，解决长文档和复杂逻辑问题，兼顾准确率与成本。

形成持续优化机制

沉淀错题集与人工修正结果，把高频未命中问题转化为高质量知识，不断优化系统表现。

向业务 Agent 演进

后续进一步打通业务系统接口，让系统从“规则查询”延伸到“流程引导与任务执行”。

3. 三阶段迭代路径：从问答闭环，到复杂推理，再到业务 Agent

我在产品策略上设计了清晰的三阶段演进路线，保证项目既能快速落地，又能持续升级。

V1 → V2 → V3

阶段一：V1

目标：快速打通问答闭环，验证项目可行性。

选择财务和合规高频文档作为试点。
实现文档解析、向量检索、知识召回和大模型生成回答。
先验证“能不能答、有没有价值”。

目标：验证可行性

阶段二：V2

目标：解决长文档与复杂逻辑，提高效果并降低推理成本。

设计“小模型召回 + 大模型推理”的协同方案。
先用检索模型进行高效召回和初筛，再由大模型综合多个知识片段给出结构化回答。
在标准化场景中，推理成本和响应时间约下降 50%。

目标：提升效果与效率

阶段三：V3

目标：从问答工具升级为业务 Agent。

用户最终并不只是想“知道规则”，而是希望“完成任务”。
规划打通财务系统接口，让系统从信息查询延展到流程引导和任务执行。
例如查询报销规则后，可直接进入报销流程发起。

目标：可执行的业务服务

4. 核心能力建设：多模态检索 + 专家反馈闭环

为了让系统不仅“能回答”，而且“答得更完整、更稳定、更贴近实际工作”，我重点推进了两类能力建设。

效果提升的关键抓手

1）多模态检索能力

针对制度文档中大量表格、截图、流程图和操作说明，设计图文关联检索策略。
系统不仅可以回答“规则是什么”，还能返回“操作路径 + 相关截图”。
相比纯文本检索，更适合金融机构内部制度类知识服务场景。

2）专家反馈闭环

建立“错题集 + 人工修正”机制，对错误答案和高频未命中问题进行沉淀。
把专家修正结果持续回灌为高质量知识，更新知识库与错题集。
使系统不只是一次性上线，而是具备持续学习和优化能力。

文档解析

支持长文档、规则条款、制度附件、表格与截图等复杂文档结构。

知识召回

面向内部制度知识库进行语义检索、候选文档回溯与多轮筛选。

结构化回答

基于多个知识片段做整合回答，并输出更适合内部服务使用的结构化结果。

持续优化

通过错题集、高频未命中问题、人工反馈修正，持续提升系统准确率。

5. V2 具体实现逻辑：先高效召回，再精细筛选，最后按上下文容量组织回答

V2 是这个项目中最关键的一次升级。它本质上解决的是：候选知识太多、文档太长、上下文有限、但答案又必须完整准确的问题。

小模型召回 + 大模型推理

错题集优先召回

用户提问后，先在错题集向量数据库中检索最相关的 Top 1 结果。

若检索到有效答案，则直接由 LLM 输出答案。
优先利用历史纠错成果，提高常见问题命中率。

价值：优先复用高质量已修正知识，减少重复推理。

知识库粗筛与文档获取

若错题集未命中，则进入财务知识库向量数据库，检索 Top 10 相关文本片段。

根据片段回溯定位原始文档。
形成第一轮候选文档集。

价值：先粗筛，再回溯原文，兼顾召回效率与文档完整性。

文档相关度精筛

使用 LLM（14B）对候选文档集进行相关度判断和评分。

按文档维度排序，而不是只看零散 chunk。
筛选出第二轮高相关候选文档集。

价值：从“片段级命中”升级为“文档级判断”，减少答案断裂。

上下文容量判断

检查第二轮候选文档集总长度，判断是否超过目标 LLM（72B）的 32K 上下文窗口限制。

若 ≤ 32K，则直接把候选文档输入 72B 模型生成答案。
若超限，则进入下一步做上下文裁剪与分块注入。

价值：把“能不能塞下”纳入明确决策逻辑，避免粗暴截断。

上下文超限处理

当文档总长超过 32K 时，按“全文区 + 片段区”进行分块注入。

优先按得分从高到低注入完整高分文档。
对剩余文档，用 14B 模型抽取与问题最相关片段。
最终将全文区 + 片段区组合后交给 72B 模型生成答案。

价值：在有限上下文中尽量保留完整逻辑链，提高复杂问题回答质量。

6. 企业级智慧问答系统流程图：把背景、迭代路径、能力建设、V2 逻辑和业务结果串成完整闭环

这张图适合在汇报时作为总览图使用，既能讲清楚为什么做、怎么做，也能清晰展示 V2 的具体实现逻辑与业务效果。

项目总览流程图

🧭 企业级智慧问答系统流程图

图中从业务背景与目标、三阶段迭代路线、核心能力建设、V2 具体实现逻辑，到业务效果做了完整串联，非常适合作为项目汇报时的主图使用。

总览 + 实现逻辑 + 结果

提示：图片支持横向滚动查看；点击图片可在新标签页打开高清大图，适合在汇报中放大展示。

展示重点 可重点讲解四块内容：为什么传统检索不够用、V1/V2/V3 如何演进、多模态与反馈闭环如何提升效果、以及 V2 具体逻辑如何在有限上下文内组织回答。

项目价值 这张图能够很好说明：该项目不是简单的“问答机器人”，而是围绕企业知识服务效率、知识沉淀机制和业务执行延展能力建设的智能服务体系。

7. 业务成效：准确率、覆盖范围和使用规模都实现了明确提升

系统已经在真实业务场景中落地，开始替代部分重复人工答疑工作，并提升了内部知识服务效率。

结果可量化

85%+

问答准确率

覆盖分支机构数量

总部

总部及核心部门覆盖

1400+

月活用户

≈30%

重复答疑工作量下降

服务效率提升

重复标准问题可由系统直接处理，减少专家在低复杂度咨询上的时间消耗，让人力更多投入高价值问题。

知识服务升级

从“被动搜索”升级为“自然语言问答”，并通过反馈闭环把专家经验持续沉淀为组织知识资产。

后续扩展空间

系统已经具备向流程引导和业务执行扩展的基础，为后续 V3 业务 Agent 形态提供了明确路径。

8. 项目价值与我的贡献：从智能问答，到企业知识服务体系升级

我认为这个项目的价值，不只是把“搜索”换成“问答”，而是把企业知识服务体系从被动、分散、依赖专家，升级为可持续沉淀和可持续优化的智能服务体系。

价值总结 + 个人贡献

项目价值总结

该项目把企业知识服务从传统人工答疑和被动检索，升级为自然语言问答、专家知识沉淀和业务流程执行相结合的智能服务体系。它既提升了内部服务效率，也让高质量制度知识开始以更可复用的方式沉淀下来。

我重点负责的内容

主导项目策略设计，明确以财务、合规高频咨询为突破口。
设计 V1 / V2 / V3 三阶段迭代路径，保证项目从验证可行性到持续升级有清晰路线。
重点推进 V2 方案，设计“小模型召回 + 大模型推理”的协同机制与上下文分块注入逻辑。
推动多模态检索与专家反馈闭环能力建设，提升制度类复杂文档场景下的回答质量。
围绕问答准确率、覆盖范围、月活与人工替代效果建立业务效果衡量指标。

我认为最值得强调的能力

不是只会做一个 RAG Demo，而是能根据实际场景设计清晰的产品演进路径。
能把模型能力、检索策略、上下文组织方式和专家反馈机制结合起来，形成真正可落地的方案。
能从“知识问答”继续延展到“业务 Agent”，把产品价值从回答问题进一步扩展到支撑任务执行。