企业级智慧问答系统——从传统人工答疑,升级为可持续演进的智能知识服务体系
围绕财务、合规等中后台高频咨询场景,基于 RAG 与大模型能力重构企业内部知识服务:从“搜索不到、答不完整、依赖专家人工回复”出发,逐步建设自然语言问答、多模态检索、专家反馈闭环,并进一步向可执行业务 Agent 演进。
项目背景判断
我的核心职责
1. 背景与痛点:传统搜索无法解决长文档、复杂规则与专家负担问题
项目最核心的问题,不是“有没有知识”,而是“员工无法高效、准确地获得知识”。
业务侧痛点
财务和合规部门每天需要处理大量重复咨询,专家时间被标准问题持续占用,内部服务响应效率受限。
传统检索局限
内部制度文档篇幅长、逻辑链复杂,且包含表格、截图和流程说明,关键词检索容易只命中局部,答案不完整。
建设机会
通过 RAG 与大模型,把“搜索文档”升级为“自然语言问答 + 结构化知识服务 + 业务流程引导”的新形态。
2. 建设目标:重构内部知识服务,而不是只做一个问答工具
系统建设目标并不止于“回答问题”,而是逐步形成可持续沉淀、可持续优化、可延展到业务执行的企业级知识服务体系。
验证可行性
先用基础 RAG 架构打通“文档解析—检索召回—LLM 回答”的完整闭环。
提升效果与效率
通过“小模型召回 + 大模型推理”的协同方式,解决长文档和复杂逻辑问题,兼顾准确率与成本。
形成持续优化机制
沉淀错题集与人工修正结果,把高频未命中问题转化为高质量知识,不断优化系统表现。
向业务 Agent 演进
后续进一步打通业务系统接口,让系统从“规则查询”延伸到“流程引导与任务执行”。
3. 三阶段迭代路径:从问答闭环,到复杂推理,再到业务 Agent
我在产品策略上设计了清晰的三阶段演进路线,保证项目既能快速落地,又能持续升级。
阶段一:V1
目标:快速打通问答闭环,验证项目可行性。
- 选择财务和合规高频文档作为试点。
- 实现文档解析、向量检索、知识召回和大模型生成回答。
- 先验证“能不能答、有没有价值”。
阶段二:V2
目标:解决长文档与复杂逻辑,提高效果并降低推理成本。
- 设计“小模型召回 + 大模型推理”的协同方案。
- 先用检索模型进行高效召回和初筛,再由大模型综合多个知识片段给出结构化回答。
- 在标准化场景中,推理成本和响应时间约下降 50%。
阶段三:V3
目标:从问答工具升级为业务 Agent。
- 用户最终并不只是想“知道规则”,而是希望“完成任务”。
- 规划打通财务系统接口,让系统从信息查询延展到流程引导和任务执行。
- 例如查询报销规则后,可直接进入报销流程发起。
4. 核心能力建设:多模态检索 + 专家反馈闭环
为了让系统不仅“能回答”,而且“答得更完整、更稳定、更贴近实际工作”,我重点推进了两类能力建设。
1)多模态检索能力
- 针对制度文档中大量表格、截图、流程图和操作说明,设计图文关联检索策略。
- 系统不仅可以回答“规则是什么”,还能返回“操作路径 + 相关截图”。
- 相比纯文本检索,更适合金融机构内部制度类知识服务场景。
2)专家反馈闭环
- 建立“错题集 + 人工修正”机制,对错误答案和高频未命中问题进行沉淀。
- 把专家修正结果持续回灌为高质量知识,更新知识库与错题集。
- 使系统不只是一次性上线,而是具备持续学习和优化能力。
文档解析
支持长文档、规则条款、制度附件、表格与截图等复杂文档结构。
知识召回
面向内部制度知识库进行语义检索、候选文档回溯与多轮筛选。
结构化回答
基于多个知识片段做整合回答,并输出更适合内部服务使用的结构化结果。
持续优化
通过错题集、高频未命中问题、人工反馈修正,持续提升系统准确率。
5. V2 具体实现逻辑:先高效召回,再精细筛选,最后按上下文容量组织回答
V2 是这个项目中最关键的一次升级。它本质上解决的是:候选知识太多、文档太长、上下文有限、但答案又必须完整准确的问题。
错题集优先召回
用户提问后,先在错题集向量数据库中检索最相关的 Top 1 结果。
- 若检索到有效答案,则直接由 LLM 输出答案。
- 优先利用历史纠错成果,提高常见问题命中率。
知识库粗筛与文档获取
若错题集未命中,则进入财务知识库向量数据库,检索 Top 10 相关文本片段。
- 根据片段回溯定位原始文档。
- 形成第一轮候选文档集。
文档相关度精筛
使用 LLM(14B)对候选文档集进行相关度判断和评分。
- 按文档维度排序,而不是只看零散 chunk。
- 筛选出第二轮高相关候选文档集。
上下文容量判断
检查第二轮候选文档集总长度,判断是否超过目标 LLM(72B)的 32K 上下文窗口限制。
- 若 ≤ 32K,则直接把候选文档输入 72B 模型生成答案。
- 若超限,则进入下一步做上下文裁剪与分块注入。
上下文超限处理
当文档总长超过 32K 时,按“全文区 + 片段区”进行分块注入。
- 优先按得分从高到低注入完整高分文档。
- 对剩余文档,用 14B 模型抽取与问题最相关片段。
- 最终将全文区 + 片段区组合后交给 72B 模型生成答案。
6. 企业级智慧问答系统流程图:把背景、迭代路径、能力建设、V2 逻辑和业务结果串成完整闭环
这张图适合在汇报时作为总览图使用,既能讲清楚为什么做、怎么做,也能清晰展示 V2 的具体实现逻辑与业务效果。
7. 业务成效:准确率、覆盖范围和使用规模都实现了明确提升
系统已经在真实业务场景中落地,开始替代部分重复人工答疑工作,并提升了内部知识服务效率。
服务效率提升
重复标准问题可由系统直接处理,减少专家在低复杂度咨询上的时间消耗,让人力更多投入高价值问题。
知识服务升级
从“被动搜索”升级为“自然语言问答”,并通过反馈闭环把专家经验持续沉淀为组织知识资产。
后续扩展空间
系统已经具备向流程引导和业务执行扩展的基础,为后续 V3 业务 Agent 形态提供了明确路径。
8. 项目价值与我的贡献:从智能问答,到企业知识服务体系升级
我认为这个项目的价值,不只是把“搜索”换成“问答”,而是把企业知识服务体系从被动、分散、依赖专家,升级为可持续沉淀和可持续优化的智能服务体系。
项目价值总结
该项目把企业知识服务从传统人工答疑和被动检索,升级为自然语言问答、专家知识沉淀和业务流程执行相结合的智能服务体系。它既提升了内部服务效率,也让高质量制度知识开始以更可复用的方式沉淀下来。
我重点负责的内容
- 主导项目策略设计,明确以财务、合规高频咨询为突破口。
- 设计 V1 / V2 / V3 三阶段迭代路径,保证项目从验证可行性到持续升级有清晰路线。
- 重点推进 V2 方案,设计“小模型召回 + 大模型推理”的协同机制与上下文分块注入逻辑。
- 推动多模态检索与专家反馈闭环能力建设,提升制度类复杂文档场景下的回答质量。
- 围绕问答准确率、覆盖范围、月活与人工替代效果建立业务效果衡量指标。
我认为最值得强调的能力
- 不是只会做一个 RAG Demo,而是能根据实际场景设计清晰的产品演进路径。
- 能把模型能力、检索策略、上下文组织方式和专家反馈机制结合起来,形成真正可落地的方案。
- 能从“知识问答”继续延展到“业务 Agent”,把产品价值从回答问题进一步扩展到支撑任务执行。