旗舰案例研究
一个 ERP AI 层
为同一家企业级 ERP 客户构建的三套生产级 AI 系统 —— 一个运营 Copilot、一个自助式数据分析智能体与一个知识助手 —— 建立在同一套共享的安全与评测实践之上。各自独立部署,仅在存在真实依赖处彼此打通。
问题
ERP 承载着企业真正赖以运转的数据 —— 库存、订单、供应商、资金。把聊天机器人接上去很容易;难的是构建一个能够对其执行操作、却不会破坏状态或编造数字的系统。发布的门槛很具体:每一次写操作都经过人工审批,每一条分析查询从构造上就是安全的,每一个回答都带有可审计的溯源。
架构
运营 Copilot 是核心。它路由到角色约束的领域专家,并通过 MCP 调用受治理的工具 —— 包括可选的 NL2SQL 数据分析服务。知识助手是同一 ERP AI 层中的兄弟系统,并不由 Copilot 编排。
* 可选 / 只读路径。
工作原理
运营 Copilot
一个运行 DeepAgents 框架的 FastAPI 服务。路由器将每个请求分类到角色约束的专家,专家只拿到它需要的工具 —— 来自静态目录与标签,而非提示词猜测。回答依据捕获的工具追踪,被标注为权威、推导或未经核实。
受治理的工具与审批边界
一个 Spring AI / Java 21 MCP 服务掌管 MySQL 业务数据,并暴露 10 个读工具 + 4 个写工具。审批被刻意设计为非智能体工具:模型可以提出写操作,但执行要经过人工控制的 REST 路径,并绑定到一次性、载荷哈希、带 TTL 的审批。
数据分析智能体(NL2SQL)
面向数仓的自助式分析,由 Copilot 经可选 MCP 抵达。确定性 SQLGlot 护栏(仅 SELECT、范围/扇出校验、自动 LIMIT)与 Qdrant 语义层将提示上下文相较全量 schema 灌入削减约 73%;配有有界 SQL 修复与跨 DuckDB 和 ClickHouse 的结果等价性回归评测。
知识助手(RAG)
一个独立的、由 LangGraph 编排的企业文档 RAG 系统:Milvus 混合检索配合意图路由策略,引用溯源与严格证据拒答,RBAC,以及带查询级可观测性的 LLM 裁判 / 引用评测。
成果与证据
- 提示上下文削减约 73%,得益于 Qdrant 语义层(相较全量 schema 灌入)。
- 确定性 SQLGlot 护栏 —— 仅 SELECT、范围/扇出校验、自动 LIMIT;危险 SQL 在抵达数仓前即被拦截。
- 一次性、密码学绑定的审批用于每一次写操作 —— 执行前校验执行者/会话/工具绑定、载荷哈希、过期与一次性使用。
- 可溯源的回答,标注为权威 / 推导 / 未经核实,并附带来自工具调用的来源证据。
- 评测套件覆盖路由、工具选择、溯源、结果等价性与在线冒烟 —— 让智能体行为在发布前即可度量。