生产级 AI · 智能体系统 · 工程负责人

我构建 经得起生产考验的 AI

RAG、对话式数据分析与 MCP 驱动的多智能体系统,配以确定性护栏、引用溯源、人在回路审批与真实评测 —— 背后是 10 余年分布式系统构建经验,曾就职于 Google、Uber 与 Microsoft,现为实战型 CTO。

GoogleUberMicrosoft
实战型 CTO · 元宝创意
10+ 年经验10–30K QPS · p99 ~140ms99.97% 备份健康度
LangGraphRAGMCPGoJavaPythonGoogle Cloud
中国 武汉 felixhuhao@gmail.com

关于

会构建的负责人。

我是一名工程负责人,也是亲力亲为的构建者。在十余年构建大规模系统之后 —— 曾就职于 Google、Uber 与 Microsoft —— 如今我以创业公司 CTO 的身份设计生产级 AI 与智能体系统,带领团队,让 LLM 与智能体成为帮助我们高效而可靠交付的队友。

我专注于 经得起生产考验的 AI:检索与智能体系统,配以确定性护栏、引用溯源、人在回路审批与真实评测 —— 而非演示。扎实的计算机基础与架构判断力,支撑着我交付的每一个系统。

我如何构建经得起考验的 AI

安全在于边界,而非提示词。

高风险操作必须经过模型无法绕过的确定性护栏与人工审批 —— 一个从构造上就拒绝不安全查询的 SQL 校验器,写操作只能凭一次性、已签名的审批才能执行。“小心行事”并不是一种控制手段。

没有溯源的回答只是猜测。

每个回答都可溯源到出处,并被允许回答“我不知道” —— 基于引用溯源的检索、无证据即拒答,回答被标注为权威、推导或未经核实。

无法度量,就不发布。

智能体配有黄金集与回归评测 —— 路由、工具选择、结果等价性 —— 让每一次提示词改动都可被证明,而非凭感觉。

难的是系统,而非模型。

十余年的分布式系统与数据基础设施经验,才是让这些系统在真实负载下稳定运行的关键。模型只是其中一个组件;围绕它的边界、状态、评测与可观测性,才让它成为生产级软件。

精选作品

统一 ERP AI 层:知识、数据分析、运营。

为同一家企业级 ERP 客户构建的三套生产系统,共享同一套安全与评测实践 —— 运营 Copilot、NL2SQL 数据分析智能体,以及知识助手。

企业级 RAG 预览
知识

企业级 RAG 平台

文档智能平台,具备意图驱动的检索、反馈驱动的评测套件,以及基于引用溯源、无证据即拒答的回答。

Vue 3FastAPILangGraphMilvus
NL2SQL 智能体 预览
数据分析

NL2SQL 数据分析智能体

OLAP 数据分析智能体,在确定性 SQLGlot 安全层之后将业务问题转化为受控 SQL,并配以语义元数据层与有界修复。

Vue 3FastAPISQLGlotQdrant
运营 Copilot 预览
运营

ERP 运营 Copilot

通过受治理的 MCP 工具对业务实体进行智能体化运营,具备专家路由与面向高风险写操作的人在回路审批边界。

DeepAgentsFastAPISpring AI MCPJava 21

经历

10 余年,贯穿技术栈上下。

2025 — 至今
首席技术官 · 元宝创意
为企业级 ERP SaaS 平台架构并交付统一的智能体 AI 层 —— 覆盖运营、数据分析与知识 —— 带领 4 人团队(见上方项目)。
2023 — 2025
独立软件工程师与顾问 · 自由职业
在 AWS 上交付云原生旅行指南 SaaS,以及一系列 RAG / 智能体原型 —— 将一线实践衔接到 CTO 角色。
2022 — 2023
高级软件工程师 · Uber
构建 Uber 首个快消品(CPG)广告主干(10–30K QPS,p99 ~140ms),以及以 GTIN 为索引的多门店广告计划模型;主导分阶段生产上线。
GogRPCDocStoreKafkaFlinkPrometheus/Grafana
2018 — 2021
软件工程师 · Google
Cloud SQL:实现可靠的任意时间点恢复(PITR),并将备份健康度从 99.92% 提升至 99.97%;作为数据面 on-call 维护 99.95% SLA。
JavaGoMySQL 高可用CSV 导入/导出 GACloud SQL IAM
2014 — 2017
软件开发工程师 · Microsoft
Exchange/Outlook:构建通信信号采集与迁移工具,支撑 4 亿+ Hotmail 用户迁移至 Outlook。
C#ExchangeGraph People APISQL监控/告警
2011 — 2013
软件开发 / 数据工程师 · Epic Systems · HCR ManorCare
版本发布自动化工具,以及 SSIS ETL 管道与高级 SSRS 报表。

教育

基础的来处。

2010 — 2012
Bowling Green State University · 计算机科学硕士
GPA 4.0/4.0 · 美国 鲍灵格林
2006 — 2010
武汉大学 · 软件工程学士
GPA 3.5/4.0 · 中国 武汉

实验室

个人研发。

自主驱动的原型,探索多模态 RAG、多智能体系统与经典机器学习。

多模态 RAG

多模态 RAG,采用混合检索(稠密 + BM25)、LangGraph 质量闭环、RAGAS 评测,以及质量门禁的人工审批。

多模态RAGASLangGraphMilvus

多智能体旅行助手

采用 supervisor 模式的多智能体客服系统(机票、酒店、租车),具备业务规则校验与会话记忆。

多智能体SupervisorLangGraph

车辆价格预测

竞赛级回归建模:从梯度提升集成演进到多随机种子 MLP,配以严谨的特征工程。

PyTorch梯度提升特征工程

技能

技术工具箱。

大模型与智能体

智能体编排智能体治理工具 / 函数调用MCP 集成多智能体路由上下文工程LangChainLangGraphDeepAgentsOpenAI / Claude / DeepSeek

RAG 与检索

RAG(多模态)混合检索嵌入重排序查询优化MilvusQdrant

评测与安全

LangSmithRAGASOpenEvalsLLM 裁判评测护栏人在回路可观测性

编程语言

Java & Go (Google readability)PythonSQLC#C++

后端与分布式系统

微服务API 设计gRPC / ProtobufRESTThriftSpring AIFastAPISSE

数据系统

数据建模PostgreSQLMySQLRedisBigQueryClickHouseKafkaFlinkMongoDB

云与基础设施

Google CloudAWSDockerKubernetesLinuxCI/CD

机器学习 / 数据科学

PyTorchCatBoost / LightGBM / XGBoost特征工程时间序列

联系

一起构建可靠的系统。

对 AI / 智能体工程与资深工程岗位,以及咨询合作持开放态度。