跳转到主要内容
目标:构建一个AI 驱动的连接器枢纽——独立模式 (门户助手) 、副驾模式 (嵌入宿主系统) 、枢纽 (跨系统集中编排) 。 原则:与提供商无关 (避免厂商锁定) 、最小抽象协议优先连接器优先 (集成是核心价值) 。

产品愿景

FIM Agent 是一个AI 连接器枢纽,服务于三种逐步演进的模式:
独立模式     → 您自己的 AI 助手(Portal)
副驾模式     → 嵌入宿主系统的 AI(iframe / widget / embed)
枢纽         → 跨系统集中编排(Portal / API)
枢纽模式是核心差异化优势。 企业客户拥有遗留系统——ERP、CRM、OA、财务、人力资源——这些系统需要通过 AI 相互联通: GTM 路径:落地并扩展
阶段模式内容
落地副驾模式嵌入一个系统,在其 UI 内证明价值
扩展副驾模式 → 枢纽推广到更多系统;由枢纽统一汇聚

发布版本

v0.1 (2025-08-01) — MVP:ReAct + DAG 规划器

  • 支持工具 (calculator、python_exec、网页搜索) 的 ReAct代理
  • DAG 规划器 (LLM 生成依赖图)
  • 支持流式输出 + KaTeX 的门户 UI

v0.2 (2025-09-15) — 多模型 + 记忆

  • 重试 / 速率限制 / 用量跟踪
  • 原生函数调用 (无需仅依赖 JSON 解析)
  • 多模型支持 (快速模型 + 主 LLM)
  • 记忆:窗口记忆、摘要记忆
  • 基于 FastAPI 的后端,支持 SSE 流式传输

v0.3 (2025-10-20) — 网页工具 + MCP

  • 通过 Jina/Tavily/Brave 提供的网页工具 (网页搜索、网页获取)
  • 文件操作工具
  • MCP 客户端 (标准工具集成)
  • 工具自动发现 + 分类
  • 支持点击跳转滚动的 DAG 可视化
  • 在 Docker 中执行代码 (--network=none)

v0.4 (2025-11-15) — 多轮对话 + 智能体

  • 多轮对话 (数据库记忆)
  • 工具步骤折叠 UI
  • HTTP 请求 + shell 执行工具
  • 智能体管理 (创建、配置、发布)
  • JWT 身份验证
  • 按智能体设置的执行模式 + 温度控制

v0.5 (2025-12-20) — 完整 RAG + 可溯源生成

  • 完整 RAG 流水线 (嵌入 + 向量存储 + FTS + 倒数排名融合 + 重排序器)
  • 可溯源生成 (引用、冲突检测、置信度评分)
  • 知识库文档管理 (CRUD、搜索、重试、Schema 迁移)
  • 上下文保护器 + 置顶消息 (令牌预算管理器)
  • 数据库记忆持久化 + LLM Compact
  • DAG 重新规划 (最多 3 轮)

v0.6 (2026-01-10) — 连接器平台

  • 连接器 CRUD:创建、读取、更新、删除
  • 连接器工具适配器:将连接器转换为 BaseTool
  • 用户级凭据:AES-GCM 加密
  • 确认门:写操作审批
  • 审计日志:记录所有工具调用
  • 熔断机制:故障时优雅降级
  • 实用工具:email_send、json_transform、template_render、text_utils
  • 嵌入选项:Jina、OpenAI、自定义提供商

v0.7 (2026-02-07) — 管理平台 + 多租户

  • 管理平台:用户管理、角色切换、密码重置、账户启用/禁用
  • 仅限邀请注册:三种模式 (开放/邀请/禁用) + 邀请码 CRUD
  • 存储管理:按用户磁盘用量、清理、孤儿数据清理
  • 会话审核:管理员可查看/删除全部
  • 按用户强制登出:撤销所有令牌
  • API 健康仪表板:系统统计、连接器指标
  • 首次运行设置向导:引导创建管理员账户
  • 个人中心:用户级全局指令、语言偏好
  • JWT 认证:基于令牌的 SSE 认证、会话所有权
  • 全局 MCP 服务器:由管理员预配,在所有会话中加载
  • 向后兼容:registration_enabled → registration_mode 自动迁移

v0.7.x (自 2026-02-21 起) — 稳定性与完善

  • 邀请码管理
  • 按用户配额 (执行 429 限流)
  • 结构化审计日志
  • 敏感词过滤
  • 管理员登录历史
  • 管理员文件浏览器
  • 增强的管理视图 (model_nametoolskb_ids 字段)
  • Docker Compose 部署 (单镜像、命名卷)
  • 基于 window.location 自动检测 OAuth

规划版本

v0.8 — 连接器声明式配置 + RBAC

目标:让连接器定义更简单,无需编写 Python 代码。
  • YAML/JSON 连接器配置:平台自动生成 MCP 服务器
  • 连接器导入/导出:共享连接器模板
  • 连接器分叉:复制并自定义现有连接器
  • 数据库连接器:直接访问 SQL (PostgreSQL、MySQL、Oracle)
  • 消息推送:Lark、WeCom、Slack、Email 通知动作
  • RBAC:按用户/角色控制连接器访问权限
  • 操作审计:详细记录谁执行了哪些操作
影响:实施工程师 (无需 Python) 可在 1-2 小时内新增连接器。

v0.9 — 可观测性 + 生产环境加固

目标:实现面向生产环境的运维与调试。
  • 分布式追踪:集成 OpenTelemetry
  • 熔断机制:指数退避、故障检测
  • 可观测性:指标 (延迟、成功率、令牌使用量)
  • 连接器分析:使用模式、故障模式
  • 沙箱加固:代码执行隔离的 v2 改进
  • Docker Compose:完整部署栈
  • 性能测试:并发负载基准测试
影响:让 FIM Agent 能够自信地实现大规模运行。

v1.0 — 热插拔 + 可嵌入式

目标:无需重启即可添加连接器,并支持可嵌入式交付。
  • 热插拔连接器:上传 OpenAPI 规范,AI 自动生成配置,5 分钟内即可上线 (无需重启)
  • 连接器市场:社区共享模板
  • 可嵌入式组件:将 <script src="fim-agent.js"> 注入宿主页面
  • 页面上下文注入:小部件读取宿主页面上下文 (当前 ID、URL、DOM 选择器)
  • 计划任务:类 cron 的 DAG 触发器
  • Webhook:入站事件触发器
  • 批量执行:通过 DAG 处理 1000+ 条数据
  • 管理控制台:完整的管理界面
  • 企业级安全:IP 白名单、静态数据加密、SSO
  • 语义记忆:跨会话记忆检索
  • 记忆生命周期:TTL、重要性评分、语义相似度
影响:企业可在数天内完成 FIM Agent 从零到多系统编排的部署。

冻结功能 (已发布,仅维护)

根据正交性策略,这些功能已发布并正常运行,但不会再获得新能力 (仅修复 bug) :
功能版本冻结原因
ReAct 智能体v0.1模型现已原生支持工具调用
DAG 规划 / 重新规划v0.1, v0.5模型推理能力持续提升;任务分解正趋向于单次完成
记忆 (窗口、摘要、压缩)v0.2, v0.5上下文窗口持续扩大 (200K+) ;对外部记忆管理的需求降低
RAG 流水线v0.5提供商正原生构建检索能力 (OpenAI file_search、Gemini Search Grounding)
可溯源生成v0.5模型在引用方面持续改进;5 阶段流水线带来的边际价值递减
ContextGuard / 置顶消息v0.5按现状交付;不再新增功能

考虑 (无限期推迟)

根据正交性策略,这些功能投入成本高,且存在被原生能力吸收的风险:
功能推迟原因
多智能体编排提供商正在原生构建相关能力 (OpenAI Swarm、Claude Code Teams、Google A2A)
语义记忆存储上下文窗口持续扩大;提供商也在增加原生记忆能力 (ChatGPT Memory、Claude Projects)
记忆生命周期同上;随着差距不断缩小,相比之下工程成本偏高

版本与模式的对应关系

版本独立模式副驾模式枢纽说明
v0.1–v0.3可用尚未支持尚未支持仅限 Portal,单用户
v0.4可用尚未支持尚未支持多会话、智能体管理
v0.5可用尚未支持尚未支持知识库 + RAG
v0.6可用可支持可支持连接器已交付;通过手动集成可实现副驾模式/枢纽
v0.7可用就绪就绪管理平台;多租户认证;可用于生产环境
v0.8可用就绪已优化按系统划分的 RBAC + 审计日志;接入更容易
v0.9可用就绪生产可用可观测性、性能、加固
v1.0可用已优化企业级热插拔、市场、计划任务、Webhook、批处理

资源分配 (v0.8–v1.0)

正交性策略决定了资源投入的重点:
类别占比版本原因
连接器平台 (v0.6+)60%持续核心差异化能力;不存在被吸收的风险
企业级功能 (RBAC、审计、安全)25%v0.8–v1.0不炫目但可持续;生产环境必需
嵌入/交付 (widget、热插拔)10%v0.9–v1.0对”落地并扩展”GTM 具有战略意义
v0.1–v0.5 维护5%持续仅修复缺陷;不新增功能

以指标驱动的里程碑

成功将通过以下指标衡量:
指标v0.7 目标v0.8 目标v1.0 目标
已部署连接器数量520+100+
企业客户数量1–25–1020+
平均连接器配置时间2 周2 天5 分钟 (热插拔)
令牌效率 (DAG 对比仅使用 ReAct)降低 30%降低 40%降低 50%
可用性 SLA99.5%99.9%99.95%
支持工单主要主题集成、配置连接器自定义逻辑热插拔、扩缩容

开放问题 / 待定

  • Marketplace 审核:如何验证社区连接器?(v1.0)
  • 令牌经济:如何为多用户、多智能体场景定价?(v1.0)
  • Telemetry 退出:如何尊重隐私偏好?(v0.8)
  • 连接器版本管理:如何管理连接器 API 中的破坏性变更?(v0.8)
  • 速率限制:按连接器、按用户,还是全局?(v0.8)