随着LLM能力的快速发展,我们需要一个框架来决定在哪里投入工程努力,以及在哪里保持稳定。
决策
我们根据每项功能与 LLM 进步的关系对其进行分类,并相应地分配工作量。| 类别 | 策略 | 投资 | 示例 |
|---|---|---|---|
| 正交 | 模型变得更聪明不会削弱这些功能 — 纯工程/集成问题 | 全额投资 | 连接器、凭证、OAuth、审计、RBAC、安全、部署 |
| Tailwind | 模型改进使这些功能更好,而不是冗余 — 共生关系 | 投资(收益复合) | AI 连接器生成器(更聪明的模型 = 更高质量的连接器输出) |
| 冻结 | 已发布、运行良好 — 但模型正在吸收这些功能 | 仅维护,无新功能 | ReAct 循环、DAG 规划、RAG 管道、记忆、基础生成 |
| 考虑 | 提供商在平台级别原生构建 — 冗余风险高 | 无限期延迟 | 多智能体编排、语义记忆、记忆生命周期 |
分析
为什么连接器平台完全正交
模型永远不会原生地:- 存储和加密 API 凭证 (AES-GCM)
- 管理 OAuth 流程(授权页面 → 回调 → 刷新令牌)
- 连接到客户端的金蝶 ERP 数据库
- 向飞书或企微推送通知
- 对谁可以使用哪个连接器强制执行 RBAC
- 记录每个工具调用以进行合规审计
为什么 AI 连接器构建器是”顺风而行”而非”被吸收”
构建器智能体使用模型智能来创建受管的、持久的连接器实体 — 存储在数据库中、可在智能体间复用、具有凭证管理和审计跟踪。模型不断改进的 API 理解能力使构建器生成更好的连接器,而不是使构建器变得不必要。 类比:Cursor 使用 Claude 来编写代码。Claude 变得更聪明使 Cursor 更强大,而非冗余,因为 Cursor 提供工程价值(项目管理、文件组织、版本控制)是模型无法替代的。为什么 v0.1–v0.5 功能被”冻结”
| 功能 | 行业发展趋势 |
|---|---|
| ReAct 循环 | 模型具有原生工具调用能力(OpenAI、Anthropic)。外部推理循环的价值降低,因为模型已将其内化。 |
| DAG 规划 | 模型推理能力快速提升。复杂任务分解曾需要外部规划器,现在成为单次能力。 |
| 内存管理 | 上下文窗口快速增长(Gemini 2M+、Claude 200K+)。外部窗口管理、摘要和压缩的需求在缩减。 |
| RAG 管道 | 提供商正在将检索集成到平台中(OpenAI file_search、Google NotebookLM、Gemini Search Grounding)。对于公开知识,传统的分块-嵌入-检索管道正被替代。 |
| 有根据的生成 | 模型在原生引用来源方面表现更好。我们构建的 3 阶段接地管道价值递减。 |
为什么多智能体编排被推迟
LLM 提供商正在原生构建编排功能:- OpenAI Swarm:具有切换协议的多智能体框架
- Anthropic Claude Code Teams:具有任务图的领导者/工作者智能体池
- Google A2A(智能体到智能体):智能体间通信协议
为什么语义记忆和记忆生命周期被推迟
- 上下文窗口增长迅速,减少了跨会话记忆检索的需求
- 提供商正在添加原生记忆功能(ChatGPT Memory、Claude Projects)
- 构建可靠的记忆系统(TTL、重要性评分、语义检索)的工程成本相对于它填补的缩小差距来说很高
功能级分类
正交性 (v0.6+)
| 功能 | 版本 | 正交性原因 |
|---|---|---|
| 连接器实体 + CRUD | v0.6.1 | 企业集成,纯工程实现 |
| 用户级凭证 (AES-GCM) | v0.6.2 | 安全基础设施 |
| 确认门控 | v0.6.2 | 写操作的安全机制 |
| 连接器导出/导入/分叉 | v0.7 | 分发机制 |
| OAuth 2.0 | v0.7 | 协议实现 |
| MCP Server 导出 | v0.7 | 互操作性(取决于 MCP 采用) |
| 数据库连接器 | v0.8 | 直接数据库访问、连接池 |
| 消息推送 | v0.8 | 通知渠道 |
| RBAC | v0.8 | 访问控制、治理 |
| 操作审计日志 | v0.8 | 合规性 |
| 沙箱加固 | v0.9 | 安全隔离 |
| 可观测性 (OTel、熔断器) | v0.9 | 生产运维 |
| 连接器分析 | v0.9 | 使用情况追踪 |
| Docker Compose | v0.9 | 部署 |
| 管理员仪表板 | v1.0 | 管理 UI |
| 定时任务 / Webhooks | v1.0 | 自动化触发器 |
| 批量执行 | v1.0 | 企业级处理 |
| 可嵌入小部件 / iframe | v1.0 | 交付模式 |
| 企业安全 | v1.0 | 合规性(加密、IP 白名单) |
Tailwind
| 功能 | 版本 | 关系 |
|---|---|---|
| AI 连接器构建器 | v0.6.3 | 更智能的模型 → 更好的构建器输出 |
| AI 连接器生成 (OpenAPI) | v1.0 | 相同 — 模型更好地理解 API 规范 → 更准确的自动生成 |
冻结(已发布,仅维护)
| 功能 | 版本 | 状态 |
|---|---|---|
| ReAct 智能体 | v0.1 | 已发布,正常运行 |
| DAG 规划 / 重新规划 | v0.1, v0.5 | 已发布,正常运行 |
| 内存(窗口、摘要、紧凑) | v0.2, v0.5 | 已发布,正常运行 |
| RAG 管道(嵌入、向量存储、分块、混合检索) | v0.5 | 已发布,正常运行 |
| 基础生成 | v0.5 | 已发布,正常运行 |
| ContextGuard / 固定消息 | v0.5 | 已发布,正常运行 |
考虑中(无限期延迟)
| 功能 | 原始版本 | 延迟原因 |
|---|---|---|
| 多智能体编排 | v1.0 | 提供商正在原生构建 |
| 语义记忆存储 | 待办事项 | 上下文窗口不断增长;提供商添加原生记忆 |
| 记忆生命周期 | 待办事项 | 同上 |
影响
- 不要回到 v0.5 功能。 可以进行错误修复,但不能添加新功能。
- 连接器平台是核心投资。 v0.6–v0.8 应该获得大部分工程时间。
- 企业工程(RBAC、审计、安全、部署)是护城河。 这些虽然乏味但具有防守性。
- 每年重新评估。 如果模型进展停滞或”冻结”的功能仍然存在重大缺陷,则重新考虑。