为什么动态规划是艰难的中间路线
押注于模型的持续进步
ReAct 和 DAG 规划会过时吗?
为什么不复刻 Dify 的工作流编辑器
- 这些工作流本来就已经存在于别处。 政府和企业客户的固定流程本就运行在他们的 OA、ERP 和遗留系统中。他们不想再到另一个平台里重建这些流程——他们想要的是能连接这些现有运行系统的 AI。连接器平台 (v0.6) 正是直接解决这个问题的。
- 现有能力本身就可以组合成固定流水线。 计划任务 (v1.0) 用固定提示词触发一个 DAG 智能体;DAG 动态规划步骤;连接器 (v0.6) 负责连接目标系统。这种组合本质上等同于静态流水线——但灵活性更高,因为 LLM 可以根据遇到的数据动态调整计划。不需要额外再造一套流水线 DSL。
- 投入与收益不匹配。 一个达到生产级质量的可视化工作流编辑器 (画布、节点类型、变量传递、调试/回放) ,需要数月的专门投入。而最终产物,不过是对 Dify 那个已有 120K Star 社区持续维护的产品做一个低保真复制。这些投入更应该放在连接器架构上——这是竞争对手都不具备的能力。
FIM Agent 的定位
- 与 Dify 相比:更灵活——在运行时生成 DAG,而不是在设计时绘制流程图。你无需预先设想每一条执行路径。它并不与其在可视化工作流编辑上竞争;它的竞争点在于遗留系统集成。
- 与 AutoGPT 相比:更可控——迭代次数有上限、重新规划次数受限,并且路线图中包含人工参与机制。在护栏范围内实现自主性。
FIM Agent 所处的位置:规划 x 执行谱系
- DAG 拓扑由 LLM 在运行时生成 (动态规划) ——无需人工设计图结构
- 每个 DAG 节点运行一个完整的 ReAct 循环 (动态执行) ——节点会进行推理、使用工具并动态适应
- 重新规划机制 (执行 → 分析 → 若未满足则重新规划)
- 但有边界约束:最多 3 轮重新规划、令牌预算、人工确认门
概念术语表
| 术语 | 一句话说明 | 与 FIM Agent 的关系 |
|---|---|---|
| BPM (Business Process Management) | 流程在设计阶段即被完全固定,并按既定方式刚性执行。Camunda、Activiti。 | FIM Agent 不是 BPM。它没有固定的流程引擎。 |
| FSM (Finite State Machine) | 系统在任意时刻都只处于一个状态;事件触发状态迁移。支持循环 (拒绝 → 重新提交) 。 | 目标系统 (ERP、合同系统) 内部采用 FSM。FIM Agent 不需要 自己的 FSM——它调用的是目标系统的 API。 |
| ACM (Adaptive Case Management) | 骨架静态,分支动态。主流程预先定义,但各节点会在运行时自适应。 | FIM Agent 的 DAG + ReAct 天然属于这一象限。 |
| HTN (Hierarchical Task Network) | 递归式任务分解:高层任务 → 子任务 → 原子操作。 | DAG 重新规划已覆盖大多数场景;目前还不需要完整的 HTN。 |
| iPaaS (Integration Platform as a Service) | 连接多个 SaaS/本地部署系统的云集成平台。MuleSoft、Zapier。 | FIM Agent 的枢纽模式类似于 AI 原生 iPaaS——由自然语言驱动跨系统集成。 |
架构边界:FIM Agent 不复制工作流逻辑
| 操作 | 连接器做什么 |
|---|---|
| 转办 (Transfer) | 调用一个 API,传入目标处理人 |
| 驳回 (Reject) | 调用一个 API,传入驳回原因 |
| 升级 (Escalate) | 调用一个 API,传入升级处理人员列表 |
| 会签 (Co-sign) | 调用一个 API,传入会签人列表 |
- 带来维护负担 (需要让两个状态机保持同步)
- 引入更多失败模式 (如果两者状态不一致怎么办?)
- 不产生任何额外价值 (目标系统本来就能正确处理这些)