Roadmap

Goal: Build an AI-powered Connector Hub — Standalone (portal assistant), Copilot (embedded in host system), Hub (central cross-system orchestration). Principles: Provider-agnostic (no vendor lock-in), minimal-abstraction, protocol-first, connector-first (integration is the core value).

Produktvision

FIM One ist ein AI-Connector-Hub, der drei progressive Modi bedient:

Standalone   → Dein eigener KI-Assistent (Portal)
Copilot      → KI eingebettet in ein Host-System (iframe / Widget / Embed)
Hub          → Zentrale systemübergreifende Orchestrierung (Portal / API)

Hub-Modus ist der Kernunterscheidungsfaktor. Unternehmenskunden haben Legacy-Systeme — ERP, CRM, OA, Finanzen, HR — die über KI miteinander kommunizieren müssen: GTM-Pfad: Land and Expand

Schritt	Modus	Was passiert
Land	Copilot	In ein System einbetten, Wert in ihrer UI nachweisen
Expand	Copilot → Hub	Auf mehr Systeme ausrollen; Hub aggregiert sie

Bekannte Probleme

Nachverfolgter Fehler, die in der Produktion reproduzierbar sind, aber noch nicht behoben wurden. Jeder Eintrag benennt das Symptom, den vermuteten Bereich und die Problemumgehung (falls vorhanden). Einträge werden in einen Versionsabschnitt verschoben, sobald eine Behebung definiert und geplant ist.

Agent-Editor zeigt Warnung zu ungespeicherten Änderungen ohne tatsächliche Bearbeitung. Das Öffnen eines vorhandenen Agenten über /agents/[id] und sofortiges Zurückklicken löst den Dialog „Ungespeicherte Änderungen” aus, auch wenn kein Feld berührt wurde. Die Dirty-Check vergleicht 20+ Felder mit der geladenen Agent-Payload, daher reicht eine asymmetrische Standardeinstellung zwischen State-Initialisierung und Dirty-Vergleich aus, um einen Phantom-Mismatch zu verursachen – aktuelle Vermutung ist eines der verschachtelten model_config_json / Benachrichtigungs- / Genehmigungsrouting-Felder, möglicherweise von undefined vs null vs "" Normalisierung. Reproduzierbar besonders bei organisationsgebundenen Agenten. Problemumgehung: Dialog verwerfen (Discard and leave) – kein Datenverlust, da sich nichts tatsächlich geändert hat. Versuchte Behebung (cb40c86a) entfernte ein verwandtes Orphan-Badge-Flimmern auf den Ressourcen-Pickern, löste aber dieses Problem nicht.
Das Speichern einer Agent-Bearbeitung kann mit Input should be 'initiator', 'agent_owner' or 'org_members' fehlschlagen. Pydantic lehnt das Feld confirmation_approver_scope an der /api/agents/{id} PUT-Grenze ab, obwohl jeder gespeicherte Wert in der Datenbank einer der drei gültigen Literale ist. Vermutung: Das Frontend as "initiator" | "agent_owner" | "org_members" Cast ist nur ein Compile-Time-Versprechen, daher kann ein Legacy- oder unerwarteter Runtime-String (möglicherweise aus einer Vorlage, einem Import oder einer älteren Migration) durch setConfirmationApproverScope durchschlüpfen und wörtlich zurückgesendet werden. Problemumgehung: Wählen Sie explizit einen Wert in der Dropdown-Liste Genehmigung → Genehmiger-Bereich aus, bevor Sie speichern.
Playground-Stopp-und-Wiederholung zeigt vorübergehende visuelle Artefakte, die ein Seiten-Refresh immer behebt. Drei gleichzeitige Render-Quellen – activeConversation.messages (DB-Snapshot), der SSE messages Stream und der optimistische pendingQuery Platzhalter – werden nicht in einen einzelnen abgeleiteten State zusammengefasst, daher kann die UI zwischen dem Klick auf „Retry” und dem Eintreffen der gepaarten Assistenten-Antwort (a) kurzzeitig die gleiche Abfrage zweimal im Pre-Stream-Fenster rendern, (b) vorherige verwaiste User-Blasen aus dem Wiederholungsverlauf löschen, während hasLiveMessages wahr ist und bevor der Snapshot neu geladen wird, und (c) im engen Fenster zwischen dem SSE „done” Event und dem nächsten selectConversation Refresh flimmern. Daten gehen nie verloren – jede Benutzer-Nachricht (einschließlich abgebrochener Wiederholungen) wird in conversation.messages beibehalten, in den nächsten LLM-Aufruf über normalize_alternating_messages übernommen und nach Refresh über HistoryTurn.orphanUserContents (eingeführt in der 48ba08c6 Render-Behebung) korrekt gerendert. Zum Kontext: Claude’s eigene Web-UI zeigt eine analoge Fehlerklasse – das Stoppen einer Antwort und sofortiges Senden einer Folgefrage verzweigt die Folgefrage manchmal als Sibling-Edit-Zweig der ersten Abfrage, anstatt sie als neue Runde anzuhängen – daher ist dies ein bekanntes schwieriges Problem in Optimistic-UI + SSE + Persisted-History Designs, kein FIM-One-spezifischer Defekt. Eine ordnungsgemäße Behebung erfordert das Zusammenfassen der drei Render-Quellen in einen einzelnen abgeleiteten State; aufgeschoben bis zu einer breiteren Playground State-Machine Umgestaltung.

Ausgelieferte Versionen

v0.1 (2026-02-22) — MVP: ReAct + DAG Planner

ReActAgent mit Tools (calculator, python_exec, web_search)
DAG Planner (LLM generiert Abhängigkeitsgraphen)
Portal UI mit Streaming + KaTeX

v0.2 (2026-02-24) — Multi-Modell + Speicher

Wiederholung / Ratenbegrenzung / Nutzungsverfolgung
Native Funktionsaufrufe (kein reines JSON-Parsing)
Multi-Modell-Unterstützung (schnelles + Haupt-LLM)
Speicher: WindowMemory, SummaryMemory
FastAPI-Backend mit SSE-Streaming

v0.3 (2026-02-25) — Web Tools + MCP

Web tools (web_search, web_fetch) via Jina/Tavily/Brave
File operations tool
MCP client (standard tool integration)
Tool auto-discovery + categories
DAG visualization with click-to-scroll
Code exec in Docker (--network=none)

v0.4 (2026-02-25) — Multi-Turn + Agenten

Multi-Turn-Konversationen (DbMemory)
Tool-Schritt-Faltungs-UI
HTTP-Anfrage + Shell-Exec-Tools
Agenten-Management (erstellen, konfigurieren, veröffentlichen)
JWT-Authentifizierung
Pro-Agenten-Ausführungsmodus + Temperaturkontrolle

v0.5 (2026-02-28) — Full RAG + Grounded Gen

Vollständige RAG-Pipeline (Embedding + Vektorspeicher + FTS + RRF + Reranker)
Grounded Generation (Zitationen, Konfidenzwerte)
Wissensdatenbank-Dokumentverwaltung (CRUD, Suche, Wiederholung, Schema-Migration)
ContextGuard + angeheftete Nachrichten (Token-Budget-Manager)
DbMemory-Persistenz + LLM Compact
DAG-Neuplanung (bis zu 3 Runden)

v0.6 (2026-03-01) — Connector-Plattform

Connector CRUD: erstellen, lesen, aktualisieren, löschen
ConnectorToolAdapter: konvertiert Connector → BaseTool
Benutzer-spezifische Anmeldedaten: AES-GCM-Verschlüsselung
Bestätigungsgate: Genehmigung von Schreibvorgängen
Audit-Protokollierung: alle Tool-Aufrufe werden aufgezeichnet
Circuit Breaker: elegante Verschlechterung bei Ausfällen
Utility-Tools: email_send, json_transform, template_render, text_utils
Embedding-Optionen: Jina, OpenAI, benutzerdefinierte Anbieter

v0.7 (2026-03-06) — Admin-Plattform + Multi-Mandant

Admin-Plattform: Benutzerverwaltung, Rollenwechsel, Passwort-Zurücksetzen, Konto aktivieren/deaktivieren
Nur-auf-Einladung-Registrierung: drei Modi (offen/Einladung/deaktiviert) + Einladungscode CRUD
Speicherverwaltung: Festplattennutzung pro Benutzer, Löschen, verwaiste Bereinigung
Gesprächsmoderation: Admin-Liste/Löschen aller
Erzwungenes Logout pro Benutzer: alle Token widerrufen
API-Gesundheits-Dashboard: Systemstatistiken, Connector-Metriken
Assistent für die erste Einrichtung: geführte Admin-Kontoerstellung
Persönliches Zentrum: globale Anweisungen pro Benutzer, Spracheinstellung
JWT-Authentifizierung: Token-basierte SSE-Authentifizierung, Gesprächseigentum
Globale MCP-Server: von Admin bereitgestellt, in allen Sitzungen geladen
Rückwärtskompatibilität: registration_enabled → registration_mode automatische Migration

v0.7.x (2026-03-07 bis 2026-03-12) — Stabilität + Verbesserungen

Einladungscode-Verwaltung
Benutzer-spezifische Kontingente (429-Durchsetzung)
Strukturiertes Audit-Logging
Filterung sensibler Wörter
Admin-Anmeldungsverlauf
Admin-Dateibrowser
Erweiterte Admin-Ansichten (Felder model_name, tools, kb_ids)
Docker Compose-Bereitstellung (einzelnes Image, benannte Volumes)
OAuth-Automatische Erkennung von window.location
Erweitertes Denken / Reasoning-Unterstützung (LLM_REASONING_EFFORT, LLM_REASONING_BUDGET_TOKENS) für OpenAI o-Serie, Gemini 2.5+, Claude
Admin pro-Tool Aktivieren/Deaktivieren (deaktivierte Tools werden zur Laufzeit aus dem Chat ausgeschlossen)
MCP-Server-Verwaltung auf die Seite „Konnektoren” verschoben
Duale Datenbankunterstützung: SQLite (Null-Konfiguration Standard) + PostgreSQL (Produktion); Docker Compose stellt PostgreSQL automatisch bereit
Dokumentationsseite zur Modellkonfiguration mit Extended-Thinking-Setup pro Anbieter
SSE Protocol v2: Echtzeit-Antwort-Streaming mit delta_reasoning, usage-Feldern und geteilten done/suggestions/title/end-Events; SQLite-Pool-Größe 5 -> 20
AI Builder-Erweiterung: 7 neue Builder-Tools (GetSettings, TestConnection, ImportOpenAPI für Konnektoren; ListConnectors, AddConnector, RemoveConnector, SetModel für Agenten), is_builder-Flag auf Agenten, automatische Builder-Prompt-Aktualisierung, SSRF-Schutz
SSE v2 Frontend: Streaming-Punkt-Puls-Cursor, DAG-Neuplan-Runden-Snapshots als einklappbare Karten, DAG-Layout entkoppelt von Schrittzuständen
Konzeptdokumentationsseite für AI Builder mit Konnektoren- und Agenten-Builder-Leitfäden
Organisationssystem: vollständige CRUD-Operationen mit rollenbasierter Mitgliedschaft (Eigentümer/Admin/Mitglied), Admin-Verwaltungs-UI
Dreiebenen-Ressourcensichtbarkeit (persönlich/Org/global) für Agenten, Konnektoren, Wissensdatenbanken, MCP-Server
Veröffentlichungs-/Unveröffentlichungs-API für alle Ressourcentypen; Eigentümerdelegation für veröffentlichte Agenten
Admin-Set-Visibility-Endpoint (ersetzt Clone-to-Global); einheitlicher build_visibility_filter()-Abfrage-Helper
Datenbank-Konnektoren (Phase 1-3): direkter SQL-Zugriff auf PG/MySQL/Oracle/SQL Server + chinesische Legacy-DBs; Schema-Introspection, KI-Annotation, schreibgeschützte Abfrageausführung, verschlüsselte Anmeldedaten, 3 Tools pro Konnektor (list_tables, describe_table, query)
Evaluierungszentrum: quantitatives Benchmarking der Agentenqualität — Test-Dataset CRUD (Prompt + erwartetes Verhalten + Assertions), Eval-Läufe (parallele Ausführung + LLM-Bewerter + Pro-Fall Pass/Fail/Latenz/Token-Ergebnisse), Ergebnis-Viewer mit automatischem Polling; Migration r8t0v2x4z567
Drei Modellrollen (Allgemein/Schnell/Reasoning) mit isolierter Umgebungskonfiguration pro Tier; Schnellmodell erbt keine Hauptmodell-Einstellungen mehr
StepOutput-Dataclass ersetzt einfache String-Schrittergebnisse für strukturierte Daten und Artefakt-Übergabe
Tool-Cache für DAG-Ausführung — identische Tool-Aufrufe pro Lauf gecacht mit asynchronem Lock-Stampede-Schutz (DAG_TOOL_CACHE)
Pro-Schritt-LLM-Verifizierung mit 1 Wiederholung bei Fehler (DAG_STEP_VERIFICATION)
Auto-Routing: schnelles LLM klassifiziert Abfragen als ReAct oder DAG; /api/auto-Endpoint; Frontend 3-Wege-Modusumschalter (AUTO_ROUTING)
~~Shadow Market Organization + Resource Subscriptions~~: Integrierte Market-Org (Shadow, kein automatischer Beitritt) ersetzt Platform-Org; Ressourcen werden durch Marketplace-Browsing entdeckt und explizit abonniert (Pull-Modell); Market-API zum Abonnieren gemeinsamer Ressourcen; Veröffentlichung auf Market erfordert immer Überprüfung; Ressourcen-Abonnements-Tabelle; Org-basierte Ressourcenfreigabe ersetzt globale Sichtbarkeit
~~Agent Auto-discovery and Sub-agent Binding~~: discoverable-Flag auf Agenten; sub_agent_ids-Whitelist; CallAgentTool zum Delegieren von Aufgaben an spezialisierte Agenten
~~MCP Server Credentials + Per-User Override~~: mcp_server_credentials-Tabelle; PUT /api/mcp-servers/{id}/my-credentials-Endpoint; allow_fallback-Flag für Fallback-Verhalten bei Anmeldedaten
~~Connector/KB Toggle~~: POST /api/connectors/{id}/toggle und POST /api/knowledge-bases/{id}/toggle zum Aussetzen/Fortsetzen von Ressourcen
~~Standalone KB Conversations~~: kb_ids-Feld auf Konversationen für direkten KB-Chat ohne Agent-Bindung

v0.8 (2026-03-20) — Connector Deklarative Konfiguration + Progressive Offenlegung

v0.8.1 (2026-03-29) — Progressive Disclosure Maturity + ReAct Hardening

Progressive Disclosure für DB-Konnektoren (DatabaseMetaTool), MCP-Server (MCPServerMetaTool) und bedarfsgesteuerte Tool-Laden (request_tools Meta-Tool)
DAG-Qualitätsüberholung (5 Verbesserungen: Modell-Upgrade, Skill-Autodiscovery, Citation Verifier, strukturierte Inhaltsbewahrung, Domain-bewusste Weiterleitung)
Domain-Modell-Eskalation in ReAct (spezialisierte Domains eskalieren automatisch zum Reasoning-Modell)
Pro-Modell Native Function Calling Toggle (tool_choice_enabled)
ReAct-Zyklenerkennung (deterministische Vermeidung doppelter Tool-Aufrufe)
ReAct-Abschlusscheckliste (Vor-Antwort-Verifikation bei Verwendung von Tools)
Resource Fork Phase 1 (MCP Server + Skill Fork Endpoints mit Lineage Tracking)
Workflow Connection Dep Auto-Subscribe (rekursive Sub-Workflow-Abhängigkeitsauflösung)
Vordefinierte Lösungsvorlagen (8 vertikale Lösungen beim ersten Registrieren auf dem Markt bereitgestellt)
Verbesserungen der Admin-Benachrichtigungen (Zeitzone-bewusst, Master-Schalter, SMTP Reply-To)
Pro-Turn Token Budget Circuit Breaker (REACT_MAX_TURN_TOKENS)
Zentralisierte Tool-Kürzung, dynamische System-Prompt-Budgetierung
Dateianhang-Download, Behebung doppelter Nachrichteneinreichung

v0.8.2 (2026-04-10) — Agent Core Hardening + Vision Documents

Agent Core Phase 0 — Compact prompt upgraded to 9-section structured format; empty tool result protection (descriptive message instead of (no output)); anti-loop prompt + cycle detection threshold lowered to 2; domain classifier + pre-flight DB config resolution parallelized (400–1100 ms saved per request); SSE end event sent immediately after answer, with title/suggestions moved to background tasks
Agent Core Phase 1 (Context Anti-Bloat) — MicroCompact rule-based old tool result cleanup (keep last 6); REACT_TOOL_RESULT_BUDGET=40000 aggregate cap; reactive compact on context overflow (auto-compact to 50% budget and retry instead of crashing)
Agent Core Phase 2 (Speed) — Keyword-based tool pre-selection (skips LLM call on obvious matches, 200–500 ms saved); SharedHttpClient LLM connection pooling; completion check skipped for answers >200 tokens; FallbackLLM wraps primary+fast with automatic failover on 429/503/529/connection errors
Intelligent Document Processing (Vision-Aware) — Adaptive document handling: PDF pages rendered as images via PyMuPDF for vision-capable models (GPT-4o, Claude 3/4, Gemini), text-only fallback via pdfplumber. Per-model supports_vision flag. Modes via DOCUMENT_PROCESSING_MODE, DOCUMENT_VISION_DPI, DOCUMENT_VISION_MAX_PAGES. DOCX/PPTX embedded image extraction. Multi-turn vision persistence across conversation turns. Smart PDF processing (text-rich pages extract text + images; scanned pages render as full-page PNG). Pre-built sandbox image (Dockerfile.sandbox) with common data-science packages for --network=none code execution
Resource Fork completion — Intelligenter Agent / Connector / Workflow fork endpoints added, completing the five-type lineage tracking (KB fork removed — inherently user-local)
File integrity guardrail — System prompt rule prevents the agent from substituting unrelated file contents when a target file is unreadable; uploaded files now include file_id in message context for direct read_uploaded_file access

v0.8.3 (2026-04-16) — Universal Document Conversion + Agent Core Phase 3

Universal Document Conversion (convert_to_markdown + OCR) — Built-in Agent tool wrapping Microsoft MarkItDown; converts PDF, Word, Excel, PowerPoint, HTML, JSON, CSV, XML, ZIP, EPUB, Outlook .msg, images, audio, YouTube URLs to Markdown. LiteLLMOpenAIShim enables OCR via any vision-capable LLM (Claude, Gemini, Bedrock, Azure). Vision-aware RAG ingestion with zero-regression text-only fallback. LLM_SUPPORTS_VISION env var for opt-out
Agent Core Phase 3 (Runtime Invariant Hardening) — Conversation recovery (dangling tool_use auto-repair); structured compact work card (WorkCard typed merge across compaction rounds); turn-level profiler (REACT_TURN_PROFILE_ENABLED); per-user rate limiting (LLM_RATE_LIMIT_PER_USER); empty-content assistant message with tool_calls no longer dropped

v0.8.4 (2026-04-17) — Prompt Cache + Reasoning Correctness

System prompt section registry with cache breakpoints — Memoized PromptRegistry splits system prompts into stable prefix + dynamic suffix; cache-capable providers (Claude, Bedrock Anthropic, Vertex Claude) receive cache_control: {"type": "ephemeral"} on the prefix for ~60-80% per-turn input token savings. Non-cache providers get a single concatenated message (zero behavior change)
Prompt cache observability — cache_read_input_tokens and cache_creation_input_tokens tracked through UsageSummary → TurnProfiler → done_payload.cache field. Structured turn_cache log line per turn. Doubles as relay cache-honesty probe
Conversation recovery MVP — Synthetic tool_result rows persist after interrupted turns; POST /chat/resume replays cached SSE events from a monotonic cursor; frontend useSseResume hook auto-reconnects with exponential backoff (300ms → 1s → 3s, max 3 attempts) and “Reconnecting…” indicator
Thinking-block persistence with signature — reasoning_content + Anthropic signature persisted in metadata_["thinking"] and replayed on subsequent turns; fixes HTTP 400 signature mismatch on Claude 4 multi-turn conversations
Provider-aware reasoning replay policy — Centralized reasoning_replay_policy() in core/prompt/reasoning.py gates serialization per provider family: Claude replays thinking blocks with signature; DeepSeek-R1/Qwen-QwQ/Gemini-thinking/o-series drop reasoning_content on outbound (previously leaked, breaking provider KV caches and violating API docs)

v0.8.5 (2026-04-23) — Channel Integration + Hook System + Contributor i18n

Feishu Channel (Phase 1 subset) — Org-scoped Channel resource with Fernet-encrypted credentials; FeishuChannel supports interactive card send + callback (signature verification + URL challenge); Settings → Channels management UI (list, create/edit with dirty-state protection, details with copyable callback URL, test-send); CRUD API (/api/channels) and event callback endpoint (/api/channels/{id}/callback). Shipped early for 2026-04-24 roadshow
Agent Hook System (live in ReAct + DAG runtime) — PreToolUseHook / PostToolUseHook abstraction in src/fim_one/core/hooks/; agents declaring hooks.class_hooks in model_config_json have hooks instantiated and registered per chat session. First consumer FeishuGateHook posts an Approve/Reject card to the linked Feishu group when an agent calls a requires_confirmation=True tool, blocks execution, and resumes or aborts based on verdict
Configurable confirmation gate (inline OR channel) — Every agent gets an Approval section with three routing modes (Auto / Inline only / Channel only), approver-scope selector (initiator / owner / anyone in org), per-tool override, and explicit approval-channel picker. Auto mode gracefully falls back to an inline approval card when no channel is linked. POST /api/confirmations/{id}/respond shares a single decision-recording path with the Feishu webhook
Per-agent task completion notifications — Long-running ReAct or DAG agents can push a summary card to the org’s channel when a task finishes. First consumer of the generic outbound notification pattern
Hook Approval Playground — Channels details sheet has a “Test Approval Flow” action that exercises the full production path (genuine ConfirmationRequest row, real Feishu callback, status transitions) — same code path a production hook uses
Contributor-friendly i18n CI fallback — .github/workflows/i18n-sync.yml translates EN → ZH/JA/KO/DE/FR on master after PR merge and auto-commits with [skip ci]; contributors no longer need LLM_API_KEY locally. Pre-commit locale-edit guard refuses manual edits to generated locale files (ALLOW_LOCALE_EDIT=1 override for legitimate translation fixes). End-to-end verified via smoke-test push
Exa integration docs — Dedicated Integrations section with a first-class Exa page covering the full Exa search surface (neural / fast / deep-reasoning / instant), filtering, content retrieval, and three tuned presets
Xinchuang (信创) database support — Database Connector now lists KingbaseES (人大金仓), HighGo (瀚高), and DM8 (达梦) alongside PostgreSQL/MySQL. PG-compatible drivers reuse asyncpg; DM8 uses dmPython. scripts/test_xinchuang_dbs.py verifies live connectivity from the CLI
Channels + Hook System architecture docs — docs/architecture/hook-system.mdx explains the three hook points and walks through FeishuGateHook end-to-end; existing architecture pages cross-link; README lists Messaging Channels as a first-class capability
Hardening — Duplicate Feishu callback clicks produce a replacement card instead of double-deciding; concurrent callback clicks resolved via conditional UPDATE ... WHERE status='pending' rowcount check; pending approvals auto-expire after CHANNEL_CONFIRMATION_TTL_MINUTES (default 24h) via background sweeper; Settings → Channels respects org role (members see read-only UI); parallel tool-call aggregator handles providers that reuse index=0 for every delta; session-expiry redirect preserves query string

Geplante Versionen

v0.8.6 — Channel & Hook Polish

Goal: Close loose ends from the v0.8.5 Channel + Hook rollout before the v0.9 production-hardening wave lands. Scope is intentionally narrow — polish, not new capability.

Per-hook config pass-through — class_hooks entries today are bare strings; to override FeishuGateHook.timeout_seconds, poll_interval_seconds, or callback_base_url per-agent, the schema needs to accept {"name": "feishu_gate", "config": {...}} objects that get forwarded as kwargs to the hook factory. Low-risk follow-up; current defaults (120s timeout / 1.5s poll / env-var callback URL) are acceptable in the meantime.
DAG tools_used accuracy — the completion notification card currently derives tools_used from plan.steps[*].tool_hint (the planner’s suggestion), not the real tool names the per-step ReAct loops chose. Plumb the actual chosen tool names out of the DAG executor’s step-completion callback so notification cards reflect what was actually run.
Hook inheritance policy for delegated sub-agents and Workflow AGENT nodes — today CallAgentTool children and Workflow AGENT nodes create fresh ReActAgents that do not inherit the parent’s hook registry, so a sensitive tool call reached via delegation silently bypasses feishu_gate. Decide and document: do child agents inherit (default-secure, prevents gate bypass) or isolate (lets teams delegate non-approval-gated work to a child agent)? Eval Center runs stay opt-out by design (automation cannot block on human approval).
Playground follow-up suggestions restored, opt-in per agent — the v0.8.5 post-processing refactor moved suggestion generation into a fire-and-forget background task and dropped the post_processing / suggestions SSE events, so the chip row beneath an answer never appeared. Suggestions now stream inline between done and end and are gated by a new per-agent suggest_followups toggle (default off) — task-style agents stay quiet, conversational agents that explicitly opt in pay the one fast-model round-trip and get the chips back.

Everything here is additive and behind existing abstractions — no schema changes, no breaking API changes, safe to land piecewise between v0.8.5 and v0.9.

v0.9 — Observability + Production Hardening

Ziel: Produktionsreife Operationen, Debugging und Monitoring. Führt das Hook System ein — eine deterministische Durchsetzungsschicht, die unterhalb von Agent-Anweisungen sitzt und vom LLM nicht überschrieben werden kann.

Connector-Autorisierungsebenen (Datenebenen-RBAC)

Bestehende RBAC-Kontrollen steuern die Ressourcensichtbarkeit (wer einen Connector sehen kann), nicht die Autorisierung zur Ausführungszeit (was der Aufrufer damit tun kann). Wenn ein Administrator eine DB/API mit hochprivilegierten Anmeldedaten verbindet, erben alle Organisationsmitglieder, die diesen Connector nutzen, den Blast-Radius des Administrators. Dieser Abschnitt schließt die Lücke über drei unterschiedliche upstream-Funktionsebenen:

Ebene 1 — DB-Modus (vollständiger Admin + Basic/Legacy): Der Administrator stellt eine einzelne DB-Anmeldedaten bereit (Root oder ein Least-Privilege-Service-Konto), da die meisten Legacy-Systeme keine benutzergesteuerten DB-Konten ausstellen können. Die Durchsetzung erfolgt oberhalb der Verbindung über ConnectorScopeGuard — einen PreToolUse-Hook, der query- / execute-Aufrufe pro Aufruferidentität filtert. Funktionen: Blockierung destruktiver Verben (DROP, TRUNCATE, unscoped DELETE/UPDATE); Allow/Deny-Listen auf Tabellenebene; Spaltenredaktion basierend auf pii=true-Semantikannotationen; automatische Injektion von Scope-Prädikaten (z. B. AND dept_id = :caller_dept an jeden SELECT anhängen). Die Konfiguration ist ein scope_rules-JSON-Feld auf dem Connector mit rollenbasiertem Matching; Standard ist Deny-if-ambiguous.
Ebene 2 — Open-API-Modus (API-Schlüssel pro Benutzer): Der bevorzugte Weg. Benutzer bringen ihren eigenen API-Schlüssel mit (in v0.8 ausgeliefert — connector_credentials + allow_fallback=false); die native Autorisierung des upstream-Systems erzwingt den Scope auf natürliche Weise. Verbleibende Arbeit: Pro-Connector-Admin-UI zur Anforderung von benutzergesteuerten Anmeldedaten (Admin-Fallback global deaktivieren) und ein Health-Dashboard, das zeigt, welche Organisationsmitglieder ihren eigenen Schlüssel noch nicht gebunden haben.
Ebene 3 — Mittlere Ebene (Login-Ticket-Austausch): Für Frontend/Backend-Split-Systeme ohne benutzergesteuerten API-Schlüssel. Rufen Sie den Login-Endpoint des Systems mit vom Benutzer bereitgestellten Anmeldedaten auf, cachen Sie das zurückgegebene kurzlebige Ticket, aktualisieren Sie es automatisch bei Ablauf. Neuer LoginTicketCredential-Typ neben API-Schlüssel / OAuth; Connector-Spezifikation deklariert auth_type: login_ticket mit login_endpoint, ticket_field und refresh_strategy. Die Adapter-Schicht konvertiert das Ticket pro Anfrage in den ausgehenden Auth-Header.
Ebenenübergreifende Nachverfolgbarkeit: Jeder Tool-Aufruf wird mit caller_user_id, effective_credential_source (Benutzer / Admin-Fallback / Ticket) und scope_rules_applied in ConnectorCallLog gekennzeichnet, damit Ops nach einem Incident die Frage „wer hat tatsächlich was als wen ausgeführt” beantworten können.

Channel → Integration-Promotion

Heute ist Feishu als Channel + Connector-Paar verdrahtet — Lieferpipe und API-Oberfläche. Enterprise-Rollouts benötigen eine dritte Rolle: Integration (die gleiche Third-Party-Bindung bietet auch SSO und Org-Graph-Synchronisierung). Landung in v0.9, da die bestehende Feishu-Bindung bereits 3 der 4 erforderlichen Facetten abdeckt, und die Identity-Story entsperrt die Tier-2-Autorisierung oben (Benutzer können ihr eigenes Upstream-Token bei der Anmeldung abrufen, anstatt API-Schlüssel manuell bereitzustellen).

Channel → Integration-Modell: Förderung von Channel von “nur ausgehende Lieferung” zu einem ThirdPartyIntegration-Parent mit drei optionalen Sub-Funktionen — (a) Delivery (vorhandenes Channel-Verhalten: Karten senden, Bestätigungen gating); (b) Login (OIDC / Custom SSO; “Mit Feishu anmelden” ergibt sowohl eine FIM-Sitzung als auch das Upstream-Plattform-Token); (c) Org-Graph-Synchronisierung (Upstream-Abteilungen/Mitglieder in FIM-Org-Struktur spiegeln; geplant oder Webhook-gesteuert). Administratoren schalten jede Funktion pro Bindung um.
Feishu SSO als Integration-Funktion: Wiederverwendung der bestehenden Feishu-App-Bindung (app_id/secret bereits auf dem Channel), um “Mit Feishu anmelden” jedem Benutzer bereitzustellen, dessen Feishu-Mandant an eine Org gebunden ist. Das bei der Anmeldung erhaltene Token wird zur Standard-Anmeldeinformation des Benutzers für den Feishu Connector — Entfernung der “Hol dir deinen eigenen API-Schlüssel”-Reibung für Tier-2-Durchsetzung.
Org-Graph-Synchronisierung (Feishu → FIM org): Feishu-Abteilungen + Mitglieder in FIM abrufen; Feishu-Mandantenadministrator / Abteilungsleiter / Mitgliederrollen auf FIM-Besitzer/Administrator/Mitglied abbilden. Grundlage für WeCom und DingTalk als nächstes, und für Kingdee / Yonyou / SAP ERP-OA-Adapter in v1.0.

Öffentliche API (Phase 2)

Phase 1 (ausgeliefert): API-Schlüssel-Authentifizierungsmiddleware, Scope-Unterstützung, kuratierte OpenAPI-Spezifikation, Mintlify API Reference mit interaktivem Playground.

Observability & Agent-Laufzeit

Prompt Cache + Reasoning Follow-ups (aus Batch A MVPs)

Diese Elemente vervollständigen teilweise in Batch A ausgelieferte Arbeiten (Conversation Recovery, System Prompt Registry, Thinking Blocks) und erweitern die Cache-Abdeckung auf die verbleibenden Provider-Familien.

Gemini Context Cache Adapter: Google Gemini verwendet eine separate REST API (POST /v1beta/cachedContents → gibt cacheName zurück → referenziert via cachedContent: "<cacheName>" in nachfolgenden generateContent Aufrufen) anstelle des Inline-cache_control Markers, den Anthropic verwendet. Erfordert einen GeminiCacheAdapter mit Lifecycle-Management (Präfix vorregistrieren → cacheName referenzieren → TTL-bewusste Invalidierung), integriert in den Gemini-Pfad von OpenAICompatibleLLM oder LiteLLMs Gemini-Provider. Read-Rabatt ~0,25×, minimales Präfix 32.768 Token (Gemini Pro) / 4.096 (Flash) — primäre Nutznießer sind Long-Context KB/RAG-Agenten und dokumentenintensive Workflows.
Prompt Registry-Erweiterung auf Planner / Verifier / Domain Classifier: erweitern Sie das PromptRegistry + DYNAMIC_BOUNDARY Muster von ReAct auf die verbleibenden LLM-Aufruforte: DAGPlanner, PlanAnalyzer, StepVerifier, CitationVerifier, DomainClassifier, ExecutionModeRouter, CompactUtils. Derzeit werden diese Prompts bei jedem Aufruf von Grund auf neu erstellt. Niedrigere Häufigkeit als ReAct, daher niedrigerer ROI, aber vervollständigt die Cache-Story.
Pro-Agent cache_ttl Konfiguration: Ermöglichen Sie Agent-Besitzern, zwischen ephemeral (5 Min., Standard, günstiger Schreibzugriff) und extended (1 Stunde, 2× Schreibkosten, aber besser für Batch- / geplante Workflows) zu wählen. Oberflächlich als Feld auf dem Agent-Modell und übergeben via cache_control: {"type": "...", "ttl": "..."} wo unterstützt.
DAG-Schritt-Level Checkpoint-Tabelle: Das aktuelle A1 Conversation Recovery MVP persistiert synthetische tool_results und gecachte SSE-Events, aber der DAG-Zwischenschritt-Status lebt nur im Speicher. Neue dag_execution_step Tabelle erstellt Snapshots von jedem Schritt’s tool_calls, Ergebnissen und Artifact-Referenzen, damit eine Mid-DAG-Unterbrechung ohne Neuausführung abgeschlossener Schritte fortgesetzt werden kann. Gekoppelt mit dem Frontend useSseResume Hook für End-to-End-Kontinuität.
Dedizierte tool_call_id Spalte auf Message: Heute lebt tool_call_id in metadata_ JSON, was json_extract(...) / ::json->> Lookups für Orphan-Tool-Use-Abfragen erfordert. Für High-Traffic-Deployments würde eine First-Class-indizierte Spalte der Recovery-Pass O(log n) statt O(n) Scans ermöglichen. Niedrige Priorität bis die Skalierung es verlangt.
Mid-Stream Thinking Token Rekonstruktion: Die aktuelle Resume-Granularität ist „nächstes vollständiges SSE-Event” — wenn der Drop innerhalb eines Thinking-Delta auftritt, startet der Client vom folgenden Event neu. Token-Level-Resume würde eine Neuemission der gepufferten Token des laufenden Thinking-Blocks erfordern. Nischeverbesserung; nur verfolgungswert, wenn Benutzer Thinking-UX-Jitter bei instabilen Verbindungen melden.
API Relay Cache-Honesty Probe: Background-Tool (Admin-ausgelöst oder geplant), das zwei identische Claude-Anfragen durch jeden konfigurierten Relay sendet, vergleicht tatsächlich abgerechnete Input vs cache_read_input_tokens, und kennzeichnet Relays, die den cache_control Marker entfernen oder den 0,10× Rabatt nicht weitergeben. Oberflächlich als Workspace-Level „Relay Health” Signal — nützliches Operationstool für Unternehmen, die durch chinesische API-Proxies routen.

Zuverlässigkeits-Nachverfolgungen (Agent Core Priority Matrix)

Der Großteil der Agent Core-Integrations-Roadmap (Phase 0–3, I.1–I.16) wurde in v0.8.2 und v0.8.3 ausgeliefert. Die folgenden Elemente stammen aus der parallelen Priority Matrix, die noch Aufmerksamkeit benötigen.

Content replacement state persistence (streaming invariant #2): “once seen, fate frozen” — Nachrichteninhalte, die bereits an den Client gesendet wurden, dürfen nicht rückwirkend über resume / reload mutiert werden. Erfordert ein Replacement Ledger, das mit dem SSE cursor von A1 abgestimmt ist. Blockiert durch das Verständnis tatsächlicher benutzer-sichtbarer Glitches; keine aktiven Beschwerden.
Attachment context router: intelligentere Attachment-Injection mit alreadySurfaced + readFileState Deduplizierung, aggregiertes Attachment-Budget und Liveness-Checks. Verhindert das erneute Versenden desselben 50KB PDF-Extrakts bei jedem Turn. Koppelt mit Workspace-Datei-Offloading (bereits im v0.9-Plan).
Side query workers (prompt worker pool): dedizierte leichtgewichtige Pools für Recall / Classification / Summary / Session-Memory-Abfragen, damit sie nicht mit dem Haupt-Agent LLM-Aufruf um das Rate-Limit-Budget konkurrieren. Voraussetzung: Prompt Registry-Erweiterung (oben).

Ökosystem & Skalierung

Geplante Jobs + Event-getriggerte Agenten (Loop): cron-ähnliche Hintergrund-Task-Trigger; scheduled_jobs + job_runs DB-Tabellen; APScheduler-Integration; Job-CRUD-API + Job-Verlauf-UI; Ergebnis-Benachrichtigung über Message-Push-Konnektoren. Der Umfang umfasst sowohl zeitgesteuerte (cron) als auch ereignisgesteuerte (Webhook-Eingang) Muster — ein Agent, der asynchron im Hintergrund läuft, IST der asynchrone Sub-Agent-Anwendungsfall für Hub-Modus.
Vorgefertigte Lösungsvorlagen (Market Seed Content): 8 einsatzbereite vertikale Lösungen, die bei der Erstbenutzerregistrierung auf dem Markt veröffentlicht werden — Financial Audit, Contract Review, Data Reporting, IT Helpdesk, HR Onboarding, Sales Assistant, Content Writer, Meeting Summary. Jede bündelt einen Agenten + Skill mit chinesischen SOPs; idempotent über ensure_solution_templates() bootstrapped, auf Market-Org für sofortige Marketplace-Verfügbarkeit veröffentlicht (in v0.8.1 ausgeliefert)
DB-Schema Advanced Builder: KI-gesteuerte Schema-Management-Agent für großskalige Datenbanken — strategische Tabellenannotation (musterbasiert, SQL-Ausführungs-informiert), Bulk-Sichtbarkeitsverwaltung nach Domain-Präfix, iterative mehrrundige Annotation für 1K–7K+ Tabellenbereitstellungen; ergänzt bestehenden Batch-Annotationsjob mit Selektivität und geschäftskontextgesteuertem Reasoning
Resource Fork (Package Phase 1 — Voraussetzung für v1.0 Package System): Alle Pro-Ressource-Fork-Endpunkte implementiert — MCP Server, Skill, Agent, Konnector, Workflow. KB-Fork entfernt (inhärent benutzerlokal). Jeder POST /api/{type}/{id}/fork erstellt eine benutzergesteuerte tiefe Kopie mit forked_from Lineage-Tracking. (in v0.8.1 abgeschlossen)
Pro-Workflow credential_policy Override (owner | caller | auto): Die fünf Workflow-Trigger-Pfade codieren derzeit hartcodiert, wessen Identität Konnector-Aktionen ausführt — Webhook/Cron übergeben wf.user_id (Besitzer), manuell/Batch übergeben current_user.id (Aufrufer). Dies entspricht der häufigen Erwartung „Automationen laufen als Besitzer, manuelle Läufe als Aufrufer”, aber Enterprise-Bereitstellungen müssen gelegentlich pro Workflow überschreiben (z. B. ein Cron, der unter dem aktuellen On-Call-Ingenieur laufen muss, oder eine gemeinsame Vorlage, die die Anmeldedaten des Besitzers auch bei manuellem Lauf ausleihen muss). Fügen Sie ein credential_policy-Feld auf dem Workflow-Modell hinzu, das in der UI neben Schedule / API-Key-Konfiguration angezeigt wird und das Standard-trigger_source → identity-Mapping überschreibt. Voraussetzung: trigger_source Observability oben.

Auswirkung: Führen Sie FIM One mit Zuversicht in großem Maßstab aus. Vier Säulen: Trace Layer (sehen Sie, was passiert ist), Hook System (erzwingen Sie, was passieren muss), Agent Workspace (persistente Dateiverwaltung + Handoff), IM Channel (Agenten leben dort, wo Benutzer arbeiten). Vorgefertigte Lösungsvorlagen eliminieren Kaltstart; Dashboard Enhancement zeigt operative Gesundheit. Die Lücke zwischen „Anweisungen, denen der Agent möglicherweise folgt” und „Garantien, die das System erzwingt” wird geschlossen — der Unterschied zwischen einer Demo und einem produktiven Enterprise-Tool.

v1.0 — Hot-Plug + Embeddable

Ziel: Connector-Hinzufügung ohne Neustart, Paket-Ökosystem und eingebettete Bereitstellung. Auswirkungen: Unternehmen stellen FIM One von Null bis Multi-System-Orchestrierung in Tagen bereit. Das Package-System schafft ein Creator-Ökosystem — Lösungsautoren veröffentlichen zusammengesetzte Bundles (Skill + Agents + Connectors + KBs + Workflows), Unternehmen installieren mit einem Klick, Creator verdienen durch Adoption. Install/Fork-Dualität deckt sowohl „As-is verwenden” als auch „Von Template anpassen” Anwendungsfälle in einem einzigen Mechanismus ab.

Gefrorene Funktionen (Ausgeliefert, nur Wartung)

Gemäß der Orthogonality Strategy sind diese Funktionen ausgeliefert und funktionsfähig, erhalten aber keine neuen Funktionen (nur Fehlerbehebungen):

Funktion	Version	Grund für Einfrieren
ReAct Agent	v0.1, v0.9	Modelle haben jetzt natives Tool Calling. Mid-Loop Self-Reflection (v0.9) verhindert Zieldrift in langen Ketten. Qualität der Tool-Observation-Synthese verbessert (8K Zeichen, konfigurierbar über `REACT_TOOL_OBS_TRUNCATION`)
DAG Planning / Re-Planning	v0.1, v0.5, v0.7.5	Modell-Reasoning-Fähigkeiten verbessern sich; Dekomposition wird Single-Shot. Per-Step-Verifikation in v0.7.5 ausgeliefert (`DAG_STEP_VERIFICATION`). Gehärtet: Cascade-Fehlerausbreitung, Verifier-Status-Fix, Planner-Tool-Beschreibungen, vollständiger Replan-Verlauf, Whitelist-basierter Tool-Cache. 14 Engine-Konstanten als ENV-Variablen verfügbar — keine weiteren Planning-Primitive geplant
Memory (Window, Summary, Compact)	v0.2, v0.5	Context Windows wachsen (200K+); weniger Bedarf für externe Memory-Verwaltung
RAG Pipeline	v0.5	Provider bauen Retrieval nativ ein (OpenAI file_search, Gemini Search Grounding)
Grounded Generation	v0.5	Modelle verbessern sich bei Zitaten; 5-stufige Pipeline bietet abnehmenden Mehrwert
ContextGuard / Pinned Messages	v0.5	Wird wie vorhanden ausgeliefert; keine neuen Funktionen

Überlegungen (Auf unbestimmte Zeit aufgeschoben)

Gemäß der Orthogonality Strategy würden diese hohen Aufwand erfordern und Absorptionsrisiken bergen:

Feature	Grund für Aufschub
Multi-Agent Orchestration (tiefe Hierarchien)	Provider bauen nativ (OpenAI Swarm, Google A2A und ähnliche Multi-Agent-Angebote). FIM One’s CallAgentTool deckt den One-Level-Delegationsfall ab; ereignisgesteuerte Hintergrund-Agenten werden durch Scheduled Jobs in v0.9 abgedeckt
Agent Self-modifying Skills (Procedural Memory)	Agenten aktualisieren ihre eigene `skill.md` während der Ausführung — hohe Komplexität, Sicherheits-/Audit-Oberfläche. Hängt davon ab, dass Agent Skill System (v0.8) zuerst ausgeliefert wird. Neu bewerten, wenn Enterprise-Kunden selbstverbessernde Agenten explizit anfordern
~~Agent Workspace (Tool Output File Offloading)~~	Zu v0.9 befördert. Der Wert liegt in selektivem Lesen, nicht in Kontextkapazität — Framework-übergreifende Validierung bestätigt. Ursprüngliche Aufschublogik („200K+ Fenster reduzieren Dringlichkeit”) war falsch.
Cross-Session Long-Term Memory	Context Windows wachsen schnell (200K–2M); Provider fügen eingebautes Memory hinzu (OpenAI memory, Gemini context caching); hohe Implementierungskosten vs. sinkender Differenzierungswert. Neu bewerten, wenn Enterprise-Kunden es explizit anfordern
Memory Lifecycle (TTL, Quotas)	Hängt von Cross-Session Memory ab; zusammen aufgeschoben
Active Context Compression Tool (Agent-ausgelöst)	Explizit eingefroren mit ContextGuard (v0.5). Context Windows bei 200K+ reduzieren den Wert. Wird nicht überprüft, es sei denn, Kontextkosten werden zu einer großen Enterprise-Beschwerde
Browser Automation / Computer Use	Hohe Wartungskosten (DOM-Änderungen, Anti-Bot, Sandboxing). Industrie konvergiert auf Computer Use Mode (Anthropic, OpenAI Operator, Google Mariner) und MCP Browser Tools (Puppeteer/Playwright MCP). Über MCP Integration konsumieren, nicht selbst bauen. Neu bewerten, wenn stabiler Computer Use MCP Standard entsteht
Web Push Notifications	Browser-natives Push über Service Worker + VAPID. Überlappt mit IM Channel Integration (v0.8), die Enterprise-bevorzugte Kanäle abdeckt (Lark/Slack/WeCom/Email). IM Push hat höheren Enterprise-Wert; Web Push ist ein Nice-to-Have für Portal-only-Benutzer. Neu bewerten nach IM Channel Auslieferung — wenn Benutzer Browser-Benachrichtigungen über IM-Abdeckung hinaus anfordern
Multi-user Workflow Collaborative Editing	Echtzeit-Co-Editing desselben Workflow-Blueprints (Figma/Notion-Stil) mit Cursor-Awareness, Konfliktauflösung und Pro-Node-Lock. Hohe Implementierungskosten (CRDT / OT, Presence-Infrastruktur), unklar Enterprise-Nachfrage gegenüber heutigem „ein Editor gleichzeitig + Version Diff” Modell. Neu bewerten, wenn mehrere Enterprises explizit gemeinsames Live-Editing anfordern
Per-Node Workflow Execution Permissions (RBAC on Run)	Feinkörnige Autorisierung innerhalb eines einzelnen Workflow-Laufs — z.B. „Node X erfordert Rolle `finance_approver` zur Ausführung”. Heute findet Autorisierung auf Workflow-Ebene statt (wer kann auslösen) und auf Connector-Ebene (wessen Credential läuft); Per-Node RBAC fügt eine dritte Achse mit erheblicher Komplexität und keiner aktiven Kundenanfrage hinzu
Cross-org Workflow Sharing mit Live Updates	Workflow aus einer anderen Org abonnieren und Upstream-Updates ohne Neu-Forking erhalten. Heute Abonnement = Fork (Snapshot), daher brechen Upstream-Änderungen nie aus. Live Updates würden Upstream-kompatible Schema-Evolution + Konfliktauflösung erfordern; hohe Wartungskosten. Neu bewerten, wenn Enterprises „gemeinsame Workflows über Tochtergesellschaften” anfordern

Wie Versionen mit Modi ausgerichtet sind

Version	Standalone	Copilot	Hub	Notizen
v0.1–v0.3	Funktioniert	Noch nicht	Noch nicht	Nur Portal, einzelner Benutzer
v0.4	Funktioniert	Noch nicht	Noch nicht	Multi-Konversation, Agent-Verwaltung
v0.5	Funktioniert	Noch nicht	Noch nicht	Wissensdatenbank + RAG
v0.6	Funktioniert	Möglich	Möglich	Konnektoren verfügbar; Copilot/Hub möglich mit manueller Verdrahtung
v0.7	Funktioniert	Bereit	Bereit	Admin-Plattform; Multi-Tenant-Authentifizierung; produktionsbereit
v0.8	Funktioniert	Bereit	Optimiert	RBAC + Audit-Log pro System; einfacheres Onboarding
v0.9	Funktioniert	Bereit	Produktion	Observability, Performance, Härtung
v1.0	Funktioniert	Optimiert	Enterprise	Paketsystem, Creator-Programm, Hot-Plug, einbettbares Widget, Webhooks, Batch

Ressourcenallokation (v0.8–v1.0)

Die Orthogonalitätsstrategie bestimmt, wohin die Anstrengungen fließen:

Kategorie	Allokation	Versionen	Grund
Connector-Plattform (v0.6+)	50%	Laufend	Kernunterscheidungsmerkmal; kein Absorptionsrisiko
Enterprise-Funktionen (RBAC, Audit, Sicherheit, Observability)	30%	v0.8–v1.0	Langweilig, aber dauerhaft; Produktionsanforderung. Agent Trace Layer ist kommerzieller Anker
Agent-Intelligenz (Skill-System, geplante Agenten)	15%	v0.8–v0.9	指令+工具+技能 Differenzierungsgeschichte; niedriges Absorptionsrisiko — Frameworks validieren Muster, aber Enterprise-SOPs sind kundenspezifisch
v0.1–v0.5 Wartung	5%	Laufend	Nur Fehlerbehebungen; keine neuen Funktionen

Metrik-gesteuerte Meilensteine

Der Erfolg wird gemessen durch:

Metrik	v0.7 Ziel	v0.8 Ziel	v1.0 Ziel
Bereitgestellte Konnektoren	5	20+	100+
Enterprise-Kunden	1–2	5–10	20+
Durchschnittliche Konnektor-Einrichtungszeit	2 Wochen	2 Tage	5 Minuten (Hot-Plug)
Token-Effizienz (DAG vs ReAct-only)	30% Reduktion	40% Reduktion	50% Reduktion
Uptime SLA	99,5%	99,9%	99,95%
Support-Ticket-Themen	Integration, Einrichtung	Benutzerdefinierte Konnektor-Logik	Hot-Plug, Skalierung

Offene Fragen / TBD

Marketplace-Moderation: Wie können Community-Pakete und einzelne Ressourcen validiert werden? Automatisierte Scans auf Credential-Leaks in Paket-Konfigurationen? (v1.0)
Token-Ökonomie: Wie können Multi-User-, Multi-Agent-Szenarien bepreist werden? (v1.0)
Paket-Versionierung: Breaking Changes in installierten Paketen — automatisches Upgrade mit Migrationsskripten oder manuelle Genehmigung pro Update? Auflösung des Dependency-Diamond-Problems? (v1.0)
Paket-Preisgestaltung: Kostenlose vs. kostenpflichtige Stufen, Provisionsätze für Creator Program, Integration von Zahlungsanbietern? (v1.0)
Paket-Credential-UX: Credential-Erfassung bei Installation — Wizard-ähnlich Schritt für Schritt oder aufgeschobenes Setup? Credential-Sharing über Pakete hinweg, die denselben Connector-Typ verwenden? (v1.0)
Telemetry-Opt-out: Wie können Datenschutzpräferenzen respektiert werden? (v0.8)
Connector-Versionierung: Wie können Breaking Changes in Connector-APIs verwaltet werden? (v0.8)
Rate Limiting: Pro-User-Workflow-Rate-Limiting implementiert (Sliding Window 10 Runs/Min, 3 gleichzeitig). Pro-Connector und Pro-Agent-Rate-Limiting TBD (v0.9)
Connector-Autorisierungsstufen-Auswahl: Wie kann ein Admin herausfinden, welche Stufe für ein bestimmtes Upstream-System gilt? Auto-Probe (versuche Pro-User-API-Key → Fallback auf Login-Ticket → Fallback auf Shared-DB) vs. explizite Deklaration in der Connector-Spezifikation? Wie drücken wir “dieser Connector unterstützt Stufe 2, aber der Admin hat sich für Stufe 1 entschieden” in der UI aus, ohne nicht-technische Admins zu verwirren? (v0.9)
Integration vs. Connector-Dualität: Wenn eine Feishu-Bindung gleichzeitig ein SSO-Provider UND eine API-Call-Oberfläche ist, wie präsentieren wir sie in den Einstellungen? Ein Objekt mit drei Umschaltern oder drei separate Bindungen, die eine Credential teilen? Auswirkungen auf die Deinstallations-Semantik (tötet das Widerrufen von SSO den Connector?) (v0.9)

Änderungsprotokoll

Documentation Index

​Produktvision

​Bekannte Probleme

​Ausgelieferte Versionen

​v0.1 (2026-02-22) — MVP: ReAct + DAG Planner

​v0.2 (2026-02-24) — Multi-Modell + Speicher

​v0.3 (2026-02-25) — Web Tools + MCP

​v0.4 (2026-02-25) — Multi-Turn + Agenten

​v0.5 (2026-02-28) — Full RAG + Grounded Gen

​v0.6 (2026-03-01) — Connector-Plattform

​v0.7 (2026-03-06) — Admin-Plattform + Multi-Mandant

​v0.7.x (2026-03-07 bis 2026-03-12) — Stabilität + Verbesserungen

​v0.8 (2026-03-20) — Connector Deklarative Konfiguration + Progressive Offenlegung

​v0.8.1 (2026-03-29) — Progressive Disclosure Maturity + ReAct Hardening

​v0.8.2 (2026-04-10) — Agent Core Hardening + Vision Documents

​v0.8.3 (2026-04-16) — Universal Document Conversion + Agent Core Phase 3

​v0.8.4 (2026-04-17) — Prompt Cache + Reasoning Correctness

​v0.8.5 (2026-04-23) — Channel Integration + Hook System + Contributor i18n

​Geplante Versionen

​v0.8.6 — Channel & Hook Polish

​v0.9 — Observability + Production Hardening

​Connector-Autorisierungsebenen (Datenebenen-RBAC)

​Channel → Integration-Promotion

​Öffentliche API (Phase 2)

​Observability & Agent-Laufzeit

​Prompt Cache + Reasoning Follow-ups (aus Batch A MVPs)

​Zuverlässigkeits-Nachverfolgungen (Agent Core Priority Matrix)

​Ökosystem & Skalierung

​v1.0 — Hot-Plug + Embeddable

​Gefrorene Funktionen (Ausgeliefert, nur Wartung)

​Überlegungen (Auf unbestimmte Zeit aufgeschoben)

​Wie Versionen mit Modi ausgerichtet sind

​Ressourcenallokation (v0.8–v1.0)

​Metrik-gesteuerte Meilensteine

​Offene Fragen / TBD