Feuille de route

Objectif : Construire un Hub de connecteurs alimenté par l’IA — Autonome (assistant de portail), Copilote (intégré au système hôte), Hub (orchestration centrale inter-systèmes). Principes : Agnostique des fournisseurs (pas de verrouillage des fournisseurs), abstraction minimale, protocole en premier, connecteur en premier (l’intégration est la valeur fondamentale).

Vision du Produit

FIM One est un Hub de Connecteurs IA qui propose trois modes progressifs :

Standalone   → Votre propre assistant IA (Portal)
Copilot      → IA intégrée dans un système hôte (iframe / widget / embed)
Hub          → Orchestration centrale inter-systèmes (Portal / API)

Le mode Hub est le différenciateur clé. Les clients entreprise disposent de systèmes hérités — ERP, CRM, OA, finance, HR — qui doivent communiquer entre eux via l’IA : Stratégie GTM : Land and Expand

Étape	Mode	Ce qui se passe
Land	Copilot	Intégrer dans un système, prouver la valeur dans leur interface utilisateur
Expand	Copilot → Hub	Déployer sur plus de systèmes ; Hub les agrège

Problèmes connus

Bugs tracés qui sont reproductibles en production mais pas encore corrigés. Chaque entrée nomme le symptôme, la zone de surface suspecte et la solution de contournement (le cas échéant). Les éléments passent à une section de version une fois qu’un correctif est défini et planifié.

L’éditeur d’agent affiche un avertissement de modifications non enregistrées sans aucune modification. L’ouverture d’un agent existant via /agents/[id] et le clic immédiat sur le bouton retour déclenchent la boîte de dialogue « Modifications non enregistrées » même si aucun champ n’a été touché. La vérification de modification compare 20+ champs par rapport à la charge utile de l’agent chargée, donc une asymétrie de défaut entre l’initialisation d’état et la comparaison de modification suffit à causer une discordance fantôme — la suspicion actuelle porte sur l’un des champs imbriqués model_config_json / notification / approbation-routage, possiblement à partir de la normalisation undefined vs null vs "". Se reproduit particulièrement sur les agents à portée organisationnelle. Solution de contournement : ignorer la boîte de dialogue (Discard and leave) — aucune perte de données puisque rien n’a réellement changé. Une tentative de correction (cb40c86a) a supprimé un scintillement de badge orphelin connexe sur les sélecteurs de ressources mais n’a pas résolu ce problème.
L’enregistrement d’une modification d’agent peut échouer avec Input should be 'initiator', 'agent_owner' or 'org_members'. Pydantic rejette le champ confirmation_approver_scope à la limite PUT /api/agents/{id} même si chaque valeur stockée dans la base de données est l’un des trois littéraux valides. Suspicion : le cast frontend as "initiator" | "agent_owner" | "org_members" est une promesse au moment de la compilation uniquement, donc une chaîne héritée ou inattendue au moment de l’exécution (possiblement à partir d’un modèle, d’une importation ou d’une migration plus ancienne) peut passer par setConfirmationApproverScope et être renvoyée textuellement. Solution de contournement : resélectionner explicitement une valeur dans la liste déroulante Approbation → Portée de l’approbateur avant d’enregistrer.
L’arrêt et la nouvelle tentative du terrain de jeu affichent des artefacts visuels transitoires qu’une actualisation de page efface toujours. Trois sources de rendu concurrentes — activeConversation.messages (snapshot DB), le flux SSE messages et l’espace réservé optimiste pendingQuery — ne sont pas réduites à un seul état dérivé, donc entre le clic sur « Retry » et l’arrivée de la réponse de l’assistant appairée, l’interface utilisateur peut (a) brièvement afficher la même requête deux fois dans la fenêtre pré-flux, (b) supprimer les bulles utilisateur orphelines antérieures de l’historique de nouvelle tentative tandis que hasLiveMessages est vrai et avant le rechargement de l’instantané, et (c) scintiller dans la fenêtre étroite entre l’événement SSE « done » et l’actualisation selectConversation suivante. Les données ne sont jamais perdues — chaque message utilisateur (y compris les tentatives abandonnées) est conservé dans conversation.messages, porté dans l’appel LLM suivant via normalize_alternating_messages et rendu correctement après actualisation via HistoryTurn.orphanUserContents introduit dans le correctif de rendu 48ba08c6. Pour le contexte, l’interface Web propre de Claude présente une classe analogue de bug — l’arrêt au milieu d’une réponse et l’envoi immédiat d’une requête de suivi crée parfois la requête de suivi comme une branche d’édition sœur de la première requête plutôt que de l’ajouter comme un nouveau tour — c’est donc un problème connu difficile dans les conceptions optimiste-UI + SSE + historique-persisté, pas un défaut spécifique à FIM One. Un correctif approprié nécessite de réduire les trois sources de rendu à un seul état dérivé ; reporté jusqu’à une refonte plus large de la machine d’état du terrain de jeu.

Versions Livrées

v0.1 (2026-02-22) — MVP: ReAct + DAG Planner

ReActAgent avec outils (calculatrice, python_exec, web_search)
DAG Planner (LLM génère des graphes de dépendances)
Portal UI avec streaming + KaTeX

v0.2 (2026-02-24) — Multi-Model + Memory

Retry / rate limiting / usage tracking
Native function calling (no JSON-only parsing)
Multi-model support (fast + main LLM)
Memory: WindowMemory, SummaryMemory
FastAPI backend with SSE streaming

v0.3 (2026-02-25) — Web Tools + MCP

Web tools (web_search, web_fetch) via Jina/Tavily/Brave
File operations tool
MCP client (standard tool integration)
Tool auto-discovery + categories
DAG visualization with click-to-scroll
Code exec in Docker (--network=none)

v0.4 (2026-02-25) — Conversations multi-tours + Agents

Conversations multi-tours (DbMemory)
Interface de repliement des étapes d’outils
Outils de requête HTTP + exécution shell
Gestion des agents (créer, configurer, publier)
Authentification JWT
Mode d’exécution par agent + contrôle de température

v0.5 (2026-02-28) — Full RAG + Grounded Gen

Pipeline RAG complet (embedding + vector store + FTS + RRF + reranker)
Génération ancrée (citations, scores de confiance)
Gestion des documents de la base de connaissances (CRUD, recherche, retry, migration de schéma)
ContextGuard + messages épinglés (gestionnaire de budget de tokens)
Persistance DbMemory + LLM Compact
DAG Re-Planning (jusqu’à 3 rounds)

v0.6 (2026-03-01) — Plateforme de connecteurs

CRUD de connecteur: créer, lire, mettre à jour, supprimer
ConnectorToolAdapter: convertit Connecteur → BaseTool
Identifiants par utilisateur: chiffrement AES-GCM
Portail de confirmation: approbation des opérations d’écriture
Journalisation d’audit: tous les appels d’outils enregistrés
Disjoncteur: dégradation progressive en cas de défaillance
Outils utilitaires: email_send, json_transform, template_render, text_utils
Options d’intégration: Jina, OpenAI, fournisseurs personnalisés

v0.7 (2026-03-06) — Plateforme d’administration + Multi-locataire

Plateforme d’administration : gestion des utilisateurs, basculement des rôles, réinitialisation de mot de passe, activation/désactivation de compte
Inscription sur invitation uniquement : trois modes (ouvert/invitation/désactivé) + CRUD de code d’invitation
Gestion du stockage : utilisation disque par utilisateur, effacement, nettoyage des orphelins
Modération des conversations : liste d’administration/suppression de tous
Déconnexion forcée par utilisateur : révocation de tous les jetons
Tableau de bord de santé API : statistiques système, métriques des connecteurs
Assistant de configuration initiale : création guidée du compte administrateur
Centre personnel : instructions globales par utilisateur, préférence de langue
Authentification JWT : authentification SSE basée sur jetons, propriété de conversation
Serveurs MCP globaux : provisionnés par l’administrateur, chargés dans toutes les sessions
Compatibilité rétroactive : migration automatique registration_enabled → registration_mode

v0.7.x (2026-03-07 to 2026-03-12) — Stabilité + Polissage

Gestion des codes d’invitation
Quotas par utilisateur (application 429)
Journalisation d’audit structurée
Filtrage des mots sensibles
Historique de connexion administrateur
Navigateur de fichiers administrateur
Vues administrateur améliorées (champs model_name, tools, kb_ids)
Déploiement Docker Compose (image unique, volumes nommés)
Détection automatique OAuth depuis window.location
Support de la réflexion étendue / raisonnement (LLM_REASONING_EFFORT, LLM_REASONING_BUDGET_TOKENS) pour OpenAI série o, Gemini 2.5+, Claude
Activation/désactivation par outil administrateur (outils désactivés exclus du chat à l’exécution)
Gestion des serveurs MCP déplacée vers la page Connecteurs
Support de base de données double : SQLite (par défaut sans configuration) + PostgreSQL (production) ; Docker Compose provisionne automatiquement PostgreSQL
Page de documentation de configuration des modèles avec configuration de la réflexion étendue par fournisseur
Protocole SSE v2 : diffusion de réponses en temps réel avec champs delta_reasoning, usage, et événements done/suggestions/title/end séparés ; taille du pool SQLite 5 -> 20
Expansion AI Builder : 7 nouveaux outils de construction (GetSettings, TestConnection, ImportOpenAPI pour connecteurs ; ListConnectors, AddConnector, RemoveConnector, SetModel pour agents), drapeau is_builder sur les agents, actualisation automatique du prompt du constructeur, protection SSRF
Frontend SSE v2 : curseur à point pulsant en continu, snapshots de re-plan DAG sous forme de cartes réductibles, mise en page DAG découplée des états d’étape
Page de documentation du concept AI Builder avec guides de construction de connecteurs et d’agents
Système d’organisation : CRUD complet avec adhésion basée sur les rôles (propriétaire/administrateur/membre), interface de gestion administrateur
Visibilité des ressources à trois niveaux (personnel/org/global) pour les agents, connecteurs, bases de connaissances, serveurs MCP
API Publier/Dépublier pour tous les types de ressources ; délégation de propriétaire pour les agents publiés
Point de terminaison administrateur set-visibility (remplace clone-to-global) ; assistant de requête build_visibility_filter() unifié
Connecteurs de base de données (Phase 1-3) : accès SQL direct à PG/MySQL/Oracle/SQL Server + BD héritées chinoises ; introspection de schéma, annotation IA, exécution de requête en lecture seule, identifiants chiffrés, 3 outils par connecteur (list_tables, describe_table, query)
Centre d’évaluation : évaluation quantitative de la qualité des agents — CRUD d’ensemble de test (prompt + comportement attendu + assertions), exécutions d’éval (exécution parallèle + évaluateur LLM + résultats par cas réussi/échoué/latence/jeton), visionneuse de résultats avec interrogation automatique ; migration r8t0v2x4z567
Trois rôles de modèle (Général/Rapide/Raisonnement) avec isolation de configuration env par niveau ; le modèle rapide n’hérite plus des paramètres du modèle principal
Classe de données StepOutput remplaçant les résultats d’étape en chaîne simple pour les données structurées et la transmission d’artefacts
Cache d’outil pour l’exécution DAG — appels d’outil identiques mis en cache par exécution avec prévention du verrouillage asynchrone stampede (DAG_TOOL_CACHE)
Vérification LLM par étape avec 1 nouvelle tentative en cas d’échec (DAG_STEP_VERIFICATION)
Routage automatique : LLM rapide classe les requêtes comme ReAct ou DAG ; point de terminaison /api/auto ; basculement de mode 3 voies frontend (AUTO_ROUTING)
~~Organisation du marché fantôme + Abonnements aux ressources~~ : Organisation du marché intégré (fantôme, pas d’adhésion automatique) remplace l’organisation de plateforme ; ressources découvertes via navigation sur le marché et explicitement souscrites (modèle pull) ; API de marché pour s’abonner aux ressources partagées ; la publication sur le marché nécessite toujours un examen ; tableau des abonnements aux ressources ; partage de ressources basé sur l’organisation remplaçant la visibilité globale
~~Découverte automatique d’agent et liaison de sous-agent~~ : drapeau discoverable sur les agents ; liste blanche sub_agent_ids ; CallAgentTool pour déléguer des tâches à des agents spécialisés
~~Identifiants du serveur MCP + Remplacement par utilisateur~~ : tableau mcp_server_credentials ; point de terminaison PUT /api/mcp-servers/{id}/my-credentials ; drapeau allow_fallback pour le comportement de secours des identifiants
~~Basculement connecteur/KB~~ : POST /api/connectors/{id}/toggle et POST /api/knowledge-bases/{id}/toggle pour suspendre/reprendre les ressources
~~Conversations KB autonomes~~ : champ kb_ids sur les conversations pour le chat KB direct sans liaison d’agent

v0.8 (2026-03-20) — Configuration déclarative des connecteurs + Divulgation progressive

v0.8.1 (2026-03-29) — Divulgation Progressive de la Maturité + Durcissement ReAct

Divulgation progressive pour les connecteurs de base de données (DatabaseMetaTool), les serveurs MCP (MCPServerMetaTool), et le chargement d’outils à la demande (request_tools meta-tool)
Révision de la qualité du DAG (5 améliorations : mise à niveau du modèle, découverte automatique des compétences, vérificateur de citations, préservation du contenu structuré, routage conscient du domaine)
Escalade du modèle de domaine dans ReAct (les domaines spécialisés s’escaladent automatiquement vers le modèle de raisonnement)
Basculement d’appel de fonction native par modèle (tool_choice_enabled)
Détection de cycle ReAct (prévention déterministe des appels d’outils en double)
Liste de contrôle d’achèvement ReAct (vérification pré-réponse lorsque des outils ont été utilisés)
Phase 1 de la fourche de ressources (points de terminaison de fourche du serveur MCP + compétence avec suivi de la lignée)
Abonnement automatique des dépendances de connexion de flux de travail (résolution récursive des dépendances de sous-flux de travail)
Modèles de solutions préconstruites (8 solutions verticales ensemencées au Marché lors de la première inscription)
Améliorations des notifications d’administration (conscientes du fuseau horaire, commutateur maître, Réponse SMTP)
Disjoncteur de budget de jetons par tour (REACT_MAX_TURN_TOKENS)
Troncature d’outils centralisée, budgétisation dynamique des invites système
Téléchargement de pièces jointes, correction de la soumission de messages en double

v0.8.2 (2026-04-10) — Durcissement du noyau d’agent + Documents avec vision

Phase 0 du noyau d’agent — Prompt compact amélioré au format structuré en 9 sections ; protection des résultats d’outils vides (message descriptif au lieu de (no output)) ; prompt anti-boucle + seuil de détection de cycle abaissé à 2 ; classificateur de domaine + résolution de configuration DB en vol parallélisée (400–1100 ms économisés par requête) ; événement SSE end envoyé immédiatement après la réponse, avec titre/suggestions déplacés aux tâches en arrière-plan
Phase 1 du noyau d’agent (Anti-encombrement du contexte) — Nettoyage basé sur règles MicroCompact des anciens résultats d’outils (conservation des 6 derniers) ; plafond agrégé REACT_TOOL_RESULT_BUDGET=40000 ; compactage réactif au débordement de contexte (auto-compactage à 50% du budget et nouvelle tentative au lieu de crash)
Phase 2 du noyau d’agent (Vitesse) — Présélection d’outils basée sur mots-clés (ignore l’appel LLM sur les correspondances évidentes, 200–500 ms économisés) ; mise en pool de connexions LLM SharedHttpClient ; vérification d’achèvement ignorée pour les réponses >200 tokens ; FallbackLLM enveloppe le primaire+rapide avec basculement automatique sur erreurs 429/503/529/connexion
Traitement intelligent des documents (Vision-Aware) — Gestion adaptative des documents : pages PDF rendues en images via PyMuPDF pour les modèles compatibles vision (GPT-4o, Claude 3/4, Gemini), secours texte uniquement via pdfplumber. Drapeau supports_vision par modèle. Modes via DOCUMENT_PROCESSING_MODE, DOCUMENT_VISION_DPI, DOCUMENT_VISION_MAX_PAGES. Extraction d’images intégrées DOCX/PPTX. Persistance vision multi-tours entre les tours de conversation. Traitement PDF intelligent (pages riches en texte extraient texte + images ; pages numérisées rendues en PNG pleine page). Image sandbox pré-construite (Dockerfile.sandbox) avec packages data-science courants pour exécution de code --network=none
Achèvement de la fourche de ressources — Points de terminaison de fourche Agent / Connecteur / Workflow ajoutés, complétant le suivi de lignée de cinq types (fourche KB supprimée — intrinsèquement locale à l’utilisateur)
Garde-fou d’intégrité de fichier — Règle du prompt système empêche l’agent de substituer des contenus de fichiers non liés lorsqu’un fichier cible est illisible ; les fichiers téléchargés incluent désormais file_id dans le contexte du message pour accès direct read_uploaded_file

v0.8.3 (2026-04-16) — Conversion universelle de documents + Phase 3 du cœur de l’agent

Conversion universelle de documents (convert_to_markdown + OCR) — Outil d’agent intégré enveloppant Microsoft MarkItDown ; convertit PDF, Word, Excel, PowerPoint, HTML, JSON, CSV, XML, ZIP, EPUB, Outlook .msg, images, audio, URLs YouTube en Markdown. LiteLLMOpenAIShim active l’OCR via n’importe quel LLM capable de vision (Claude, Gemini, Bedrock, Azure). Ingestion RAG sensible à la vision avec repli sans régression pour texte uniquement. Variable d’environnement LLM_SUPPORTS_VISION pour refuser
Phase 3 du cœur de l’agent (Durcissement des invariants d’exécution) — Récupération de conversation (réparation automatique de tool_use en suspens) ; carte de travail compacte structurée (WorkCard fusion typée sur les tours de compaction) ; profileur au niveau des tours (REACT_TURN_PROFILE_ENABLED) ; limitation de débit par utilisateur (LLM_RATE_LIMIT_PER_USER) ; message d’assistant avec contenu vide et tool_calls ne sont plus supprimés

v0.8.4 (2026-04-17) — Cache de prompts + Correction du raisonnement

Registre de section de prompts système avec points d’arrêt de cache — PromptRegistry mémoïsée divise les prompts système en préfixe stable + suffixe dynamique ; les fournisseurs compatibles avec le cache (Claude, Bedrock Anthropic, Vertex Claude) reçoivent cache_control: {"type": "ephemeral"} sur le préfixe pour ~60-80% d’économies de tokens d’entrée par tour. Les fournisseurs sans cache reçoivent un seul message concaténé (zéro changement de comportement)
Observabilité du cache de prompts — cache_read_input_tokens et cache_creation_input_tokens suivis via UsageSummary → TurnProfiler → champ done_payload.cache. Ligne de journal turn_cache structurée par tour. Sert également de sonde de vérification d’honnêteté du cache relais
MVP de récupération de conversation — Les lignes tool_result synthétiques persistent après les tours interrompus ; POST /chat/resume rejoue les événements SSE en cache à partir d’un curseur monotone ; hook frontend useSseResume se reconnecte automatiquement avec backoff exponentiel (300ms → 1s → 3s, max 3 tentatives) et indicateur « Reconnexion en cours… »
Persistance des blocs de raisonnement avec signature — reasoning_content + signature Anthropic persistés dans metadata_["thinking"] et rejoués aux tours suivants ; corrige l’erreur HTTP 400 de non-concordance de signature sur les conversations multi-tours Claude 4
Politique de relecture du raisonnement consciente du fournisseur — reasoning_replay_policy() centralisée dans core/prompt/reasoning.py contrôle la sérialisation par famille de fournisseur : Claude rejoue les blocs de raisonnement avec signature ; DeepSeek-R1/Qwen-QwQ/Gemini-thinking/o-series suppriment reasoning_content en sortie (précédemment fui, cassant les caches KV des fournisseurs et violant la documentation API)

v0.8.5 (2026-04-23) — Intégration de canal + Système de hooks + i18n pour contributeurs

Canal Feishu (sous-ensemble Phase 1) — Ressource Channel à portée organisationnelle avec identifiants chiffrés par Fernet ; FeishuChannel supporte l’envoi de cartes interactives + callback (vérification de signature + défi URL) ; UI de gestion Paramètres → Canaux (liste, créer/modifier avec protection d’état modifié, détails avec URL de callback copiable, envoi de test) ; API CRUD (/api/channels) et endpoint de callback d’événement (/api/channels/{id}/callback). Livré en avant-première pour la roadshow du 2026-04-24
Système de hooks d’agent (actif dans les runtimes ReAct + DAG) — Abstraction PreToolUseHook / PostToolUseHook dans src/fim_one/core/hooks/ ; les agents déclarant hooks.class_hooks dans model_config_json ont des hooks instanciés et enregistrés par session de chat. Premier consommateur FeishuGateHook publie une carte Approuver/Rejeter au groupe Feishu lié quand un agent appelle un outil avec requires_confirmation=True, bloque l’exécution, et reprend ou abandonne selon le verdict
Portail de confirmation configurable (en ligne OU canal) — Chaque agent obtient une section Approbation avec trois modes de routage (Auto / En ligne uniquement / Canal uniquement), sélecteur de portée approbateur (initiateur / propriétaire / n’importe qui dans l’org), override par outil, et sélecteur de canal d’approbation explicite. Le mode Auto bascule gracieusement vers une carte d’approbation en ligne quand aucun canal n’est lié. POST /api/confirmations/{id}/respond partage un chemin unique d’enregistrement de décision avec le webhook Feishu
Notifications de fin de tâche par agent — Les agents ReAct ou DAG longue durée peuvent envoyer une carte de synthèse au canal de l’org quand une tâche se termine. Premier consommateur du modèle de notification sortante générique
Playground d’approbation par hook — La feuille de détails des canaux a une action « Tester le flux d’approbation » qui exerce le chemin de production complet (ligne ConfirmationRequest authentique, vrai callback Feishu, transitions d’état) — le même chemin de code qu’un hook de production utilise
Fallback CI i18n convivial pour contributeurs — .github/workflows/i18n-sync.yml traduit EN → ZH/JA/KO/DE/FR sur master après fusion de PR et auto-commit avec [skip ci] ; les contributeurs n’ont plus besoin de LLM_API_KEY localement. Garde de pré-commit refusant les modifications manuelles aux fichiers de locale générés (ALLOW_LOCALE_EDIT=1 override pour les corrections de traduction légitimes). Vérifié de bout en bout via push de test de fumée
Docs d’intégration Exa — Section Intégrations dédiée avec une première page Exa couvrant la surface de recherche Exa complète (neural / fast / deep-reasoning / instant), filtrage, récupération de contenu, et trois présets ajustés
Support de base de données Xinchuang (信创) — Le connecteur de base de données liste maintenant KingbaseES (人大金仓), HighGo (瀚高), et DM8 (达梦) aux côtés de PostgreSQL/MySQL. Les pilotes compatibles PG réutilisent asyncpg ; DM8 utilise dmPython. scripts/test_xinchuang_dbs.py vérifie la connectivité en direct depuis la CLI
Docs d’architecture Canaux + Système de hooks — docs/architecture/hook-system.mdx explique les trois points de hook et parcourt FeishuGateHook de bout en bout ; les pages d’architecture existantes font des renvois croisés ; README liste les canaux de messagerie comme une capacité de première classe
Durcissement — Les clics de callback Feishu dupliqués produisent une carte de remplacement au lieu d’une double décision ; les clics de callback concurrents résolus via vérification de compteur de lignes UPDATE ... WHERE status='pending' conditionnel ; les approbations en attente expirent automatiquement après CHANNEL_CONFIRMATION_TTL_MINUTES (24h par défaut) via balayeur en arrière-plan ; Paramètres → Canaux respecte le rôle org (les membres voient l’UI en lecture seule) ; l’agrégateur d’appels d’outils parallèles gère les fournisseurs qui réutilisent index=0 pour chaque delta ; la redirection d’expiration de session préserve la chaîne de requête

Versions Planifiées

v0.8.6 — Channel & Hook Polish

Goal: Close loose ends from the v0.8.5 Channel + Hook rollout before the v0.9 production-hardening wave lands. Scope is intentionally narrow — polish, not new capability.

Per-hook config pass-through — class_hooks entries today are bare strings; to override FeishuGateHook.timeout_seconds, poll_interval_seconds, or callback_base_url per-agent, the schema needs to accept {"name": "feishu_gate", "config": {...}} objects that get forwarded as kwargs to the hook factory. Low-risk follow-up; current defaults (120s timeout / 1.5s poll / env-var callback URL) are acceptable in the meantime.
DAG tools_used accuracy — the completion notification card currently derives tools_used from plan.steps[*].tool_hint (the planner’s suggestion), not the real tool names the per-step ReAct loops chose. Plumb the actual chosen tool names out of the DAG executor’s step-completion callback so notification cards reflect what was actually run.
Hook inheritance policy for delegated sub-agents and Workflow AGENT nodes — today CallAgentTool children and Workflow AGENT nodes create fresh ReActAgents that do not inherit the parent’s hook registry, so a sensitive tool call reached via delegation silently bypasses feishu_gate. Decide and document: do child agents inherit (default-secure, prevents gate bypass) or isolate (lets teams delegate non-approval-gated work to a child agent)? Eval Center runs stay opt-out by design (automation cannot block on human approval).
Playground follow-up suggestions restored, opt-in per agent — the v0.8.5 post-processing refactor moved suggestion generation into a fire-and-forget background task and dropped the post_processing / suggestions SSE events, so the chip row beneath an answer never appeared. Suggestions now stream inline between done and end and are gated by a new per-agent suggest_followups toggle (default off) — task-style agents stay quiet, conversational agents that explicitly opt in pay the one fast-model round-trip and get the chips back.

Everything here is additive and behind existing abstractions — no schema changes, no breaking API changes, safe to land piecewise between v0.8.5 and v0.9.

v0.9 — Observabilité + Durcissement de la Production

Objectif : Opérations, débogage et surveillance de qualité production. Introduit le Système de Hooks — une couche d’application déterministe qui se situe sous les instructions de l’agent et ne peut pas être contournée par le LLM.

Couches d’autorisation des connecteurs (RBAC au niveau des données)

Les contrôles RBAC existants gèrent la visibilité des ressources (qui peut voir un connecteur), non l’autorisation au moment de l’exécution (ce que l’appelant peut faire via celui-ci). Quand un administrateur configure une BD/API avec une credential haute-privilège, chaque membre de l’organisation utilisant ce connecteur hérite du rayon d’explosion de l’administrateur. Cette sous-section comble l’écart sur trois niveaux de capacité en amont distincts :

Tier 1 — Mode BD (full-admin + basic/legacy) : l’administrateur fournit une seule credential BD (root ou un compte de service least-privileged) car la plupart des systèmes legacy ne peuvent pas émettre de comptes BD par utilisateur. L’application se fait au-dessus de la connexion via ConnectorScopeGuard — un hook PreToolUse qui filtre les appels query / execute par identité d’appelant. Capacités : bloquer les verbes destructeurs (DROP, TRUNCATE, DELETE/UPDATE non-scoped) ; listes allow/deny au niveau table ; redaction de colonne pilotée par annotations sémantiques pii=true ; injection automatique de prédicats de scope (p. ex., ajouter AND dept_id = :caller_dept à chaque SELECT). La config est un champ JSON scope_rules sur le connecteur avec correspondance basée sur les rôles ; par défaut deny-if-ambiguous.
Tier 2 — Mode Open API (clé API par utilisateur) : le chemin préféré. Les utilisateurs apportent leur propre clé API (livrée en v0.8 — connector_credentials + allow_fallback=false) ; l’authz natif du système en amont applique le scope naturellement. Travail restant : UI d’administrateur par connecteur pour exiger des credentials par utilisateur (désactiver le fallback-admin globalement) et un tableau de bord de santé montrant quels membres de l’organisation n’ont pas encore lié leur propre clé.
Tier 3 — Tier intermédiaire (échange de ticket de connexion) : pour les systèmes frontend/backend-split sans clé API scoped-utilisateur. Appeler l’endpoint de connexion du système avec des credentials fournis par l’utilisateur, mettre en cache le ticket courte-durée retourné, auto-refresh à l’expiration. Nouveau type LoginTicketCredential aux côtés de clé API / OAuth ; la spec du connecteur déclare auth_type: login_ticket avec login_endpoint, ticket_field, et refresh_strategy. La couche adaptateur convertit le ticket dans l’en-tête auth sortant par requête.
Auditabilité cross-tier : chaque appel d’outil estampillé avec caller_user_id, effective_credential_source (user / admin-fallback / ticket), et scope_rules_applied dans ConnectorCallLog, afin que les ops puissent répondre « qui a vraiment exécuté quoi en tant que qui » après un incident.

Canal → Promotion d’Intégration

Aujourd’hui, Feishu est câblé en tant que paire Canal + Connecteur — tuyau de livraison et surface API. Les déploiements en entreprise nécessitent un troisième rôle : Intégration (la même liaison tierce fournit également SSO et la synchronisation du graphe organisationnel). Arrivée en v0.9 car la liaison Feishu existante couvre déjà 3 des 4 facettes requises, et l’histoire d’identité déverrouille l’autorisation de niveau 2 ci-dessus (les utilisateurs peuvent obtenir leur propre token en amont à la connexion au lieu de provisionner manuellement les clés API).

Modèle Canal → Intégration : promouvoir Channel de « livraison sortante uniquement » en parent ThirdPartyIntegration avec trois sous-capacités optionnelles — (a) Livraison (comportement Canal existant : envoyer des cartes, valider les confirmations) ; (b) Connexion (OIDC / SSO personnalisé ; « Se connecter avec Feishu » génère à la fois une session FIM et le token de la plateforme en amont) ; (c) Synchronisation du graphe organisationnel (refléter les départements/membres en amont dans la structure organisationnelle FIM ; pilotée par planification ou webhook). Les administrateurs basculent chaque capacité par liaison.
Feishu SSO en tant que capacité d’intégration : réutiliser la liaison d’application Feishu existante (app_id/secret déjà sur le Canal) pour exposer « Se connecter avec Feishu » à chaque utilisateur dont le locataire Feishu est lié à une organisation. Le token obtenu à la connexion devient la credential par défaut de l’utilisateur pour le Connecteur Feishu — supprimant la friction « allez obtenir votre propre clé API » pour l’application de niveau 2.
Synchronisation du graphe organisationnel (Feishu → FIM org) : extraire les départements + membres Feishu dans FIM ; mapper les rôles administrateur de locataire Feishu / chef de département / membre aux rôles propriétaire/administrateur/membre FIM. Fondation pour WeCom et DingTalk ensuite, et pour les adaptateurs Kingdee / Yonyou / SAP ERP-OA en v1.0.

API Public (Phase 2)

Phase 1 (déployée) : middleware d’authentification par clé API, support des portées, spécification OpenAPI curée, référence API Mintlify avec terrain de jeu interactif.

Observabilité et runtime d’agent

Cache de Prompts + Suites de Raisonnement (à partir des MVP de Batch A)

Ces éléments complètent le travail partiellement livré dans Batch A (Récupération de Conversation, Registre de Prompts Système, Blocs de Réflexion) et étendent la couverture du cache aux familles de fournisseurs restantes.

Adaptateur de Cache de Contexte Gemini : Google Gemini utilise une API REST distincte (POST /v1beta/cachedContents → retourne cacheName → référencé via cachedContent: "<cacheName>" dans les appels generateContent suivants) plutôt que le marqueur inline cache_control qu’Anthropic utilise. Nécessite un GeminiCacheAdapter avec gestion du cycle de vie (pré-enregistrement du préfixe → référence cacheName → invalidation consciente du TTL), intégré dans le chemin Gemini de OpenAICompatibleLLM ou du fournisseur Gemini de LiteLLM. Réduction de lecture ~0,25×, préfixe minimum 32 768 tokens (Gemini Pro) / 4 096 (Flash) — les principaux bénéficiaires sont les agents KB/RAG à long contexte et les workflows lourds en documents.
Expansion du registre de prompts vers planificateur / vérificateur / classificateur de domaine : étendre le pattern PromptRegistry + DYNAMIC_BOUNDARY de ReAct aux sites d’appel LLM restants : DAGPlanner, PlanAnalyzer, StepVerifier, CitationVerifier, DomainClassifier, ExecutionModeRouter, CompactUtils. Actuellement, ces éléments reconstruisent les prompts à partir de zéro à chaque invocation. Fréquence inférieure à ReAct, donc ROI inférieur, mais complète l’histoire du cache.
Configuration cache_ttl par agent : permettre aux propriétaires d’agents de choisir entre ephemeral (5 min, par défaut, écriture bon marché) et extended (1 heure, coût d’écriture 2×, mais meilleur pour les workflows batch / planifiés). Exposer comme champ sur le modèle Agent et transmettre via cache_control: {"type": "...", "ttl": "..."} où supporté.
Table de point de contrôle au niveau des étapes DAG : le MVP actuel de Récupération de Conversation A1 persiste les tool_results synthétiques et les événements SSE en cache, mais l’état des étapes intermédiaires DAG vit uniquement en mémoire. La nouvelle table dag_execution_step crée des snapshots de chaque étape tool_calls, résultats et références d’artefacts, de sorte qu’une déconnexion mid-DAG peut reprendre sans réexécuter les étapes complétées. Associée au hook frontend useSseResume pour la continuité de bout en bout.
Colonne tool_call_id dédiée sur Message : aujourd’hui tool_call_id vit dans JSON metadata_, nécessitant des recherches json_extract(...) / ::json->> pour les requêtes d’utilisation d’outils orphelins. Pour les déploiements à fort trafic, une colonne indexée de première classe permettrait à la passe de récupération de s’exécuter en O(log n) au lieu de scans O(n). Priorité basse jusqu’à ce que l’échelle le demande.
Reconstruction de tokens de réflexion en flux : la granularité de reprise actuelle est « prochain événement SSE complet » — si la chute se produit à l’intérieur d’un delta de réflexion, le client redémarre à partir de l’événement suivant. La reprise au niveau des tokens nécessiterait de réémettre les tokens en mémoire tampon du bloc de réflexion en vol. Amélioration de niche ; seulement utile si les utilisateurs signalent une gigue UX de réflexion sur les connexions instables.
Sonde d’honnêteté du cache de relais API : outil de fond (déclenché par administrateur ou planifié) qui envoie deux requêtes Claude identiques via chaque relais configuré, compare les entrées réellement facturées par rapport à cache_read_input_tokens, et signale les relais qui suppriment le marqueur cache_control ou ne transmettent pas la réduction 0,10×. Exposé comme signal « santé du relais » au niveau de l’Espace de Travail — outil opérationnel utile pour les entreprises acheminant via des proxies API chinois.

Suivi de la fiabilité (Matrice de priorités du cœur de l’agent)

La majorité de la base de l’intégration du cœur de l’agent (Phase 0–3, I.1–I.16) a été livrée dans les versions v0.8.2 et v0.8.3. Les éléments ci-dessous proviennent de la matrice de priorités parallèle qui nécessitent encore une attention.

Persistance de l’état de remplacement de contenu (invariant de streaming #2) : « une fois vu, destin figé » — le contenu des messages qui a déjà été émis au client ne doit pas être muté rétroactivement lors de la reprise / rechargement. Nécessite un registre de remplacement aligné avec le curseur SSE de A1. Bloqué par la compréhension des véritables glitches visibles par l’utilisateur ; aucune plainte active.
Routeur de contexte des pièces jointes : injection de pièces jointes plus intelligente avec déduplication alreadySurfaced + readFileState, budget de pièces jointes agrégé et vérifications de vivacité. Empêche le renvoi du même extrait PDF de 50 Ko à chaque tour. S’associe au déchargement des fichiers de l’espace de travail (déjà prévu pour v0.9).
Workers de requête auxiliaire (pool de workers de prompt) : pools légers dédiés pour les requêtes de rappel / classification / résumé / mémoire de session afin qu’elles ne rivalisent pas avec l’appel LLM principal de l’agent pour le budget de limite de débit. Condition préalable : expansion du registre de prompt (ci-dessus).

Écosystème et mise à l’échelle

Tâches planifiées + Agents déclenchés par événements (Loop): déclencheurs de tâches de fond de type cron; tables DB scheduled_jobs + job_runs; intégration APScheduler; API CRUD de tâches + UI d’historique des tâches; notification des résultats via connecteurs de push de messages. La portée couvre à la fois les modèles déclenchés par le temps (cron) et déclenchés par événement (webhook entrant) — un agent s’exécutant de manière asynchrone en arrière-plan EST le cas d’utilisation du sous-agent asynchrone pour le mode Hub.
Modèles de solutions préconfigurées (contenu d’amorçage du marché): 8 solutions verticales prêtes à l’emploi publiées sur le marché lors de l’enregistrement du premier utilisateur — Audit financier, Examen de contrat, Rapports de données, Service d’assistance informatique, Intégration RH, Assistant commercial, Rédacteur de contenu, Résumé de réunion. Chacune regroupe un Agent + Compétence avec procédures opératoires standard chinoises; amorcées de manière idempotente via ensure_solution_templates(), publiées sur l’organisation Market pour une disponibilité immédiate sur la place de marché (livré dans v0.8.1)
Générateur de schéma DB avancé: agent de gestion de schéma piloté par l’IA pour les bases de données à grande échelle — annotation stratégique de table (basée sur les modèles, informée par l’exécution SQL), gestion de visibilité en masse par préfixe de domaine, annotation itérative multi-tours pour les déploiements de 1K–7K+ tables; complète le travail d’annotation par lot existant avec sélectivité et raisonnement contextuel métier
Fork de ressource (phase 1 du package — prérequis pour le système de package v1.0): tous les points de terminaison de fork par ressource implémentés — MCP Server, Compétence, Agent, Connecteur, Workflow. Fork KB supprimé (intrinsèquement local à l’utilisateur). Chaque POST /api/{type}/{id}/fork crée une copie profonde détenue par l’utilisateur avec suivi de lignée forked_from. (complété dans v0.8.1)
Remplacement credential_policy par workflow (owner | caller | auto): les cinq chemins de déclenchement de workflow codent actuellement en dur l’identité qui exécute les actions du connecteur — webhook/cron passent wf.user_id (propriétaire), manuel/lot passent current_user.id (appelant). Cela correspond à l’attente courante « les automations s’exécutent en tant que propriétaire, les exécutions manuelles en tant qu’appelant », mais les déploiements d’entreprise ont parfois besoin de remplacer par workflow (par exemple, un cron qui doit s’exécuter sous l’ingénieur de garde actuel, ou un modèle partagé qui doit emprunter les identifiants du propriétaire même lors d’une exécution manuelle). Ajoutez un champ credential_policy sur le modèle Workflow, exposé dans l’interface utilisateur à côté de la configuration Schedule / API-Key, qui remplace le mappage par défaut trigger_source → identity. Prérequis: observabilité trigger_source ci-dessus.

Impact: exécutez FIM One à l’échelle en toute confiance. Quatre piliers: couche de trace (voir ce qui s’est passé), système de hook (appliquer ce qui doit se produire), espace de travail agent (gestion de fichiers persistante + transfert), canal IM (les agents vivent où les utilisateurs travaillent). Les modèles de solutions préconfigurées éliminent le démarrage à froid; l’amélioration du tableau de bord expose la santé opérationnelle. L’écart entre « les instructions que l’agent pourrait suivre » et « les garanties que le système applique » est fermé — la différence entre une démo et un outil d’entreprise de production.

v1.0 — Hot-Plug + Embeddable

Objectif : Ajout de connecteurs sans redémarrage, écosystème de paquets et livraison intégrée. Impact : Les entreprises déploient FIM One de zéro à l’orchestration multi-système en quelques jours. Le système de paquets crée un écosystème de créateurs — les auteurs de solutions publient des bundles composites (Skill + Agents + Connecteurs + KBs + Workflows), les entreprises installent en un clic, les créateurs gagnent de l’adoption. La dualité install/fork couvre à la fois les cas d’usage « utiliser tel quel » et « personnaliser à partir d’un modèle » dans un seul mécanisme.

Fonctionnalités gelées (livrées, maintenance uniquement)

Selon la Stratégie d’orthogonalité, ces fonctionnalités sont livrées et fonctionnelles mais ne recevront pas de nouvelles capacités (corrections de bugs uniquement) :

Fonctionnalité	Version	Raison du gel
Agent ReAct	v0.1, v0.9	Les modèles disposent désormais d’appels d’outils natifs. L’auto-réflexion en milieu de boucle (v0.9) prévient la dérive d’objectif dans les longues chaînes. La qualité de la synthèse d’observation d’outils s’est améliorée (8K caractères, configurable via `REACT_TOOL_OBS_TRUNCATION`)
Planification DAG / Re-planification	v0.1, v0.5, v0.7.5	Les capacités de raisonnement des modèles s’améliorent ; la décomposition devient mono-coup. La vérification par étape est livrée en v0.7.5 (`DAG_STEP_VERIFICATION`). Renforcée : propagation des défaillances en cascade, correction du statut du vérificateur, descriptions des outils du planificateur, historique complet de replanification, cache d’outils basé sur liste blanche. 14 constantes de moteur exposées en tant que variables ENV — aucune nouvelle primitive de planification prévue
Mémoire (Fenêtre, Résumé, Compact)	v0.2, v0.5	Les fenêtres de contexte augmentent (200K+) ; moins besoin de gestion externe de la mémoire
Pipeline RAG	v0.5	Les fournisseurs construisent la récupération nativement (file_search OpenAI, Gemini Search Grounding)
Génération ancrée	v0.5	Les modèles s’améliorent dans les citations ; le pipeline à 5 étapes ajoute une valeur décroissante
ContextGuard / Messages épinglés	v0.5	Livraison en l’état ; aucune nouvelle fonctionnalité

À considérer (Reporté indéfiniment)

Selon la Stratégie d’Orthogonalité, ces éléments représenteraient un effort élevé et feraient face à un risque d’absorption :

Fonctionnalité	Raison du report
Orchestration Multi-Agent (hiérarchies profondes)	Les fournisseurs construisent nativement (OpenAI Swarm, Google A2A, et offres multi-agent similaires). Le CallAgentTool de FIM One couvre le cas de délégation à un niveau ; les agents d’arrière-plan déclenchés par événement sont couverts par Scheduled Jobs en v0.9
Compétences Auto-modifiantes d’Agent (Mémoire Procédurale)	Les agents mettant à jour leur propre `skill.md` pendant l’exécution — complexité élevée, surface de sécurité/audit. Dépend de la livraison du Système de Compétences d’Agent (v0.8) en premier. Réévaluer si les clients entreprise demandent explicitement des agents auto-améliorants
~~Espace de Travail d’Agent (Déchargement de Fichiers de Sortie d’Outil)~~	Promu à v0.9. La valeur est la lecture sélective, non la capacité de contexte — validation inter-frameworks confirmée. Le raisonnement de report original (« les fenêtres 200K+ réduisent l’urgence ») était incorrect.
Mémoire Long-Terme Inter-Session	Les fenêtres de contexte croissent rapidement (200K–2M) ; les fournisseurs ajoutent la mémoire intégrée (mémoire OpenAI, mise en cache de contexte Gemini) ; coût d’implémentation élevé par rapport à la valeur de différenciation décroissante. Réévaluer quand les clients entreprise le demandent explicitement
Cycle de Vie de la Mémoire (TTL, quotas)	Dépend de la mémoire inter-session ; reporté ensemble
Outil de Compression de Contexte Actif (déclenché par agent)	Explicitement gelé avec ContextGuard (v0.5). Les fenêtres de contexte à 200K+ réduisent la valeur. Ne sera pas revisité sauf si les coûts de contexte deviennent une plainte majeure de l’entreprise
Automatisation de Navigateur / Utilisation d’Ordinateur	Coût de maintenance élevé (changements DOM, anti-bot, sandboxing). L’industrie converge vers le mode Computer Use (Anthropic, OpenAI Operator, Google Mariner) et les outils de navigateur MCP (Puppeteer/Playwright MCP). Consommer via l’intégration MCP, ne pas auto-construire. Réévaluer quand une norme MCP Computer Use stable émerge
Notifications Web Push	Push natif du navigateur via Service Worker + VAPID. Chevauche l’Intégration de Canal IM (v0.8) qui couvre les canaux préférés de l’entreprise (Lark/Slack/WeCom/Email). Le push IM a une valeur entreprise plus élevée ; Web Push est un plus pour les utilisateurs Portal uniquement. Réévaluer après la livraison du canal IM — si les utilisateurs demandent des notifications de navigateur au-delà de la couverture IM
Édition collaborative multi-utilisateur de flux de travail	Co-édition en temps réel du même blueprint de flux de travail (style Figma/Notion) avec conscience du curseur, résolution de conflits, et verrous par nœud. Coût d’implémentation élevé (CRDT / OT, infrastructure de présence), demande entreprise peu claire par rapport au modèle actuel « un éditeur à la fois + diff de version ». Réévaluer si plusieurs entreprises demandent spécifiquement l’édition partagée en direct
Permissions d’exécution de flux de travail par nœud (RBAC à l’exécution)	Autorisation fine-grained à l’intérieur d’une seule exécution de flux de travail — par ex. « le nœud X nécessite le rôle `finance_approver` pour s’exécuter ». Aujourd’hui l’autorisation se fait au niveau du flux de travail (qui peut déclencher) et au niveau du connecteur (dont les identifiants exécutent) ; RBAC par nœud ajoute un troisième axe avec complexité matérielle et aucune demande client active
Partage de flux de travail inter-org avec mises à jour en direct	S’abonner à un flux de travail d’une autre org et recevoir les mises à jour en amont sans re-forker. Aujourd’hui s’abonner = forker (snapshot), donc les changements en amont cassants ne se propagent jamais. Les mises à jour en direct nécessiteraient l’évolution de schéma compatible en amont + résolution de conflits ; coût de maintenance élevé. Réévaluer si les entreprises demandent « flux de travail partagés entre filiales »

Comment les versions s’alignent avec les modes

Version	Autonome	Copilot	Hub	Notes
v0.1–v0.3	Fonctionnel	Pas encore	Pas encore	Portail uniquement, utilisateur unique
v0.4	Fonctionnel	Pas encore	Pas encore	Multi-conversation, gestion d’agent
v0.5	Fonctionnel	Pas encore	Pas encore	Base de connaissances + RAG
v0.6	Fonctionnel	Possible	Possible	Connecteurs disponibles ; Copilot/Hub possible avec câblage manuel
v0.7	Fonctionnel	Prêt	Prêt	Plateforme d’administration ; authentification multi-locataire ; prêt pour la production
v0.8	Fonctionnel	Prêt	Optimisé	RBAC + journal d’audit par système ; intégration plus facile
v0.9	Fonctionnel	Prêt	Production	Observabilité, performance, renforcement
v1.0	Fonctionnel	Optimisé	Entreprise	Système de paquets, programme créateur, hot-plug, widget intégrable, webhooks, batch

Allocation des ressources (v0.8–v1.0)

La Stratégie d’Orthogonalité façonne l’orientation des efforts :

Catégorie	Allocation	Versions	Raison
Plateforme de connecteurs (v0.6+)	50%	Continu	Différenciation centrale ; aucun risque d’absorption
Fonctionnalités Entreprise (RBAC, audit, sécurité, observabilité)	30%	v0.8–v1.0	Ennuyeux mais durable ; exigence de production. La couche Agent Trace est l’ancrage commercial
Intelligence des agents (Système de compétences, agents planifiés)	15%	v0.8–v0.9	Histoire de différenciation instructions+outils+compétences ; risque d’absorption faible — les frameworks valident les modèles, mais les procédures d’entreprise sont spécifiques aux clients
Maintenance v0.1–v0.5	5%	Continu	Corrections de bugs uniquement ; aucune nouvelle fonctionnalité

Jalons pilotés par les métriques

Le succès est mesuré par :

Métrique	Cible v0.7	Cible v0.8	Cible v1.0
Connecteurs déployés	5	20+	100+
Clients entreprise	1–2	5–10	20+
Temps de configuration moyen des connecteurs	2 semaines	2 jours	5 minutes (hot-plug)
Efficacité des tokens (DAG vs ReAct uniquement)	Réduction de 30 %	Réduction de 40 %	Réduction de 50 %
SLA de disponibilité	99,5 %	99,9 %	99,95 %
Thèmes des tickets de support	Intégration, configuration	Logique personnalisée des connecteurs	Hot-plug, mise à l’échelle

Questions ouvertes / À déterminer

Modération de la marketplace : Comment valider les packages communautaires et les ressources individuelles ? Analyse automatisée des fuites de credentials dans les configurations de packages ? (v1.0)
Économie des tokens : Comment tarifier les scénarios multi-utilisateurs et multi-agents ? (v1.0)
Versioning des packages : Changements cassants dans les packages installés — mise à niveau automatique avec scripts de migration, ou approbation manuelle par mise à jour ? Résolution du problème du diamant de dépendance ? (v1.0)
Tarification des packages : Niveaux gratuits vs payants, taux de commission pour le Creator Program, intégration du fournisseur de paiement ? (v1.0)
UX des credentials de package : Collecte de credentials au moment de l’installation — assistant étape par étape ou configuration différée ? Partage de credentials entre packages utilisant le même type de connecteur ? (v1.0)
Opt-out de télémétrie : Comment respecter les préférences de confidentialité ? (v0.8)
Versioning des connecteurs : Comment gérer les changements cassants dans les APIs des connecteurs ? (v0.8)
Rate limiting : Rate limiting par utilisateur pour les workflows implémenté (fenêtre glissante 10 exécutions/min, 3 concurrentes). Rate limiting par connecteur et par agent à déterminer (v0.9)
Sélection du niveau d’autorisation du connecteur : comment un administrateur découvre-t-il quel niveau s’applique à un système en amont donné ? Auto-détection (essayer clé API par utilisateur → revenir à login-ticket → revenir à shared-DB) vs. déclaration explicite dans la spec du connecteur ? Comment exprimer « ce connecteur supporte le Tier 2 mais l’administrateur a choisi d’opérer en Tier 1 » dans l’interface sans confondre les administrateurs non-techniques ? (v0.9)
Dualité Intégration vs Connecteur : quand une liaison Feishu est simultanément un fournisseur SSO ET une surface d’appels API, comment la présenter dans Paramètres ? Un objet avec trois bascules, ou trois liaisons séparées partageant une credential ? Implications pour la sémantique de désinstallation (révoquer SSO tue-t-il le Connecteur ?) (v0.9)

Feuille de route

Journal des modifications

Documentation Index

​Vision du Produit

​Problèmes connus

​Versions Livrées

​v0.1 (2026-02-22) — MVP: ReAct + DAG Planner

​v0.2 (2026-02-24) — Multi-Model + Memory

​v0.3 (2026-02-25) — Web Tools + MCP

​v0.4 (2026-02-25) — Conversations multi-tours + Agents

​v0.5 (2026-02-28) — Full RAG + Grounded Gen

​v0.6 (2026-03-01) — Plateforme de connecteurs

​v0.7 (2026-03-06) — Plateforme d’administration + Multi-locataire

​v0.7.x (2026-03-07 to 2026-03-12) — Stabilité + Polissage

​v0.8 (2026-03-20) — Configuration déclarative des connecteurs + Divulgation progressive

​v0.8.1 (2026-03-29) — Divulgation Progressive de la Maturité + Durcissement ReAct

​v0.8.2 (2026-04-10) — Durcissement du noyau d’agent + Documents avec vision

​v0.8.3 (2026-04-16) — Conversion universelle de documents + Phase 3 du cœur de l’agent

​v0.8.4 (2026-04-17) — Cache de prompts + Correction du raisonnement

​v0.8.5 (2026-04-23) — Intégration de canal + Système de hooks + i18n pour contributeurs

​Versions Planifiées

​v0.8.6 — Channel & Hook Polish

​v0.9 — Observabilité + Durcissement de la Production

​Couches d’autorisation des connecteurs (RBAC au niveau des données)

​Canal → Promotion d’Intégration

​API Public (Phase 2)

​Observabilité et runtime d’agent

​Cache de Prompts + Suites de Raisonnement (à partir des MVP de Batch A)

​Suivi de la fiabilité (Matrice de priorités du cœur de l’agent)

​Écosystème et mise à l’échelle

​v1.0 — Hot-Plug + Embeddable

​Fonctionnalités gelées (livrées, maintenance uniquement)

​À considérer (Reporté indéfiniment)

​Comment les versions s’alignent avec les modes

​Allocation des ressources (v0.8–v1.0)

​Jalons pilotés par les métriques

​Questions ouvertes / À déterminer