← Retour aux travaux— Systèmes d'IA — 2025 · 02

Agents autopoïétiques — plateformes multi-agents qui se maintiennent elles-mêmes

En développement· 2024–present

Autopoïèse est un mot que j'emprunte avec soin. Humberto Maturana l'a forgé pour décrire les systèmes vivants qui produisent continuellement les composants nécessaires au maintien de leur propre organisation. Je ne prétends pas avoir bâti des machines vivantes. Ce que j'ai bâti, c'est une famille de plateformes multi-agents où le travail du système est de maintenir le système en marche — s'observer, détecter la dégradation, redistribuer les ressources, reconstruire les pièces cassées et continuer à tourner malgré tout. Les agents ne sont pas des scripts qui font une chose. Ce sont des organes qui participent à une boucle fermée. La plupart des projets multi-agents que je vois traitent les agents comme des LLM avec des outils — une mince enveloppe autour d'un appel d'API avec quelques gabarits d'invite collés dessus. Ce modèle casse à l'échelle. L'essaim soit s'effondre dans l'incohérence la première fois que deux agents touchent au même état, soit devient si averse au risque que rien n'arrive. La famille de plateformes que je bâtis est structurée différemment. Chacune est une réponse différente à la même question : que faut-il pour bâtir un essaim qui ne s'effondre pas sous son propre poids ? La réponse a plusieurs éléments qui reviennent à travers chaque projet. D'abord, les services ne se parlent pas directement ; chaque message passe par un bus d'événements, parce que les appels HTTP directs entre composants créent le genre de couplage serré qui transforme un échec partiel en échec total. Ensuite, les agents ne sont pas dignes de confiance par défaut — chaque écriture est gardée par des verrous distribués et des jetons de clôture, chaque action produit des artefacts de preuve (diffs git, empreintes de commit, journaux de tests), et aucune affirmation ne compte comme réelle sans artefact. Troisièmement, les systèmes implémentent une séparation à double LLM : un agent lit le contenu externe brut en quarantaine et ne produit que des données structurées assainies, un autre agent détient les privilèges d'écriture mais ne touche jamais à l'entrée brute. Ce motif est la seule défense contre l'injection d'invite qui fonctionne réellement à l'échelle. Quatrièmement, l'état vit en dehors du clavardage : le texte de clavardage n'est jamais la vérité, seuls le système de billets, l'historique git et les journaux CI sont la vérité. Cinquièmement, le système a un système immunitaire — une couche de garde-fous qui filtre la toxicité et valide les charges utiles, un gardien qui balaie les verrous périmés, un moteur de siège qui injecte du chaos contrôlé pour tester l'antifragilité, un disjoncteur qui plafonne la dépense quotidienne avant que l'essaim ne puisse ruiner son propre budget. Dans ce domaine, j'ai bâti des systèmes organisés comme des organismes biologiques — cerveau, muscles, hippocampe, économie, chacun tournant comme son propre service conteneurisé avec des responsabilités spécifiques — coordonnés par Redis Pub/Sub sans appels directs entre organes. J'ai bâti des essaims d'audit forensique organisés en escouades spécialisées où chaque escouade possède une verticale (cœur, assurance qualité, infrastructure, sécurité, documentation, optimisation) et les escouades s'auditent entre elles. J'ai bâti des pipelines d'extraction de connaissances qui parcourent des bases de code et en extraient des motifs réutilisables en utilisant des heuristiques d'inspiration biologique : optimisation par colonies de fourmis pour la sélection de chemin, ordonnancement selon le nombre d'or pour l'allocation des ressources, évaluation par vitalité biologique pour le triage. J'ai bâti des systèmes autopoïétiques de découverte économique conçus pour partir de zéro connaissance et découvrir par eux-mêmes comment générer de la valeur — pas programmés pour être autopoïétiques, conçus pour survivre, avec l'autopoïèse émergeant comme conséquence. J'ai bâti des analyseurs de sécurité méta-cognitifs qui surveillent continuellement un arbre de fichiers avec des modèles locaux, diffusant l'état en direct vers un tableau de bord via WebSocket, avec un testeur de stress intégré qui injecte du chaos de fichiers pendant dix minutes d'affilée pour qu'on puisse regarder le moteur faire face en temps réel. J'ai bâti des piles de recherche entièrement locales sur Apple Silicon qui imposent une séparation stricte des préoccupations à travers la passerelle de modèles, l'entrepôt vectoriel, la couche de recherche et le plan d'observabilité, avec chaque affirmation étiquetée par un agent auditeur comme confirmée, inférée ou hypothétique. J'ai bâti des hubs d'orchestration sur Azure et GCP qui unifient plusieurs assistants de codage et moteurs de flux derrière un unique point d'entrée avec verrouillage distribué, état à concurrence optimiste, flux d'événements et files d'attente partagées. Ils ne résolvent pas tous le même problème. Une topologie d'organisme biologique est la bonne forme pour un système qui doit s'observer indéfiniment. Une topologie d'escouades est la bonne forme pour un système qui doit auditer quelque chose de complexe et produire une sortie lisible. Un pipeline d'extraction de connaissances est la bonne forme quand l'objectif est de récolter des motifs en volume et de les alimenter en aval. Une pile entièrement locale est la bonne forme quand la souveraineté compte plus que l'échelle. La famille est large parce que les problèmes sont larges. Ce que les plateformes partagent, c'est la discipline sous-jacente : chacune est observable de bout en bout, échoue sans danger par construction, et traite son propre budget de ressources comme une contrainte de conception de premier plan.

multi-agentautopoiesisdual-LLMRedis Pub/SubDockerMCPPythonFastAPI

— Vous construisez quelque chose qui touche ce problème ?Entamer la conversation