SaaS26 avril 2026

Coordination multi-agents : les 14 modes d'échec et comment les éviter

Le papier Cemri 2025 a recensé 14 modes d'échec récurrents dans les systèmes multi-agents. Diagnostic, et trois familles d'architecture pour s'en prémunir.

Équipe SwoftPôle veille IA & systèmes agentiques

Réseau de plusieurs agents en coordination avec points de défaillance identifiés

Faire collaborer plusieurs agents IA sur un même processus métier est un problème ouvert. Les frameworks se multiplient (LangGraph, CrewAI, AutoGen, MetaGPT), les approches divergent, et la production révèle des modes d'échec qui ne sont pas tous documentés. En mars 2025, un papier de Cemri et al. publié sur arXiv a fait référence en répertoriant 14 modes d'échec récurrents dans les systèmes multi-agents.

Cet article résume ces modes d'échec, propose une lecture des trois familles d'architecture du marché, et explique pourquoi l'alignement Conway est la réponse la plus robuste.

Les 14 modes d'échec en synthèse

Cascade d'erreurs : une erreur amont se propage et s'amplifie en aval, sans que personne ne la corrige.
Perte de contexte : un agent ne sait pas ce qu'un autre agent a déjà fait, et reproduit du travail.
Négociation infinie : deux agents itèrent sans converger, brûlant des tokens sans résultat.
Hallucination collective : un fait inventé par un agent est repris comme acquis par les autres.
Contradiction de rôles : deux agents prennent des décisions contradictoires sur le même objet.
Dérive d'objectif : le système oublie le but initial et se concentre sur des sous-objectifs locaux.
Blocage par dépendance circulaire : A attend B, B attend C, C attend A, le système se fige.
Attribution floue : on ne sait pas quel agent a pris quelle décision, l'audit est impossible.
Surcharge d'orchestration : l'orchestrateur central devient le goulot et ralentit tout.
Contention sur ressource partagée : plusieurs agents écrivent le même registre sans coordination.
Délégation excessive : un agent délègue tout aux autres et ne fait plus rien lui-même.
Sycophantie : les agents se valident mutuellement sans esprit critique, biais collectif.
Dérive sémantique : le sens d'une notion change progressivement entre agents, incohérence in fine.
Effondrement de capacité : sous certains volumes, le système perd toute coordination utile.

Tous ces modes ne sont pas équiprobables. Cascade d'erreurs, perte de contexte et négociation infinie sont les trois plus fréquents en production. Hallucination collective et contradiction de rôles sont les plus dangereux quand ils surviennent.

Trois familles d'architecture, trois compromis

Sur le marché 2026, on peut classer les frameworks multi-agents en trois familles selon leur topologie de coordination.

Topologie en étoile : un orchestrateur central

Un agent superviseur pilote des agents spécialisés. C'est le modèle de LangGraph en mode supervisor et de la plupart des implémentations CrewAI. Avantage : prévisibilité forte, l'orchestrateur a la vision d'ensemble. Inconvénient : scalabilité limitée, point de défaillance unique, surcharge d'orchestration au-delà de cinq ou six agents.

Topologie en graphe : agents pairs qui s'envoient des messages

Tous les agents sont au même niveau, ils communiquent par messages selon des règles déclarées. AutoGen et certaines configurations CrewAI fonctionnent ainsi. Avantage : flexibilité, pas de goulot. Inconvénient : très exposé aux modes d'échec recensés par Cemri, en particulier la dérive sémantique et la négociation infinie.

Topologie alignée Conway : structure organisationnelle exécutable

Les agents sont structurés selon les frontières organisationnelles ou domaines du système. La communication passe par événements typés persistés. C'est l'architecture Swoft, et c'est aussi celle vers laquelle convergent les systèmes neurosymboliques d'entreprise comme FAOS. Avantages : alignement métier fort, gouvernance claire, modes d'échec drastiquement réduits. Inconvénient : nécessite une modélisation préalable du domaine, ce que ne demandent pas les frameworks plus libres.

Pourquoi Conway est la réponse la plus robuste

L'alignement Conway adresse structurellement la majorité des 14 modes d'échec. La cascade d'erreurs est bornée par les bounded contexts disjoints : une erreur dans un domaine ne contamine pas les autres. La perte de contexte est éliminée par la mémoire partagée de l'Event Store. La contradiction de rôles est mécaniquement impossible parce que les bounded contexts sont disjoints. La dérive d'objectif est captée par les approval gates injectées dans les sagas.

Trois conditions techniques rendent l'alignement Conway opérationnel. Première condition : un métamodèle qui décrit les bounded contexts et leurs relations. Deuxième condition : une communication par événements typés et persistés, jamais par texte libre. Troisième condition : une orchestration des workflows longs par sagas event-sourcées, avec compensation automatique en cas d'échec partiel.

Sujets abordés

Multi-agents
Conway
Coordination
Cemri
Architecture IA

À approfondir dans le glossaire

Coordination multi-agents
Coordination de systèmes multi-agents IA

Traduction technologique

Comment Swoft traduit cet enjeu en logiciel

Chez Swoft, la coordination multi-agents repose sur trois principes alignés sur la loi de Conway. Voici comment ils se traduisent en garanties opérationnelles.

01
Bounded contexts disjoints
Chaque agent est rattaché à un bounded context du métamodèle DDD. Les contextes sont disjoints par construction : aucune contradiction de rôles possible, aucune contamination d'erreur entre domaines.
02
Communication par événements typés
Les agents ne se parlent jamais en texte libre. Toute communication entre agents passe par des événements typés persistés dans l'Event Store. La dérive sémantique et la négociation infinie deviennent structurellement impossibles.
03
Sagas event-sourcées avec compensation
Les workflows longs sont orchestrés par des sagas event-sourcées. En cas d'échec partiel, la compensation automatique restaure un état cohérent. La cascade d'erreurs est bornée, le système ne se fige jamais sur un blocage circulaire.

Voir la page SaaS Discuter de votre projet

Continuer la lecture — SaaS

Les 5 degrés d'autonomie d'un agent IA, et pourquoi 90 % des projets s'arrêtent au degré 2
26 avril 2026
Les 5 degrés d'autonomie d'un agent IA, et pourquoi 90 % des projets s'arrêtent au degré 2
Le cadre Sheridan adapté au business 2026 : cinq paliers du simple assistant au système entièrement autonome. Diagnostic, exigences architecturales et calendrier réaliste pour passer un palier.
Vrais agents IA contre automatisation : les sept critères qui distinguent les deux en 2026
26 avril 2026
Vrais agents IA contre automatisation : les sept critères qui distinguent les deux en 2026
Zapier, n8n et Make habillent leurs workflows en agents IA depuis 2024. Voici les sept critères techniques qui séparent un vrai agent autonome d'une automatisation déguisée.
Architecture neurosymbolique : la sortie du compromis perroquet contre solveur
26 avril 2026
Architecture neurosymbolique : la sortie du compromis perroquet contre solveur
Comment combiner LLM et raisonnement formel pour bâtir des agents IA fiables sur des domaines spécialisés. Lecture de la taxonomie de Kautz, des cas AlphaGeometry, Plato-3, FAOS.

Les 14 modes d'échec en synthèse

Trois familles d'architecture, trois compromis

Topologie en étoile : un orchestrateur central

Topologie en graphe : agents pairs qui s'envoient des messages

Topologie alignée Conway : structure organisationnelle exécutable

Pourquoi Conway est la réponse la plus robuste

Sujets abordés

À approfondir dans le glossaire

Comment Swoft traduit cet enjeu en logiciel

Bounded contexts disjoints

Communication par événements typés

Sagas event-sourcées avec compensation

Continuer la lecture — SaaS

Les 5 degrés d'autonomie d'un agent IA, et pourquoi 90 % des projets s'arrêtent au degré 2

Vrais agents IA contre automatisation : les sept critères qui distinguent les deux en 2026

Architecture neurosymbolique : la sortie du compromis perroquet contre solveur