Système multi-agents Magnetic-One : l’avenir de l’automatisation en entreprise selon Microsoft

Les Agents IA sont la grande tendance du moment en matière d’IA générative. Nous y consacrerons une partie lors du prochain Briefing Calipia qui commence à la fin du mois (il est encore temps de vous y inscrire !). Les chercheurs de Microsoft viennent de dévoiler Magnetic-One, un système d’IA multi-agents conçu pour aider les entreprises à automatiser des tâches complexes habituellement effectuées par des humains. Open source et destiné aux environnements web et basés sur des fichiers, Magnetic-One marque une étape importante dans l’évolution des IA agentiques, apportant des capacités avancées de dialogue et d’exécution de tâches en plusieurs étapes.

Magnetic-One fonctionne par le biais de différents agents spécialisés coordonnés par un “Orchestrateur”, qui gère et attribue les sous-tâches en fonction des compétences de chacun :

  • WebSurfer : Navigue et interagit avec le web pour extraire des informations.
  • FileSurfer : Manipule les fichiers et les données locales.
  • Coder : Écrit et modifie du code.
  • ComputerTerminal : Exécute des commandes en ligne de commande.

L’Orchestrateur est le chef d’orchestre de ce système ; il attribue les sous-tâches aux agents appropriés, surveille l’avancement, et ajuste les stratégies en fonction des obstacles ou erreurs rencontrés.

Selon Microsoft, l’avancée de Magnetic-One réside dans sa capacité à aller au-delà des simples suggestions. Là où l’IA générative peut suggérer des idées ou résumer des informations, Magnetic-One, grâce à sa structure agentique, peut passer à l’action en automatisant des tâches comme la commande de services ou la recherche approfondie. Par exemple, là où une IA traditionnelle se contenterait de proposer des options de dîner, Magnetic-One pourrait non seulement les sélectionner, mais aussi finaliser une commande en ligne et planifier la livraison.

Afin de s’assurer que ces systèmes agentiques soient à la fois efficaces et sécurisés, Microsoft a mis en place AutoGenBench, un outil d’évaluation qui permet de tester les agents dans divers scénarios, en isolant les étapes et en répétant les opérations pour minimiser les risques d’actions imprévues. AutoGenBench offre également la possibilité de créer de nouveaux benchmarks pour évaluer la performance et la fiabilité de Magnetic-One dans des tâches multi-étapes, nécessitant notamment l’utilisation de navigateurs web ou d’outils de planification.

Pour le moment, Microsoft a testé Magnetic-One sur trois benchmarks : GAIA, AssistantBench et WebArena, chacun posant des défis nécessitant des étapes planifiées et des outils de navigation ou d’interaction web. Ces tests visent à garantir que Magnetic-One sera un outil sûr et performant dans des contextes variés et potentiellement sensibles.

Un projet open source

Microsoft a lancé Magnetic-One en open source, avec pour objectif de rassembler une communauté de développeurs et de chercheurs autour de cette technologie émergente. Bien que le système démontre des capacités polyvalentes, Microsoft reconnaît que l’IA est encore loin d’un niveau de performance égalant celle des humains et reste sujette à des erreurs.

Pour les développeurs et chercheurs intéressés, Magnetic-One est accessible en téléchargement ici.

Un commentaire

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur la façon dont les données de vos commentaires sont traitées.