Microsoft déploie Mu, un SLM natif dans Windows 11

Publié le 24 juin 2025 par Stephane Sabbague Poster un commentaire

La guerre de l’IA ne se livre plus uniquement dans le cloud. Elle s’infiltre désormais jusqu’au cœur du système d’exploitation. Avec le lancement de Mu, son tout nouveau modèle de langage léger embarqué dans Windows 11, Microsoft donne une nouvelle dimension à l’IA embarquée en l’intégrant directement dans une brique aussi fondamentale que l’application “Paramètres”.

Retour sur les ambitions de Microsoft : l’ère des Copilot+ PCs

Tout a commencé avec les Copilot+ PCs, une nouvelle catégorie de machines annoncée en grande pompe en 2024. L’élément distinctif ? Un NPU (Neural Processing Unit) capable de dépasser les 40 TOPS, pensé pour exécuter des tâches d’IA de manière locale, sans recourir systématiquement au cloud. L’objectif ? Réduire la latence, améliorer la confidentialité et soulager le CPU/GPU.

Pour accompagner ces nouveaux PC, Microsoft a introduit Phi-Silica, un SLM (Small Language Model) exécuté localement pour enrichir les applications maison et tierces. Mais aujourd’hui, Microsoft passe à l’étape suivante avec un modèle encore plus intégré : Mu.

Mu : un agent IA discret… mais techniquement costaud

Mu, c’est le nom d’un SLM (Small Language Model) de 330 millions de paramètres, intégré directement dans Windows 11. Il alimente un nouvel agent intelligent capable de comprendre les requêtes en langage naturel des utilisateurs dans l’application Paramètres. Une évolution qui peut sembler anodine pour l’utilisateur lambda… mais qui soulève des enjeux techniques passionnants pour les DSI et architectes systèmes.

Voici ce qu’il faut retenir techniquement du modèle Mu :

Architecture encoder-decoder, contrairement à la majorité des LLM modernes qui optent pour le decoder-only.
Ce choix permet 47 % de latence en moins pour le premier token, et une vitesse de décodage 4,7 fois plus rapide qu’un modèle équivalent en decoder-only.
Poids optimisé via le partage de poids entre certains composants (weight sharing), réduisant la complexité sans impacter significativement les performances.
Entraîné sur Azure ML avec des GPU NVIDIA A100, preuve que même les petits modèles nécessitent une infrastructure conséquente en phase de formation.
Performance proche d’un Phi-3.5-mini fine-tuné, bien que Mu soit dix fois plus petit. Une prouesse de compression algorithmique qui n’est pas sans rappeler les méthodes distillation + quantization + sparsity.

Mu est spécialement optimisé pour le traitement local, avec un débit de plus de 100 tokens par seconde sur NPU, ce qui le rend compatible avec les nouvelles architectures Copilot+.

Ce type de modèle local change la donne. En ajoutant une couche de compréhension du langage naturel directement dans l’application Paramètres, Microsoft modifie l’expérience utilisateur au niveau du système, sans latence ni connexion obligatoire à Internet.

Les implications sont nombreuses :

Sécurité & confidentialité : les requêtes restent localisées. Pour les environnements sensibles ou réglementés (secteur public, défense, finance), cela pourrait être une option intéressante à explorer.
Scalabilité : aucun besoin d’API externe ou de licence GPT payante. L’IA devient une ressource système embarquée.
Standardisation : ce modèle pourrait inspirer des interfaces en langage naturel dans d’autres couches du système (CMD, PowerShell, GPO, voire BIOS/UEFI ?).
Performance & UX : la fluidité d’un modèle local, combinée à une interface familière, permet d’imaginer des scénarios de support automatisé plus pertinents pour les utilisateurs finaux.

Cependant, tout n’est pas parfait. L’agent actuel n’analyse pas les requêtes fragmentaires, préférant laisser le moteur de recherche lexical gérer les cas ambigus ou partiels. Une limitation compréhensible, mais qui rappelle que l’intelligence reste contextuelle.

Vers une généralisation des SLM embarqués ?

Microsoft ne cache plus son ambition : faire de Windows une plateforme IA-native, au même titre qu’Android ou iOS l’ont été pour le mobile. En intégrant des modèles comme Mu, la firme de Redmond franchit un cap : l’IA ne se résume plus à une barre latérale avec Copilot, elle devient une infrastructure intégrée au système d’exploitation.

Ce n’est probablement que le début. On peut aisément imaginer des SLM spécialisés pour la gestion réseau, les performances système, ou la cybersécurité locale. D’autant que la multiplication des NPU sur le matériel grand public ouvre la voie à une infinité de cas d’usage, sans surcharge cloud.

Calipia : le blog

Opinions et Actualités